楼主: 可人4
782 26

[量化金融] 投资者对跨主题财务披露的反应:一个应用程序 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.1643
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-6-10 02:19:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Investor Reaction to Financial Disclosures Across Topics: An Application
  of Latent Dirichlet Allocation》
---
作者:
Stefan Feuerriegel, Nicolas Pr\\\"ollochs
---
最新提交年份:
2018
---
英文摘要:
  This paper provides a holistic study of how stock prices vary in their response to financial disclosures across different topics. Thereby, we specifically shed light into the extensive amount of filings for which no a priori categorization of their content exists. For this purpose, we utilize an approach from data mining - namely, latent Dirichlet allocation - as a means of topic modeling. This technique facilitates our task of automatically categorizing, ex ante, the content of more than 70,000 regulatory 8-K filings from U.S. companies. We then evaluate the subsequent stock market reaction. Our empirical evidence suggests a considerable discrepancy among various types of news stories in terms of their relevance and impact on financial markets. For instance, we find a statistically significant abnormal return in response to earnings results and credit rating, but also for disclosures regarding business strategy, the health sector, as well as mergers and acquisitions. Our results yield findings that benefit managers, investors and policy-makers by indicating how regulatory filings should be structured and the topics most likely to precede changes in stock valuations.
---
中文摘要:
本文全面研究了不同主题的股票价格对财务披露的反应。因此,我们特别揭示了大量的文件,这些文件的内容不存在先验分类。为此,我们利用数据挖掘的一种方法,即潜在Dirichlet分配,作为主题建模的一种手段。这项技术有助于我们提前对来自美国公司的70000多份8-K监管文件的内容进行自动分类。然后,我们评估随后的股市反应。我们的经验证据表明,不同类型的新闻故事在其相关性和对金融市场的影响方面存在很大差异。例如,我们发现,对盈利结果和信用评级,以及对商业战略、卫生部门以及并购的披露,都有统计上显著的异常回报。我们的研究结果表明,监管文件的结构应该如何,以及股票估值变化之前最可能出现的主题,从而使管理者、投资者和决策者受益。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computation and Language        计算与语言
分类描述:Covers natural language processing. Roughly includes material in ACM Subject Class I.2.7. Note that work on artificial languages (programming languages, logics, formal systems) that does not explicitly address natural-language issues broadly construed (natural-language processing, computational linguistics, speech, text retrieval, etc.) is not appropriate for this area.
涵盖自然语言处理。大致包括ACM科目I.2.7类的材料。请注意,人工语言(编程语言、逻辑学、形式系统)的工作,如果没有明确地解决广义的自然语言问题(自然语言处理、计算语言学、语音、文本检索等),就不适合这个领域。
--
一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
--> Investor_Reaction_to_Financial_Disclosures_Across_Topics:_An_Application_of_Late.pdf (384.49 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:应用程序 投资者 Quantitative Acquisitions Applications

沙发
大多数88 在职认证  发表于 2022-6-10 02:19:40
投资者对跨主题财务披露的反应:潜在Dirichlet分配的应用Feuerriegel,Stefan,ETH Zurich,Zurich,Switzerland,sfeuerriegel@ethz.chAbstract:本文全面研究了不同主题的股票价格对财务披露的反应。因此,我们特别关注大量不存在内容先验分类的文件。为此,我们利用数据挖掘的一种方法,即潜在Dirichlet分配,作为主题建模的一种手段。这项技术有助于我们提前对来自美国公司的70000多个监管8K文件的内容进行自动分类。然后,我们评估随后的股票市场反应。我们的经验证据表明,就其相关性和对金融市场的影响而言,不同类型的新闻报道存在很大差异。例如,我们发现,对于收益结果和信用评级,以及对商业战略、卫生部门以及并购的披露,在统计上存在显著的异常回报。我们的研究结果表明,监管机构应如何构建2014年5月8日1805.03308v1【cs.CL】8的监管机构,以及最有可能在股票估值变化之前的主题,从而使管理者、投资者和决策者受益。关键词:数据挖掘、新闻接收、主题建模、文本挖掘、管理应用1简介有效市场假说规定,投资者在决策过程中考虑所有可用信息,然后相应调整交易(Fama等人,1969年;Fama,1970年)。在这种情况下,法规通常要求公司和管理机构通过向所有市场参与者提供的方式发布和分发新信息。

藤椅
大多数88 在职认证  发表于 2022-6-10 02:19:43
例如,美国上市公司在法律上有义务通过证券交易委员会(SEC)发布所谓的8-K filingsvia披露。金融市场包括定量和定性信息,如财务披露的语义内容(Loughran和McDonald,2016)。这些书面内容代表了丰富的信息来源,从而补充了对股票价格动态的解释,作为对财务事件或会计信息的回应。市场相关信息的例子在研究金融市场如何响应报纸文章(Tetlock,2007;Tetlock等人,2008)、收益报告(Loughran和McDonald,2011)或其他类型监管披露(Hanley和Hoberg,2012)中的语言的研究中进行了阐述。披露,如美国的8-K表格,必须遵守规定的结构。基本目标是增加投资者处理这些文件的难度。为了实现这一目标,监管机构的特定部分必须包含特定类型的信息。例如,第2.01节(报告资产收购完成情况)或第2.02节(包含运营结果和财务状况)属于特定公司事件。例如,Lerman和Livnat(2010)记录了市场对8-K filings中特定章节的反应(非正常股票收益率、收益波动率和交易量)。

板凳
mingdashike22 在职认证  发表于 2022-6-10 02:19:46
同样,Hanley和Hoberg(2012)研究了首次公开募股招股说明书中的风险相关部分如何与未来的诉讼成本相一致。然而,在实践中,大多数公司无法使用上述结构,因为他们的材料与给定的主题不匹配:相反,公司将其内容放在第8节(其中包含了先前章节未涵盖的所有其他事件)或第9节(对于其他附录)中。事实上,我们后来的分析显示,22.74%的所有披露中包含77.36%以下的材料。例如,美国证券交易委员会(U.S.Securities and Exchange Commission)现行的8-K表格部分规则详述于https://www.sec.gov/fast-answers/answersform8khtm.html.speci第五部分,有必要进行整体研究,包括自由文本领域的内容。第8节和第9节中规定的材料是相关的。研究个人信息与金融市场的相关性。然而,此类研究无法充分确定已经纳入市场或之前已向媒体发布的信息,而其他研究可能无法决定企业未来的业绩。本文通过对纽约证券交易所上市公司受监管的8-K股数据进行实证分析,为现有研究做出贡献。然后,我们根据其平均价格反应对这些披露进行分类。这使我们能够确定与投资者相关的主题。总之,我们的发现表明,不同财务披露主体的新闻接受程度差异很大。有助于信息的感知和交流(McKinney和Now将更多时间用于这些特定主题,从而加强他们在相关问题上的交流。

报纸
能者818 在职认证  发表于 2022-6-10 02:19:49
另一方面,从业者可以减少在不太相关的项目上花费的精力,例如,找到更标准的写作和发布这些新闻故事的方法。最重要的是,我们的工作使管理层——特别是投资者关系部门——能够更容易地预测新闻发布后股价变化的最可能方向。因此,这些知识有助于减少不确定性,更好地了解如何将当前监管结构与我们对实际报告需求的观察结果相一致的后果。不同的内容主题,同时也衍生出我们研究问题的相关性和新颖性。第3节介绍了我们的数据挖掘方法,以实证衡量不同主题的财务披露接收情况。最后,第4节介绍了相应的结果,第5节讨论了信息系统、数据挖掘和决策科学领域的专业人员、管理人员和研究人员的就业情况。2背景一个特殊的重点是以前也利用数据挖掘技术的工作。在线附录中给出了形式市场假说,其中还包括与公司监管沟通相关的背景。监管公告的内容被发现是2016年变化的驱动因素)。针对股票市场上8-Kdisclosure主题的不同部分,如股票发行、公司治理变化、,合并和收购(例如,Chan,2003;Tetlock,2007;Vulteenaho)忽略了不属于任何给定主题的大量披露,而我们随后提出了一种进行整体分析的方法。还有另一个研究场所,从收集的出版物中提取多个主题,并研究其对股票估值的影响。

地板
nandehutu2022 在职认证  发表于 2022-6-10 02:19:52
例如,之前的研究将报纸标题分类为预先定义的世界事件积极的报纸标题。然而,它并没有很快检测到统计上的显著差异,并且频繁延迟的报纸中包含的信息的新颖性相对较低。与我们的研究最接近的是Neuhierl等人(2013)的研究,该研究将大量企业新闻稿分为10个主要组和60个亚组。他们发现,在新闻发布后,波动性往往会增加,这可能是估值不确定性的结果。特别是,作者发现对与公司战略、客户和合作伙伴、产品和服务、管理层变更和法律文件相关的新闻的重大反应。一篇类似的研究论文还使用了一份事先确定的14个类别的列表,如收购、交易、法律或裁决(Boudoukh等人,2013)。然后,通过计算语言学的规则将新闻项目划分为这些类别。在此,作者发现,一些特定主题,如分析师建议和财务,研究了德国临时公告的新闻主题相关接收,发现了市场反应的差异。在另一项研究中,使用预先标记的数据集对天真的Bayes算法进行训练,该数据集由《华尔街日报》的文章组成(Antweiler和Frank,2006)。然后,这些标记的主题将作为研究股市反应的基础。除其他外,这项研究观察到了市场反应过度的趋势,因为异常回报在发布前后表现出相反的信号。此外,该报还报道了经济衰退期间新闻报道对经济的长期影响,而不是经济扩张。通常由预先列出的给定主题驱动。相反,我们提取topicsex-post来匹配我们的语料库。

7
大多数88 在职认证  发表于 2022-6-10 02:19:56
因此,我们实现了一个自动数据挖掘过程,该过程以计算机化的方式从语言本身推断主题。例如,从数据挖掘到主题提取,我们受益于三个优势:第一,避免了手动主题提取的主观偏见;第二,我们允许主题选择方法更灵活地匹配我们的语料库。事实上,我们甚至可以将8-K系列中第8节和第9节的内容分为不同的主题。此外,数据挖掘方法使我们能够处理数千份披露,从而提供新闻标签的全面信息。不具有表示内容主题的明确标签。这尤其没有关于他们的主题的具体信息。以77.36%的相应主题中的22.60%为例,使用数据挖掘进行如下操作。因此,我们随后通过解决我们的研究问题为文献做出贡献:8-K filings涵盖哪些主题?哪些主题会引发异常回报我们的经验发现,然后我们可以报告对研究人员、管理人员和决策者的一系列影响。特别是,我们将确定的主题与规定的8-K字母结构进行比较,以得出如何将两者对齐的建议。3方法学本节详细介绍了我们的方法学(见图1),以研究将书面材料转化为数学结构的差异。此格式然后分配。

8
mingdashike22 在职认证  发表于 2022-6-10 02:19:59
最后,我们进行了一项事件研究,以计算每个出版物对应的异常回报率。预处理潜在Dirichlet分配评估事件研究方法OlogyNews CorpusStock Market DataNews Topics异常回报图1。研究财务披露中不同主题信息接收差异的方法。3.1文本挖掘中常见的文本挖掘过程(Manning和Schütze,1999)。这些操作将正在运行的文本转换为允许进一步计算的矩阵表示法。首先,我们删除英语中经常出现的术语(即停止词),例如,is或of。这些不太可能有助于理解内容的含义,因此可以省略。在这里,我们使用了174个停止词(Feinerreet al.,2008)。然后,我们通过将反射词减少到下一步来将相关词映射到一起,下一步是创建一个文档术语矩阵,该矩阵存储文档集合中出现的每个术语的频率。由于文档术语矩阵显示了自然语言的全部复杂性,它们很容易变得非常大,但也变得非常稀疏,即包含许多零条目。因此,我们剔除了不到5%的不寻常词。3.2通过潜在Dirichlet分配进行主题建模对于主题建模,即潜在Dirichlet分配(LDA)。LDA是aits表示,它假设每个文档都包含隐藏的混合(即,假设文档是通过以下两个阶段的过程生成的(Blei et al.,2003;Blei,2012):1。对于每个documentdin-corpusD,我们绘制一个随机分布θdoftopics,其中条目θd,k表示主题种类的比例。随机变量θd服从狄利克雷分布,先验α由θd给出~ Dir(α),α=(α,α,…,αK)。(1)2.现在,我们指定单词如何映射到主题上。

9
kedemingshi 在职认证  发表于 2022-6-10 02:20:02
因此,我们从θd中为文档中的每个单词选择一个主题。此外,根据所选主题,选择一个单词WD,新的固定词汇。相应的分布由βk给出~ Dir(η)与前η。联合可能性为thenP(θ,β,w,z)=D∏d=1P(θd |α)K∏k=1P(βk |η)N∏n=1P(zd,n |θd)P(wd,n | zd,n)。(2) 不幸的是,不可能直接最大化联合概率,因为一个人只能观察文档而不能观察主题。作为补救措施,LDA着手寻找最高的后验分布。后验分布P(θ,β,z | w,α,η)=P(θ,β,w,z |α,η)P(w |α,η)(3)由联合似然除以边际概率得到。然而,由于β和θ之间的依赖关系,分母通常难以计算。因此,一种是指近似推断技术,如变分期望最大化(Steyvers和Grif fith,2013)。为了进行LDA,我们必须选择Dirichlet priorsα和η,这两个参数控制另一个常见的选择是Gibbs抽样,这是马尔可夫链蒙特卡罗(MCMC)的一种变体。分别记录主题和主题词分布。我们初始化所有LDA(2003)。下一步,潜在Dirichlet分配需要为每个提取的主题分配一个唯一的标识符,即主题名称。为了解释一个主题,OneTypical会检查该主题中3到30个最可能的术语的排名列表。这样的列表,因此很难区分主题的含义。因此,最近的研究发现,基于这种可能性对术语进行排序会妨碍解释(例如Chang等人,2009)。为了缓解这一问题,我们利用了Sievertand Shirley(2014)提出的术语-主题关系方案,该方案通过测量术语与主题的“相关性”来促进主题解释。

10
nandehutu2022 在职认证  发表于 2022-6-10 02:20:05
作为一个主要的好处,这种方法产生了更加连贯和易懂的主题(Sievert和Shirley,2014)。从数学角度来看,相关性是一个术语在特应性φk内的概率与其“升力”的对数的加权平均值,其中“升力”定义为一个术语在主题φk内的概率与其在整个微粒子中的边际概率之比。然后,计算主题k中单词n的相关核心,即r(n,k |λ)=λlog(φkn)+(1- λ) 日志φknpn, (4) 式中,λ是给定给topickunder字的与其升力相关的重量。相关测量值可以用0来平衡≤ λ ≤ 1,通过赋予φ(λ=1)或升力(λ=0)更多重量。在我们的研究中,我们选择λ=0.6,正如Sievert和Shirley(2014)在广泛分析中所建议的那样。最后,我们需要确定如何将单个主题分配给每个公告,因为最初,潜在Dirichlet分配决定了主题分布θdddisclosure到发生概率最高的主题。3.3事件研究设计我们现在介绍我们的事件研究设计(参见MacKinlay,1997;Srinivasan等人,2017),以分析财务披露的信息价值。这使得我们能够在不混淆影响的情况下估计出版物对股市的影响。然后,我们估计在没有披露的情况下的正常回报,并将其与观察到的回报进行比较。这种差异产生的异常回报可归因于进入市场的财务披露的新信息。附录详细概述了事件研究方法。我们报告所有收益(百分比)。4实证发现本节介绍了我们关于不对称信息的实证发现,即并非所有信息都与投资者的决策同等相关。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 10:00