楼主: 可人4
774 26

[量化金融] 投资者对跨主题财务披露的反应:一个应用程序 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-10 02:20:08
因此,我们致力于确定引发股价重大调整的主题。为此,我们首先展示了8-K字母的基本语料库,然后是描述性见解。然后,我们使用潜在Dirichlet分配根据受试者自动对8-K婴儿进行分类,并按主题研究对股票价格的平均影响。4.1语料库为了创建我们的8-K文件语料库,我们进行了以下工作:从2004年至2013年,我们从EDGAR网站下载了所有8-K文件,包括标题和修改文件。这就得到了总共901133根纤维,然后经过了几个过滤步骤。首先,我们只从在纽约证券交易所(NYSE)上市的公司中选择公司。其次,为了获得信息,将SEC CIK编号与纽约证券交易所的股票符号进行匹配。第三,我们不包括美国证券交易委员会:http://www.sec.gov.that包含少于个单词(Loughran和McDonald,2011)。与之前的文献一致,我们还剔除了股价低于500美元异常回报率的低价股(Konchitchki和O\'Leary,2011)。这些过滤步骤最终产生了73986个语料库。4.2描述性统计我们现在调查以下事件的频率和长度。我们的语料库涵盖了所有不同的公司,而公司的中位数为85.73(标准差为66.73)。单个企业的总范围从最小1到最大501。表1显示了8-K filings语料库在交易日结束时的异常回报的描述性统计。样本中所有8-K公司的异常回报率平均变化为0.0361%。在所有披露的信息中,共有36587份导致37378份股票市场回报(以%计),标准差为4.03,中位数接近当年。

12
大多数88 在职认证  发表于 2022-6-10 02:20:11
很明显,公司的频率和长度以及覆盖公司的数量每年都在增加。平均中值最小最大标准偏差偏度峰度正态回归(in%)0.04-0.02-89.46 238.20 4.03 4.70 255.13备案数量(每月)616.60 617.20 450.50 794.70 103.14 0.02-1.25归档长度(词干词)3473.00 1001.00 151.00 648700.00 10018.06 15.01 523.89表1。第一个交易日结束时的异常回报的描述性统计数据(不包括低价股),以及8K股的长度。年平均值ABN。Ret.MedianAbn。参考标准偏差Abn。Ret.TotalFilingsMean归档长度(词干词)CoveredFirmsPositiveFilingsNegativeFilings2004-0.030-0.063 3.21 5173 2611.25 479 2509 26642005 0.003 -0.050 2.99 7066 2929.85 507 3427 36382006 -0.033-0.053 3.07 7211 3059.41 517 3493 37182007 0.085 -0.003 3.51 7197 3075.28 558 3588 36072008 0.064 0.041 6.21 7012 2861.81 546 3542 34672009 0.047 -0.056 6.35 6700 3408.10 554 3293 34052010 0.014 -0.011 3.28 7776 3645.02 601 3863 39132011 0.070 0.005 3.72 8110 3695.27 622 4064 40452012 0.040 -0.026 3.51 8687 4356.49 649 4268 44092013 0.071 0.007 3.10 9054 4364.91 728 4540 4512表2。各年(不包括低价股)的利润和异常回报的描述性统计(单位:%)。4.3主题提取来自美国股票上市公司的受监管8-K文件没有规定其内容主题的代码或标签。我们通过使用潜在Dirichlet分配提取相应的主题来克服这个差距。要执行此方法,我们必须事先选择要识别的主题数量。这不同于其他机器学习算法,例如,通过交叉验证或启发式优化集群数量。与2009年一致;尼德霍夫,1971年)。

13
大多数88 在职认证  发表于 2022-6-10 02:20:14
此外,我们还测试了范围广泛的内容,从10个主题到40个主题,找到了确凿的见解(更多详情请参见附录)。最后,我们为每个提取的主题指定一个唯一的标识符,即主题名称。具体而言,我们从每个给定主题中出现的最相关术语中推断出各个主题的名称。例如,词干词,如director、governance。另一方面,天然气、能源或石油等词干代表与能源部门相关的披露。在线附录中提供了主题和相关术语的完整列表。表3提供了所提取主题的描述性统计数据,从而表明大多数文档被分配到两个主题中的一个,即“获取结果”和“公共关系”,而其余的则以相当均匀的方式分布在其余的主题中。有趣的是,例如,盈利结果在财务新闻中所占的比例很高,这与现有文献中的发现也一致(Carter和Soo,1999)。该表还显示,即使是在相对相似的新闻主题中,在filing长度方面也存在实质性差异。例如,与收益表相关的文件中包含的单词的长度比收益结果长80%。对相应公司的全面手动评估表明,盈利结果通常包含相关的业务前景。

14
nandehutu2022 在职认证  发表于 2022-6-10 02:20:18
相比之下,损益表由大量的量化数字组成,以及信息量较小的标准文本和监管说明#受保公司#备案平均备案长度(#词干词)能源行业169 3779 1289.42保险行业197 3761 2509.05受托人变更480 2075 14644.95房地产149 2975 2897.59公司结构540 1575 11359.47贷款支付567 1940 23273.82股东权利修改487 1738 3550.16盈利结果672 14246 1489.70证券销售496 2317 8039.96股票期权奖励670 59712748.03信用评级417 1246 4394.45损益表496 5592 2680.31业务策略581 6892 994.12证券借贷326 1523 3368.34管理变更719 5105 1710.42医疗保健行业83 507 6821.64税务报告255 524 34204.59股票稀释98 386 7706.84并购295 612 13167.53公共关系699 11222 409.99表3。所有提取主题的描述性统计。4.4股票市场对信息披露主题的反应给定主题与投资者的实际投资决策联系更紧密。这也可以通过统计检验,例如t检验。根据表4,我们观察到以下总体模式。首先,中间业务(如商业战略)表现出正的中位数异常回报,而并购和管理变革等对市场的负面影响。表4还反映了假设检验的结果。在这里,我们自举系数=200根据我们的结果,共有五个主题产生的ap值低于5%统计显著性水平的阈值。具体而言,我们发现,从统计角度来看,对盈利结果和并购有显著的负面影响-0.01%-分别为0.03%。另一方面,商业战略、医疗保健部门和信用评级与积极的市场反应相关。不

15
何人来此 在职认证  发表于 2022-6-10 02:20:21
主题名称异常返回中间值Abs。能源行业标准发展1 p值中值-0.01 1.07 0.71 2.862保险业-0.03 1.11 0.21 4.103受托人变更0.01 0.87 0.36 2.624不动产-0.07 1.04 0.84 2.455公司结构-0.08 1.21 0.10 6.716贷款支付-0.04 1.01 0.15 6.097股东权利修订-0.03 1.16 0.66 3.618收益结果-0.01 2.15 0.02 5.409证券销售-0.02 0.97 0.90 2.6310股票期权奖励-0.04 1.02 0.30 2.6611信用评级0.00 1.10 0.04 4.2512损益表0.07 1.69 0.12 4.8113业务策略0.04 1.20 0.01 3.4014证券借贷-0.04 0.85 0.52 4.4515管理变更-0.08 0.94 0.90 2.5716医疗行业0.03 1.20 0.02 3.8317税务报告-0.07 1.07 0.97 5.1118股票稀释0.15 1.46 0.22 4.0819并购-0.03 1.28 0.05 3.1220公共关系-0.04 1.08 0.87 3.10表4。所有提取主题的异常回报汇总统计信息(以百分比为单位)。粗体字突出显示在5%显著水平上具有统计意义的主题。由于观察数量较少,我们在n=200次替换的情况下执行引导。4.5不对称接受为了调查不同信息的潜在不对称性,可能导致平均股价波动更高,波动率越高,隐含着投资者信息内容的多样性越大。我们首先分析不同新闻主题的绝对异常回报率的差异。如表4第二列所示,绝对异常回报中值显示出较大的利差,从证券借贷的0.85%到盈利结果的2.15%不等。为了测试印度人之间的这些差异是否具有统计学意义,我们使用了Kruskal-Wallis检验。

16
能者818 在职认证  发表于 2022-6-10 02:20:23
根据我们的结果,在1%显著水平上,所有主题的绝对异常回报中值相等的无效假设被强烈拒绝。因此,不能假设是固定的,而是取决于新闻主题。接下来,我们使用异常回报率的标准差(以百分比为单位)作为股市波动性的替代衡量指标来验证这一结论。此外,我们还观察到股市异常回报的波动性存在较大的利差。各个主题的标准偏差范围为2.45到6.71。有趣的是,我们发现,例如房地产的带宽较小,标准差为2.45,而例如公司结构(6.71)和贷款支付(6.09)的方差较大,因此信息水平较高。这种方差的同质性也可以进行统计检验。为此,我们利用巴特利特检验来研究所有主题都来自方差相等的总体的无效假设。无效假设在1%显著水平上被强烈拒绝。因此,我们再次看到,8-K filings的信息水平在各个主题上有很大的不同。4.6与先前研究的比较我们现在将我们的发现与先前的研究进行比较。因此,我们在下文中讨论了对股市具有统计意义的非零影响的主题收益结果。在所有重要主题中,该主题的波动性最高。此外,我们还发现了负中位异常回报McDonald(1990)。同样,Loughran和McDonald(2011)研究了监管性收益报告,其基调与随后的股票回报率相关。即使在盈利报告中隐藏或难以获得材料,如脚注,最终也会反映在市场价格中(Bloom field,2002)。Li(2008)主题。

17
能者818 在职认证  发表于 2022-6-10 02:20:26
总之,这些数据表明,这一主题在股票表现方面起着决定性的作用信用评级信贷相关材料通常向资本市场传达有关借款公司价值的高度相关信息。因此,人们发现这些材料可以解释股价的变动(Lummerand McConnell,1989)业务战略。商业战略的显著效果通常是由积极的长期项目推动的(Woolridge和Snow,1990);例如,关于国际业务(Elango等人,2013年)。此类信息可通过包含印刷相关材料的可选附录传达。同样,报纸倾向于讨论的不是企业的个别财务数据,而是整体前景或战略。与我们的结果一致,报纸文章也被发现与股价变化有关(Tetlock,2007;Tetlock等人,2008)。o对股市产生显著的积极影响。Feuerriegel等人(2016)最近也报告了类似的证据。有趣的是,这也与医疗行业在过去十年中的表现高于平均水平这一事实相吻合(Arouri和Nguyen,2010)并购。相比之下,与合并和收购相关的披露平均与负价格变化相关。根据Cartwright和Schoenberg(2006),投标公司在收购另一家公司的过程中经常会遇到股价表现不佳的情况。这与早期并购工作的发现形成对比,早期并购工作主要集中在公告日。例如,《多德法案》(Dodd)(1980)的工作确定了一个积极的市场反应,即目标公司在公告日实现了显著的正异常回报(Asquith et al.,1983)。

18
大多数88 在职认证  发表于 2022-6-10 02:20:30
相比之下,我们的研究监控所有与此过程相关的事件,并将其纳入我们的数据集。因此,我们的结论也反映了与合并或收购相关的各种障碍,以及流程的潜在失败。我们以上的讨论强调,需要准确标记监管机构中的事件,尤其是在并购的不同阶段。然而,目前8-K filings的结构没有达到这一目标,因此我们将在下一节提出建议。5含义在下文中,我们讨论了我们的研究的含义,因为它不仅有助于决策科学领域的研究,而且在向公众发布有关企业绩效的信息时,对高管和专业人员也有很大的相关性。5.1研究的意义上述结果有助于理解人类如何处理信息投资者的反应因所讨论的故事而大不相同。因此,投资者似乎只会有选择地将注意力集中在某些主题上。此外,我们还为数据挖掘和决策科学领域的研究人员提供了一种有趣的方法,以复制我们的方法,更好地理解决策。通过使用主题建模方法,研究人员可以在没有先验知识的情况下处理大量的文本材料。当将这些见解与外部变量联系起来时,主题会相应地进行排名,其中一个主题的信息价值最高。这可以应用于金融以外的许多领域,如社交媒体、博客帖子或推荐系统中用户生成的内容,从而拓宽我们对信息和特别是自然语言如何促进决策的知识;参见例如Sul等人。

19
何人来此 在职认证  发表于 2022-6-10 02:20:33
(2017); Lu等人(2012年)。Tetlock,2007年;Tetlock等人,2008年)对所有财务披露一视同仁,不考虑不同主题接收的潜在异质性。然而,我们的工作是围绕最近金融相关研究中的分析展开的,根据这些分析,对金融材料的反应不能被假设为独立于决策策略(Schiffels et al.,ming;Taylor,1975)。相反,研究人员必须准确地识别和解释这些混杂因素,以实现更高的目标。5.2对决策者的影响我们的发现为决策者从数据挖掘技术中创造价值开辟了一条道路。目前,美国和其他国家的监管文件通过标准化渠道发布,但不是以标准化格式发布。因此,鉴于现状,按主题过滤几乎不可能。为了缓解这一问题,可以要求企业为每个文件分配主题代码,以便于过滤。此外,有关格式的其他先决条件可以提高机器可读性。事实上,我们的发现已经进入了决策者最近的项目,如财务报告委员会。财务报告委员会是美国。K、 公司报告监管机构,我们根据这项研究建议他们通过上述方式改进财务报告。由于自然语言仍然是计算机正确理解的一个挑战,添加语义注释(或链接数据)也可以极大地促进这项任务(例如,Storey等人,2008)。下一步,这种形式的结构化信息还可以简化所有投资者(包括自动交易员)的信息过滤过程。

20
大多数88 在职认证  发表于 2022-6-10 02:20:36
同时,语义结构显示了一条潜在的途径,可以减少金融材料含义和主观解释的不确定性,并间接利用透明度。我们的研究结果还深入了解了监管机构的结构如何在表4中确定,以及美国证券和医疗保健部(U.S.Securities and healthcare–make)规定的实际部分如何按比例使用自由文本字段。可能有两种选择可以更好地反映这些公司的出版需求,以及潜在投资者的处理能力。一方面,可以通过行业代码来增强监管,以表明企业运营的市场领域(或披露相关的市场领域)。另一方面,这可以作为严格、深入的内容分析的起点,从而确定当前节名称与所披露的信息相匹配。我们还看到了各种问题的章节和确定的主题之间的重叠。例如,公司结构(第6.02项涉及受托人变更)、股票稀释(第3.01项涉及除名)和修正案(第5.03项)。然而,与我们的分析相比,其他主题需要一个更为精细的部门结构:管理层变更(第5.01至5.08项剖析了个人行为,如变更注册人对股东董事提名的控制)和财务等。这一观察得到了早期管理变革文献的支持(例如Bonnier和Bruner,1989;Warner等人,1988)。同样,我们在第4.6节中的讨论强调了财务结果对企业绩效的重要性。更细粒度的结构也反映了Neuhierl等人的人类分类。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 05:47