楼主: 大多数88
1945 38

[量化金融] 新闻共现、注意力溢出和回报可预测性 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-31 06:00:51
每个节点(股票)的重要性将取决于它与此新闻网络中所有其他节点(股票)的连接。为了解释这种间接影响,我们使用一些衡量指标来衡量股票在市场中的重要性,我们将在本文的其余部分详细讨论这些指标。2数据与方法在本节中,我们介绍了数据来源,并解释了新闻网络引发注意指数背后的直觉。然后,我们介绍了我们可以竞争的替代预测因子及其相应的数据源。2.1新闻网络引发关注我们用于构建媒体网络的数据是1996年1月至2014年12月期间汤森路透新闻分析和存档数据集中的具体新闻。数据包含各种类型的新闻,例如关于市场、行业和公司的评论、故事、分析和报告等。它还提供了三种概率,即PosNN(文章的概率为正)、NegNN(文章的概率为负)和NeuNN(文章的概率为中性),适用于每篇新闻中提到的所有信息。这三个概率之和为1,由基于神经网络的情感引擎计算得出。在随后的分析中,我们将使用NegNNandOptNN(PosNN- NegNN)以及软信息预测器。新闻网络引发注意的措施分三步构建。我们将新闻分为两类:涉及多支股票的相关新闻和仅涉及一支股票的自我新闻。经验主义者通常通过计算总的提及次数(新闻报道)(Barber和Odean,2008)或出现在头条新闻中的次数(Yu,2015)来间接衡量投资者的关注度,而不区分这两类新闻中的细微差异。

12
nandehutu2022 在职认证  发表于 2022-5-31 06:00:54
具体而言,自我新闻可能只会吸引那些事前关心该股票或已经持有其股票的投资者,而相关新闻不仅会吸引相关投资者的注意力,还可能引发那些只关心其中一只股票的投资者关注其他共同提及的股票。因此,附录中提供了有关该指数构建的严格数学公式。与自我新闻相比,大幅扩大了投资者基础。基于这一区别,对于任何给定的一对股票,我们分别计算两个股票的自我新闻报道以及它们之间的关联新报道。然后,我们根据其自身新闻报道重新缩放关联新闻报道,以衡量关联新闻对整体投资者基础的贡献。最后,wefollow Da et al.(2011)通过对重新缩放的关联新闻报道进行第一次差异,构建异常注意测量,这也可能有助于消除潜在的非静态时间序列。到目前为止,我们隐含地假设新闻网中的每只股票都同等重要,因为每只股票的异常投资者关注度都具有同等的权重。事实上,越重要的公司越容易吸引投资者的注意力。因此,我们建议根据股票的重要性调整异常关联新闻报道。在本文中,我们从两个维度来衡量股票的重要性。一个维度是企业自身的特征,即企业规模,它决定了企业自身能够吸引多少投资者关注。另一个维度是关联企业的整体重要性,即中心性,它评估了该企业通过关联其他企业可以吸引多少投资者关注。特别是,中心度是一种专门的度量,它可以帮助使用边缘信息对网络中顶点的重要性进行排序。

13
大多数88 在职认证  发表于 2022-5-31 06:00:57
正如Newman(2010)所介绍的,在网络分析中有各种类型的中心度度量(例如度中心度、贴近度中心度、介度中心度、特征向量中心度等),我们选择在研究中使用特征向量中心度。具体而言,我们首先定义了=库存····库存A11、ta12、t···a1N、tstocka21、ta22、t···a2N、t。。。。。。。。。。。。。。。stockNaN1,taN2,t··aNN,t. (2.1)式中,如果存在在时间t共同提及股票i和j的新闻,则aij,t=1,否则为0。然后,我们计算对应于最大特征值(λmax)的特征向量xt。通过这种方式,相应的特征向量捕获投影到特征空间的列向量的最大变化,可以用来描述网络上下文中链接的信息性(Newman,2010)。邻接矩阵并定义xtas我们的中心性得分的值,即Atxt=λmaxxt,对于每个t=1,2,···,t,(2.2),其中xt=(Ctry1,t,Ctry2,t,··,CtryN,t)和Ctryi,t代表时间t时股票i的特征向量中心性核心。与根据其度数授予节点的度中心性不同,特征向量中心性认为并非所有顶点都是等价的:一些顶点比其他顶点更相关,而且,合理地说,来自重要节点的认可更重要。因此,特征向量中心性表明,如果一个节点连接到其他重要节点,则该节点是重要的。以图1中的一个简单网络为例,网络中的每个顶点表示一个实体,边表示由新闻共现引起的媒体连接。学位中心性表明,表1和表3、表2和表6或表4和表5同等重要,因为它们拥有相同的学位。然而,尽管第2和第6家公司都有两个学位,并与第1家公司相连,但第6家公司与第3家公司相连,后者的学位比第4家公司多。

14
可人4 在职认证  发表于 2022-5-31 06:01:01
因此,我们应该预计,在传播新闻方面,第六家公司比第二家公司更重要,因为它有更多的二级关系。同样,我们也应该预计,1号和5号企业将分别比3号和4号企业占据更为核心的地位。特征向量中心度得分证实了这一直觉[0.5641、0.2960、0.5454、0.1268、0.2337、0.4753]。显然,在描述新闻传播时,投资者的中心性得分更适合这种情况。[在此插入图1。]显然,企业规模和中心地位在描述企业在吸引注意力和新闻差异的背景下的重要性时相互补充。为了将这两个方面结合起来,我们制定了一个复合新闻网络引发注意指数NNTA,作为两个标准化注意度量的简单平均值,如等式(2.3)所示。由于这两个指标都可能包含有关投资者注意力以及特质非注意力噪音的信息,因此综合NNTA指标有助于捕捉相关新闻中常见的投资成分,并使特质噪音多样化。NNTAt=0.5NNTAszt+0.5NNTActrt。(2.3)在图2中,我们绘制了综合NNTA指数和其他两个单独的NNTANDICES。通常,基于规模的指数与中心性加权注意力指数的模式相似(相关系数为0.41),这意味着大型股也往往是中心性得分较高的股票,这两个指数反映的信息内容相似。然而,这两个指数仍然存在差异,尤其是在扩张期,这意味着将这两个指数结合起来将是有益的。

15
大多数88 在职认证  发表于 2022-5-31 06:01:04
通过构建,NNTA与NNTAszand和NNTActrat相似水平相关,分别为0.72和0.78。[在此插入图2。]2.2替代预测为确保NNTA捕捉到投资者关注的不同方面,我们希望在预测回归中控制一些替代关注度量。根据Barberand Odean(2008)和Fang and Peress(2009),媒体报道是投资的重要代表,对股票回报有着重大影响。因此,我们通过在Factiva上搜索关键词“标准普尔500指数”、“标普500指数”、“标普500指数”或“标普500指数”,从道琼斯和《华尔街日报》的文章中构建市场广度新闻报道,并从汤森路透新闻档案中获取特定新闻报道。此外,我们采用这些预测因子的第一个差异来获得异常媒体覆盖率,标记为TRN,DJI,以及《华尔街日报》。除了新闻报道之外,我们还基于文献构建了各种关注度指标,例如,根据Da等人(2011)的精神,谷歌搜索“S&P500”、“SP500”、“S&P500”和“SP 500”等关键词的搜索量(Google search),继George和Hwang(2004)之后的52周最高价格指数(PrcHigh),使用价值权重(分析师和分析师)和分析师覆盖率在Nasdaq指数和Hong等人(2000)之后的公司规模(分析师r)上的回归残差,以及每只股票的价值加权交易量(TrdVol)和异常交易量(TrdVol)的精神,Gervais等人(2001年)。除了注意力代理之外,其他具有很强回报可预测性的因素也被视为控制因素,以排除其他可能的解释。

16
kedemingshi 在职认证  发表于 2022-5-31 06:01:07
第一组因素是新闻语调,例如,第t个月单个股票i的负面新闻语调计算为Neg=#of Neg Wordsi,tTotal#of Wordsi,t,乐观新闻语调计算为Opt=#of Pos Wordsi,t-# 否定词si,t总#of Wordsi,t,其中肯定词和否定词遵循Loughran和McDonald(2011)字典。第二组因素是可能影响投资者信念的因素,即情绪指数(Baker和Wurgler,2006;Huang et al.,2014)和不确定性指数,包括VIX、Bali et al.(2014)的经济不确定性指数(UNC)、inChoi et al.(2017)的国库隐含波动率(TIV)、Baker et al.(2016)的经济政策不确定性(EPU)、金融不确定性(FU),Jurado等人(2015)中的经济不确定性(EU)。最后一组因素是与经济基本面直接相关的经济预测因素。具体而言,我们从Amit Goyal的网站上收集了Goyal和Welch(2008)的因素:对数股息价格比(D/P)、对数股息收益率(D/Y)、对数收益价格比(E/P)、对数股息支付率(D/E)、股票回报方差(SVAR)、账面市值比(B/M)、净股本扩张(NTI)、国库券利率(TBL)、长期债券收益率(LTY)、长期债券收益率(LTR)、期限利差(TMS),默认收益率利差(DFY)、默认收益率利差(DFR)和通货膨胀率(INFL)。此外,我们遵循Morck et al.(2000)的方法,构建了用于控制基本面相关性的收益联动指数(ECI)。我们首先运行回归ROAI=ai+bi×ROAm+i、 (2.4)对于每个时期的每个公司i。ROAIS公司资产回报率,按税后年度加总资产折旧计算。

17
可人4 在职认证  发表于 2022-5-31 06:01:10
ROAmis所有公司资产回报率的价值加权平均值。收益共同变动指数=PiRi(ROA)×SSTi(ROA)PiSSTi(ROA),(2.5),其中Ri(ROA)和SSTi(ROA)是Rand,即从企业i的回归(2.4)得出的总方差的平方和。较高的ECI表明收益经常一起变动。表1总结了本文中使用的所有变量。[在此插入表1。]从表1的汇总统计数据中,我们可以观察到,月度超额市场回报率的平均值为0.41%,标准差为4.49%,这意味着月度Sharperatio为0.09。还可以观察到,大多数经济预测都具有高度的持续性,而超额市场收益率几乎没有自相关性。这些汇总统计数据与文献基本一致。3预测股市收益与新闻共现在这一部分,我们提供了一些实证结果。第3.1节考察了NNTA指数在总市场水平上的时间序列回归可预测性。第3.2节比较了NNTA指数与替代预测因子的样本内收益可预测性。第3.3节分析了样本外可预测性。最后,第3.4节评估了NNTA指数的横截面预测性。3.1预测市场考虑标准预测回归模型,Rmt+1=α+βXt+t+1,(3.1),其中Rmt+1是超额市场回报,即标准普尔500指数的月回报率不超过无风险利率,XT是NNTA指数或其他预测指标。为了进行比较,我们还对媒体报道指数、替代关注指数、新闻语调、投资者情绪、不确定性因素、收益协同变动指数和等权重空头利率进行了同样的样本预测回归。

18
nandehutu2022 在职认证  发表于 2022-5-31 06:01:13
具体而言,我们检验了无效假设H:β=0,这意味着NNTA对股票回报没有可预测性,而备选假设H:β6=0。在零假设下,(3.1)简化为常数预期收益模型,Rmt+1=α+t+1。[在此插入表2。]表2报告了样本内预测回归的结果。从经济角度来看,OLSCOefficient表明,NNTA增加一个标准差与下个月预期超额市场回报减少约1.09%相关。一方面,回想一下,在我们的样本期内,平均每月超额市场回报率为0.41%,因此-1.09%的斜率意味着基于NNTA的预期超额市场回报率的变化幅度是其平均水平的2.7倍,这表明了强大的经济影响。另一方面,如果我们将一个月内减少的1.09%乘以12,那么13.08%的年化水平就有点大了。在这种情况下,可以将其解释为模型隐含的预期变化可能与市场上投资者的预期变化的合理水平不同。从经验上看,这一水平明显高于传统的宏观经济预测。例如,D/P比率、CAY和净支出比率的一个标准差增加往往会使风险溢价每年分别增加3.60%、7.39%和10.2%(见Lettau和Ludvigson(2001)和Boudoukh et al.(2007))。OLS预测的Rof NNTA为5.97%,大大高于所有替代注意代理以及软/硬信息预测。这意味着,如果这种可预测性水平能够在样本之外保持下去,它将具有重大的经济意义(Kandel和Stambaugh(1996))。

19
何人来此 在职认证  发表于 2022-5-31 06:01:16
Campbell和Thompson(2008)表明,鉴于月度市场回报中固有的巨大不可预测成分,每月0.5%的样本Rof可以产生显著的经济价值,我们在第3.3节中的发现与此观点一致。除了分析整个样本期的可预测性外,检查商业周期的可预测性也很重要,这样我们就能更好地理解基本驱动力。继Rapach等人(2010年)之后,我们分别计算了经济扩张(Rup)和衰退(Rdown)的RStatistics,Rc=1-PTt=1{t∈Tc}·tPTt=1{t∈Tc}·(Rmt-(R)Rm),c∈ {上,下},(3.2),其中1{t∈Tup}(1{t∈Tup})是一个指标,当t月处于安伯扩张(衰退)期时,该指标的值为1,即Tup(Tdown),否则为零;这是基于(3.1)中预测回归模型的样本内估计值得出的结果;(R)Rmt Rmt的全样本平均值;T是完整样本的观察次数。注意,与全样本统计不同,Rup(Rdown)没有符号限制。表2的第4列和第5列报告了Rupand和Rdownstatistics。结果表明,NNTA在衰退期间获得的回报可预测性是扩张期间的两倍。此外,在扩张期内,NNTAH的回报可预测性明显高于所有其他预测指标,在衰退期内,它的表现仅不及《华尔街日报》的异常新闻报道。这证实了我们基于新闻网络的注意力代理在所有经济环境下都具有稳定的市场溢价预测能力。3.2与经济预测的比较在本小节中,我们将NNTA的预测能力与替代预测进行比较,并检查其预测能力是否由忽略的注意力代理、软信息或与商业周期基本面相关的经济变量驱动。

20
何人来此 在职认证  发表于 2022-5-31 06:01:20
具体而言,我们检验了在控制其他预测因素后,NNTA的预测能力是否仍然显著。为了分析NNTA的边际预测能力,我们基于NNTA和其他预测因子进行以下双变量预测回归,Rmt+1=α+βXt+φZt+t+1,(3.3),其中XT是NNTA指数之一,ZT是第2.2节中描述的替代预测因子之一,我们的主要兴趣是系数β,并测试H:β=0与H:β6=0。[在此插入表3。]表3显示(3.3)中β的估计值为负值,且大小稳定,这与表2中报告的预测回归(3.1)的结果一致。更重要的是,当其他预测因子增加时,β仍然具有统计学意义。这些结果表明,NNTA除了包含在媒体报道、替代注意代理和其他主流回报预测中的信息外,还包含相当多的补充预测信息。注意到控制其他预测因子不会破坏NNTA\'simpact(β与表2中报告的几乎相同),我们有信心认为基于新闻网络的预测因子的信息内容不会与现有的注意代理重叠。3.3样本外预测样本内分析通过利用所有可用数据提供更有效的参数估计,从而提供更精确的回归预测。Goyal和Welch(2008)等认为,样本外测试似乎更适合实时评估真实回报的可预测性,避免过度拟合问题,并且受Stambaugh偏差等有限样本偏差的影响较小(Busetti和Marcucci(2013))。所以,有必要显示NNTA指数的无样本预测性能。对于时间t的样本外预测,我们仅使用时间t之前的可用信息来预测t+1时的股票收益。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 18:23