楼主: 何人来此
1771 39

[量化金融] 新闻对预测重大损失重要吗? [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-5-7 02:13:02
关于两分钟时间跨度的选择,我们观察到,与一分钟、三分钟和四分钟的系列相比,两分钟的回程系列具有更突出的尖峰。正式地说,我们将相应资产的标题盖章前两分钟日志RTRETURN与每个样本标题lj相关联,所有j=1,2,nh,其中nh是样本中标题的数量。然后,对于给定的保留级别,我们将两个类S={“正”、“负”、“中和”和Q={“高”、“低”}关联到每个标题Ljj,对于j=1,2,nh,根据以下规则:-lj,S=“负”,如果rj∈ (-∞, “\'rneg],“阳性”,如果是rj∈ []RPO,∞), “中性”,如果rj∈ (\'rneg,\'RPO),-lj,Q=“高”,如果rj∈ [“嗯,∞) 和“低”,如果rj∈ [0,\'rhigh)。阈值水平\'RPO,\'rnegand\'rhigh被定义为无条件回报分布的分位数,即P(rt<\'rneg)=0.025,P(rt>\'RPO)=0.025,和Prt</rhigh= 0.025.regr essor building过程的第二部分是对FactSet在样本期收集的51266条新闻标题中的每个单词进行分类。对于健康分类,我们首先寻找“积极”和“消极”波动性词,然后搜索“高”和“低”波动性词。通过将每个词应用到它所属的标题中最常见的类别,对其进行了初步分类。通常情况下,我们在每个标题lj中给每个单词w赋值,j=1,2,与每个单词ω出现频率最高的标题相关的S和Q的情态。根据Das(?),为了只保留有意义的单词,随后使用Fishe r判别统计量对每个单词进行搜索。

22
大多数88 在职认证  发表于 2022-5-7 02:13:05
假设我是两个类别中的一个类别,S={“正”、“负”、“中性”},Q={“高”、“低”},le tuibe是单词w出现在类别i的一条主线上的平均次数,mi,jbe是单词w出现在类别i的一条直线上的次数,那么Fisher判别统计量定义为asF(w)=(1/3)Pi6=k(ui)- uk)PiPj,mi- uj)/ (Pini),(14)表示之前分类的任何单词w。Fisher判别统计量为每个单词提供了一个分数,该分数说明了分类的程度,我们将单词保持在可接受的F(w)水平。在本程序结束时,我们将259个单词归类为“好”,239个单词归类为“坏”,366个单词归类为“高”。我们注意到“好”或“坏”的词也可以是“高”,但“高”的词并不一定是“好”或“坏”的。基于前面的单词分类,我们构建了以下三个回归系数:“POS”、“NEG”和“HIGH”,衡量市场情绪的变化。三个回归变量s中的每一个都代表出现在区间(t)中的每个类别的字数- 1,t]。因此,将这些回归因素纳入条件方差动态中,可以根据来自新闻的新情绪信息进行改变。我们还考虑了另外两个协变量:“LAGVOL”代表滞后的卷,而“NUMB”代表间隔内的总字数(t- 1,t]。“POS”、“NEG”和“HIGH”代表市场情绪,“NUMB”和“LAGVOL”代表信息量。Theregres或“NUMB”只是将单词总数作为信息到达的代理。应该注意的是,它与回归系数“Pos”、“NEG”和“HIGH”的总和并不一致,因为即使没有分类的单词也会被考虑在单词总数中。

23
大多数88 在职认证  发表于 2022-5-7 02:13:09
回归者“麻木”也解释了特定机构或部门的新闻活动。事实上,它没有提供任何关于新闻性质的信息,而是将市场利益考虑到特定的机构或部门。Theregres sor“LAGVOL”只是timet的累计销量,并说明了市场活跃性。尤其是,它代表了投资者对特定机构或部门的兴趣。K alev和Duong(2004)中也使用了滞后量。为了将这些回归用于条件波动动力学,回归者的时间戳必须与5分钟的对数收益序列一致。因此,在时间t处,每一个回归器“POS”、“NEG”、“HIGH”、“NUMB”和“LAGVOL”都应该考虑区间(t)中的信息到达- 1,t]生成日志–返回时间t,rt。对于所有考虑的分布误差和波动性规格,我们建立了MIV(信息量)模型,其中包括变量“NUMB”和“LAGVOL”,以及MSE(情绪)模型,其中包括“POS”、“NEG”和“HIGH”协变量。MIVS规范反映了信息流的数量,可被视为衡量投资者对该机构或行业的兴趣。尽管如此,米维斯还是一个很好的候选人,可以改善对大型市场走势的预测。MSE规范是对情绪的衡量,有助于反映不同类型新闻的不同市场反应。这两个规范与未考虑任何外部信息的Naiver模型MNES进行了比较。表B.3和B.4报告了所有已构建回归方程的描述性统计数据。回归器序列中的高峰度(例如,见表B.3中的回归器“NUMB”)可能与金融时间序列通常报告的高峰度有关。

24
mingdashike22 在职认证  发表于 2022-5-7 02:13:11
事实上,根据Clark(1973)的MDH假设,收益的方差是信息流动率的函数。更有趣的是,reg ressor s表现出更高水平的自相关性,尤其是在滞后95时,它与一个交易日以5分钟的频率重合。这一现象可能是由于通宵新闻的op e n——市场插补造成的。事实上,在高频率的时间范围内,新闻过程与波动过程具有非常相似的季节性模式:有关更全面的讨论,请参见Gencay等人(2001)和Kalev e.al(2011)。6.3. 实证结果在本节中,我们将讨论通过将模型与我们的数据集(包括斯托克欧洲600指数的19个行业)进行匹配而获得的结果。对于每个部门,将不同的波动动力学、误差项分布和第6.2节中讨论的协变量组合在一起,对属于初始集的模型进行比较。比较VaR预测的一个简单方法是实际值与预期值(A/E),定义为在特定时间范围内实现的VaR超标与其“先验”预期值之间的比率。表B.5报告了两个风险值置信水平τ=1%和τ=0.1%下所有比较模型的A/E比率。表B.5显示,τ=0.1%的高A/E水平通常与高斯规格有关,反映出其不足以捕捉大的价格波动。反过来,对于学生-t误差分布,我们观察到A/E水平接近1。此外,对于分位数密集度τ=(1%,0.1%)和信息量(MIV)或市场情绪(MSE)模型,A/E比率的报告值更接近1。

25
何人来此 在职认证  发表于 2022-5-7 02:13:15
更深入的研究表明,对于τ=1%的情况,MN模型仅在3种情况下表现优异,而在12种情况下,考虑信息量提高了VaR的预测能力。此外,如表B.5所述,即使对于τ=0.1%,原始模型MNoutp也只在两种情况下表现出包括去变量的特性,而MIVand MSE报告的A/Elevels是19的15倍。违规收益率(AD)的大小也很重要,因为它提供了VaR违规情况下预期损失的度量。表B.6报告了McAleer和da Ve iga(2008)考虑的违反退货的最大广告。我们可以看到,对于所有考虑的行业,MIVand MSE规格的最大AD值低于原始规格。这意味着,在高密度(τ=1%)和极端密度(τ=0.1%)情况下,考虑信息有助于减少最大AD损失。更有趣的是,要注意这个结果如何独立于波动性动力学或误差分布规范的选择。根据另一份报告的分析,我们发现,根据AIC和BIC信息标准(这些结果可根据要求提供),包含信息流也可以提高信息的总体质量。对于GARCH–动力学和误差分布的六种组合中的每一种,Mivandmes规范报告的AIC和BIC水平较低。

26
何人来此 在职认证  发表于 2022-5-7 02:13:18
此外,模型MIVand MSE的标准化绝对残差的ACF表明,与模型MN相比,每日季节模式显著减少。再次说明信息流,解释通常影响高频金融时间序列的波动模式。表B.7、B.8和B.9报告了Kupiec(1995年)的无条件覆盖率(UC)测试、Christo Offerse n(1998年)的条件覆盖率(CC)测试以及Engle和Mangane lli(2004年)的动态分位数(DQ)测试,其置信水平为5%。在置信水平τ=1%时,新闻信息的包含不会报告任何判别结果。相反,表B.7、B.8和B.9中报告的极端VaR置信水平τ=0.1%的结果证实,选择误差项的重尾分布具有很强的判别性。此外,对于τ=0.1%的情况,对于原始规范MN,两种检验的无效假设被拒绝的频率更高。从未报告的样本参数估计分析(可根据要求提供给作者)中,我们发现,对于某些行业,与条件平均动态相关的参数似乎没有统计学意义。这本质上意味着,对于这些序列,高频数据经常显示的众所周知的负序列自相关系数不存在。正如Gencay等人(2001)所述,这种现象可能与构造高频序列所采用的程序有关。

27
大多数88 在职认证  发表于 2022-5-7 02:13:21
在成瘾方面,我们的结果表明,一些与外源回归相关的参数似乎在统计上并不显著,这并不代表本研究的问题,因为我们的重点是极端损失预测,而不是描述整个回报行为。关于误差分布的规格,我们还通过估计De Luca和Loper Fi do(20 04)引入的歪斜GARCH规格来测试不对称性的存在。特别是,我们考虑了Fernandez和Steel(1998)的下降机制,该机制保证了似然函数的规律性。对于所有考虑的扇区,估计的s hap e参数都等于1,表明倾斜分布崩溃为对称分布。在下一节中,我们将报告模型置信集程序的结果。6.4. MCS程序的应用在本节中,我们讨论了应用Hansen(20 03)和Hansen等人(2011)的MCS程序获得的结果。在表B.1中,我们报告了在MC S程序结束时,每个部门和每个不同的专业属于SM的模型数量,即^M*1.-α. 很明显,一个小的最终模型集意味着该程序具有高度的区分性,即性能差的模型被消除。相反,一组大的最终模式ls意味着在比较模型中没有不同性能的统计差异。如表B.1所示,MCS程序报告了大多数行业以及两个风险密集度τ=(1%,0.1%)的高度判别结果。比较两个置信水平的结果,我们发现,对于τ=0.1%,最终集仅包含7个发生率,而对于τ=1%,则包含16个发生率。

28
kedemingshi 在职认证  发表于 2022-5-7 02:13:24
这意味着,使用MCS程序,充分预测极端风险值水平的模型集(如0.1%的联合水平所暗示的模型)低于预测更高风险值水平的模型集。这一结果与只有少数模式能够预测重大损失的想法一致。此外,从表B.1中可以清楚地看出,在执行MCS程序时,最常出现在最终集合^M中的模型*1.-α是MIV。这意味着在波动性动力学中添加信息量代理,可以提高模型预测重大损失的能力。表B.10报告了每个协变量规格的实际超预期(A/E)超越率和在属于最佳最终集的模型上平均的最大违反广告回报率*1.-α由MCS程序提供。我们观察到,在MCS程序不区分模型的情况下,平均A/E比率报告了不确定的结果,而平均最大违反广告的损失表明,对于大多数考虑的行业,sp规定是首选的。最后,我们观察到,对于所有考虑的行业,在ADmetric模型下,特定的MIVcorres池始终是表现最佳的模型。6.5. VaR组合结果第5节介绍的VaR组合技术的主要目的是提供一种实用工具,将不同模型在给定分位数水平τ下的VaR预测进行组合。MCS程序确保了一组模型的可用性,该模型在所选损失函数下,具有在所需分位数水平预测VaR的相同能力。这些模型提供的VaR预测随后可以用作前面详述的VaR组合技术的主要组成部分。为了测试使用拟议技术和MCS流程的益处,我们报告了使用两种不同VaR预测组合的简单比较。

29
nandehutu2022 在职认证  发表于 2022-5-7 02:13:27
第一个VaR预测只是对MCSVaRτ、avgt+1 | t=m模型中的单个VaR进行平均*M*Xj=1VaRτj,t+1 | t,(15)对于t=1,2,T第二个模型VaR预测是通过应用等式(11)和(12)中提出的VaR组合技术得出的。表B.1 1报告了两种eCast组合方法的平均值和最大AD,以及两种风险值水平τ=(1%,0.1%)。检查表B。11可以看到使用MCS程序和建议的Va R c组合技术而不是简单地平均可用模型的好处。对于所有考虑的行业和信心水平,动态VaR组合方法VaRτ,dynt+1 | t报告的最大ADV值几乎比简单VaR平均值VaRτ,dynt+1 | t报告的值低50%。这表明建议的VaR组合技术有助于减少违反VaR的回报的巨大和极端绝对偏差。从表B.11的第6列至第9列可以看出,提议的技术也有助于降低VaR违规回报的平均AD,从风险管理的角度来看,这一点尤其相关,因为降低平均AD对应于发生较低的预期服务水平。在图C.1和图C.2中,我们报告了单个模型VaRτj,t+1 | t,对于j=1,2,M*, 通过静态平均VaRτ、avgt+1 |和动态VaRτ、di nt+1 |序列获得的VaRforecast。如前所述,VaR组合技术提供了可用VaR序列的动态线性凸组合;图C.1和C.2显示了这一点,其中重新报告了几个VaR预测序列,以及VaRτ、avgt+1|t(灰色虚线)和VaRτ、dynt+1|t(红色虚线)。

30
可人4 在职认证  发表于 2022-5-7 02:13:31
由于动态VaR组合的自回归参数是通过最小化Gonzalez–Riviera等人(2004)的非对称损失函数来估计的,因此得出的组合VaR序列比静态VaRτ、avgt+1 | t序列更能抵抗异常值。例如,我们注意到,高度非线性且对异常值高度敏感的模型,例如EGARCH(图C.1中的thinblue线),有时会导致错误的VaR预测。然而,由于它们有助于描述条件方差过程的其他复杂财务动态,因此在动态加权平均中使用它们很重要。因此,我们提出的VaR组合技术产生了一种实用工具,用于解释几种模型,防止VaR预测产生异常结果。此外,图C.2将静态VaR组合(灰色虚线)与使用我们的动态技术获得的组合进行了比较,其中所有模型都属于初始集M(红色虚线),或者只有模型属于MCS最终集M*1.-α(暗虚线)被考虑在内。图C.2显示,动态方法与MCSprocedure(暗虚线)相结合,提供了更保守的VaR估计,尤其是在出现极端下降的情况下。7.结论在本研究中,我们调查了信息新闻的量化指标是否可以改善波动率模型,以预测在高频采样的金融时间序列中经常观察到的极端金融回报。为了解决这个问题,我们从“FactSet”提供的原始信息流开始,构建了三个基本情绪指数来衡量“积极”、“消极”和“高”波动性词汇的影响。这项研究考虑了按照“事实集”分类,在各个部门以高频、随后的大范围取样的所有theSTOXX Europe 600指数成分。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-18 23:23