楼主: kedemingshi
1573 29

[量化金融] 金融极值识别的变点方法 [推广有奖]

11
能者818 在职认证  发表于 2022-6-14 05:14:36
先验平均数uuare放置在第90个数据分位数周围,而先验方差σuare的选择使得95%的先验可信度区间先验地从第50个到第99个数据分位数,符号π(uj)=fN(uu,σu)。正如Stephens(1994)所建议的那样,变化点是受限制{τ<τ<····<τk}的非信息离散均匀分布:π(τ,…,τk)=τ(1≤τ<τ)τ- τ(τ<τ<τ)··n- τk-2(τk-2<τk-1.≤n) 。堆积密度参数Φ的先验分布取决于所使用的模型。在这两种情况下,权重(p,…,pl)都给出了一个带有参数(1,…,1)的Dirichlet先验。对于CMGPD模型,Gammas的参数是非信息性的,如Innascemento et al.(2012)所示。每个形状参数ηjis给定一个独立的伽马先验π(ηj)=fG(ηj | cj/dj,cj),其中cj,dj∈ 选择R+可以提供较大的先验方差。伽马平均值的优先级为π(u,…,ul)=KQj∈[l] 图(uj | aj,bj)(0<u<···<ul),其中fIG是反γ密度,K是归一化常数,选择aj和bj给出较大的先验方差。设置平均值的订单限制以确保可识别性。对于CMNPD模型,正常混合参数(uj,δj)j的先验值∈[l] 如下所示。平均值的先验值是在方差为π(u,…,ul |δ,…,δl)=Qj的条件下给出的∈[l] fN(uj | j/M,(α/δj))(u<····<ul),其中选择α给出较大的先验方差,M=最大值(x,···,xn)。这种选择的动机是财务回报的对称性,以确保均值接近0,以及可识别性问题。每个混合方差独立地给出伽马分布,即π(δj)=fG(δj | cj/dj,cj),其中超参数再次被选择为非信息性。转换点极值混合模型的总体先验可写成π(Φ,ψ,τ)=π(Φ)π(τ)Qj∈[k] π(ξj,σj)π(uj)。

12
能者818 在职认证  发表于 2022-6-14 05:14:39
使用的所有先验知识都是非信息性的,为估计过程中的可能性影响提供了足够的灵活性。2.4后验推断对于样本x=(x,…,xn)CMGPDKL模型的对数后验islogπ(Φ,ψ,τ| x)∝Xj公司∈[k] Xt:Xt≤ujlog公司Xz公司∈[l] pzfG(xt |uz,ηz)(t∈(τj-1,τj])+Xj∈[k] Xt:Xt>ujlog1.-Xz公司∈[h] pzFG(uj |uz,ηz)(t∈(τj-1,τj])+Xj∈[k] Xt:Xt>ujlog(g(Xt |ψj))(t∈(τj-1,τj])+对数(π(Φ,ψ,τ))(4)对于CMNPDKL模型,通过分别用fn和fn替换fGandFGin方程(4),可以很容易地推导出对数后验值。推理不能以解析方式进行,使用了近似的MCMC算法。参数被划分为块,块的更新遵循大都市广播的步骤,因为完整的条件句没有可识别的形式。按照Roberts和Rosenthal(2009)的建议,通过自适应算法调整提案差异。附录A中给出了详细信息。所有算法都在R中实现。财务极端回报的总结可以直接从后验分布计算出来。用于衡量财务损失的常用指标是风险价值(VaR)和预期缺口(ES)。VaR通常定义为在固定天数的持有期内足以弥补投资组合损失的风险资本。它对应于特定时间范围内的PTH分位数,并表示为VaRp。ES或尾部条件预期被定义为超过特定VARP的潜在损失规模。它对应于观察值大于VaRp的期望条件。对于转换点极值混合模型,第j区域中的预期差额采用闭合形式ESP=V aRtp,j1- ξj+σj- ξjuj1- ξj,(5)其中V aRp,jis为工况j中的风险值。VaR和ES都是模型参数的高度非线性函数(见方程(3)和(5))。

13
mingdashike22 在职认证  发表于 2022-6-14 05:14:42
因此,它们的后验分布不能用解析方法推导出来。然而,MCMC机械使我们能够推导出模型参数任何函数的近似分布,如我们在第4.3节模拟研究中的应用所示。接下来进行模拟研究有两个主要目的:第一,评估所提出模型的可识别性;其次,验证模型选择标准。为简洁起见,我们在此报告了CMGPD和MGPD生成的数据的结果,但CMNPD和MNPD的结果相同。生成了5000个观测值的两个样本,一个来自MGPD,另一个来自CMGPD,其中下标表示混合组分的数量,上标表示极端状态的数量。在这两个数据集中,混合物参数为(u,u)=(2,8),(η,η)=(4,8)和(p,p)=(2/3,1/3)。对于MGPD数据,GPD参数固定在ξ=0.4和σ=2,而阈值放置在伽马混合物的第85个理论分位数(7.99)。CMGPDhad变化点位置的模拟观测值τ={2000,3500}。0 5000 10000 150000.0 0.2 0.4 0.6迭代权重0 5000 10000 150000.0 0.2 0.4 0.6迭代权重图3:跟踪符合CMGPD模拟数据的CMGPD(左)和CMGPD(右)的权重p图-虚线对应真实参数值。选择与制度相关的GPD,以便(ξ,ξ,ξ)=(-0.4,0,0.4),(σ,σ,σ)=(0.5,1,1.5)和区域阈值分别位于第80(6.99)、85(7.99)和90(9.22)个理论分位数。仿真在处理器为2,7 GHz Intel Core i5和8 Gb RAM的PC上运行。对于所有模拟,代码运行了15000次迭代,老化5000次,细化10次,后验样本为1000次。

14
nandehutu2022 在职认证  发表于 2022-6-14 05:14:45
通过运行具有不同起始值的平行链,然后比较得出的估计值来评估收敛性。有关这些的详细信息,请在线查看。在所有情况下,为了减少要比较的模型数量,首先通过对各种l的MGPDland CMGPDLF进行拟合来选择混合组分的数量。正如Nascimento等人(2012)和Leonelli和Gamerman(2017)所述,由于模拟研究中所有后验样本的权重,可以从后验样本中检索到正确的混合组分数量,以及第4节中报告的真实数据应用程序,可通过以下链接获得:https://lattanzichiara.shinyapps.io/CMGPDdt2chains/(CMGPDdata),https://lattanzichiara.shinyapps.io/MGPD2chains/(MGPDdata),https://lattanzichiara.shinyapps.io/CMGPD-NDAQ/(纳斯达克数据)和https://lattanzichiara.shinyapps.io/CMNPD-RBS/(苏格兰皇家银行数据)。表1:通过模拟数据集估计的模型的模型选择标准。数据模型BIC DIC WAICMCMGDMGPD21212.55 21148.29 22037.79CMGPDCMGPD20414.07 20361.69 20366.07CMGPDCMGPD20309.73 20255.33 20262.07CMGPDCMGPD20320.46 20255.15 20263.74MGPDMGPD22654.83 22592.46 22595.90MGPDCMGPD22649.49 22574.54 22597.84图4:CMGPD(左)、CMGPD(中)和CMGPD(右)变化点位置的后直方图。真实值为τ=2000和τ=3500,用虚线表示。完全垂直线:后指。额外组件估计为零。图3显示了这一点,其中第三个分量的权重迅速收敛到零。固定了混合物的数量后,将具有不同变化点数量的模型拟合到模拟数据集。正如Leonelli和Gamerman(2017)所讨论的那样,标准模型选择标准通常无法在设定极值混合模型时确定正确的模型。

15
何人来此 在职认证  发表于 2022-6-14 05:14:48
如表1所示,BIC(Schwarz,1978)和DIC(Spiegelhalter等人,2002)未能选择真实模型。相反,Watanabe的WAIC(2010年)始终首选真实发电模型。该标准对于混合物和不可识别模型尤其稳健。当使用非表2拟合CMGPD时,可以进一步确定状态的数量:与尾部密度(ξ、σ和u)相关的模拟CMGPD参数的后验均值和95%可信区间。参数ξ=-0.4ξ=0ξ=0.4MGPD0.30(0.23,0.39)CMGPD-0.38(-0.43,-0.31)0.01(-0.11,0.18)0.49(0.29,0.76)参数σ=0.5σ=1σ=1.5MGPD1.09(0.99,1.21)CMGPD0.48(0.43,0.53)0.98(0.80,1.19)1.52(1.12,1.96)参数u=6.99 u=7.99 u=9.222 MGPD6.99(6.99,7.00)CMGPD6.99(6.99,7.00)8.02(8.00,8.04)9.07(8.80,9.25)必要的变更点,因为超出的位置收敛到非常接近0的值,n或另一个变化点,取决于MCMC算法的起始值,如Nascimento和Moura e Silva(2017)所述。这可以在图4中看到。当根据CMGPDdata估计CMGPDmodel时,两个变化点被正确识别,而第三个变化点位于接近零的位置。相反,设置一个CMGPDmodelover CMGPDdata,唯一的变化点是围绕真正的变化点估计的,给出了更大的分布变化:在这种情况下,t=2000的变化点与从上界分布到无界分布的转换相关。直方图进一步表明,在所有情况下,关于最强变化点的不确定性是有限的,而位于t=3500的变化点的后验分布具有较大的方差。

16
能者818 在职认证  发表于 2022-6-14 05:14:52
当在MGPD数据上建立CMGPD模型时,可以得出同样的结论,因为唯一变化点的后验平均值为40.25,可信区间为95%(9,88)。在确保能够正确选择真实模型后,接下来将研究参数的可识别性。正如Nascimento等人(2012年)所述,所有批量参数都得到了正确估计(有关更多详细信息,请参阅在线应用程序)。但更有趣的是,表3:真实参数ξ=0.4,σ=2,u=8.02的模拟MGPDdata参数的后验平均值和95%可信区间。ξξσuuMGPD0.43(0.33,0.55)2.02(1.76,2.46)8.28(7.82,9.44)CMGPD0.09(-0.50,0.59)0.45(0.35,0.59)1.72(0.15,4.01)2.04(1.77,2.52)9.07(7.37,12.93)8.39(8.00,9.37)2表明,在使用CMGPDmodel模拟的数据时,可以很好地估计所有工况的尾部参数。当在该数据集上建立MGPD模型时,每个尾部参数都是围绕所有制度的平均值进行估计的。当MGPDModel在MGPDdata上拟合时,与非空寄存器相关的参数可以很好地估计真实的尾部参数,如表3所示。考虑到使用非信息先验,有一个明确的迹象表明,似然度可以正确识别真实值。特别是,尾部参数的估计非常成功地证明了模型恢复不同尾部行为的能力。4应用程序4.1纳斯达克绝对每日收益考虑的第一个财务数据集包括1996年1月至2017年12月纳斯达克股票价值的每日收益。每日收益按其绝对值考虑,为了避免过度收益聚类,考虑了总计2768个观测值的2天最大集。

17
nandehutu2022 在职认证  发表于 2022-6-14 05:14:55
目的是通过比较MGPD和CMGPD方法,估计复合指数随时间的波动性。首先调查了大量伽马成分的数量,发现只需要一种成分。为了选择转换点的数量,我们采用表4:根据纳斯达克数据估计的模型的模型选择标准。模型BIC DIC WAICMGPD7527.67 7488.93 7329.53CMGPD7492.97 7408.87 7203.87CMGPD6696.19 6615.71 6776.51CMGPD6719.61 6612.89 7106.92表5:根据纳斯达克数据估计的模型转换点位置的后验分布。τττCMGPD918(7021036)1336(9211599)1602(15811636)1645(16261673)CMGPD323(318327)915(907929)1594(15881598)1681(16681695)2049(20082094)CMGPD4(1,8)323(318326)915(907926)1595(15901598)1679(16671690)2029(20062092)信息标准和后方位置。如表4所示,最可靠的WAIC标准支持具有6种制度的amodel,其中还包括证据表明变更点方法优于静态方法。表5证实了这一点,报告了变化点的后验分布:第一个CMGPD变化点的后验平均值等于4,因此给出了一个空状态,并确认了CMGPD的最优性。如图5所示,CMGPDmodel的变化点后均值位于1998年7月、2003年4月、2008年8月、2009年5月和2012年4月。可以注意到低/中波动率和高波动率制度的交替,因此预计会有不同的尾部参数和回报。

18
nandehutu2022 在职认证  发表于 2022-6-14 05:14:58
波动性较高的制度与过去20年震撼美国股市的主要事件同时发生:第二种制度显示了互联网泡沫破裂和911后的不稳定,而第四种制度则是2008年次贷危机的直接后果。表6总结了CMGPDtail参数的后验分布。此0 2 4 6 8 10 12 14年收益率1996年1月4日1998年6月2000年9月2002年12月2004年3月2007年6月2009年9月2011年12月2013年3月2016图5:纳斯达克2天最大绝对收益率时间序列,使用CMGPD估计变化点。证明了我们区分高波动期和低波动期的方法的灵活性:在第2个和第4个三个制度中,规模σ和形状ξ参数的估计值大于所有其他制度,表明市场压力水平较高。估计阈值的值表明了该数据集的一种特殊行为:第一、第三、第五、第六三个机制更像GPD分布,而不是MGPD。因此,这些制度的估计阈值非常接近于0。拟议模型的灵活性使我们能够在没有任何复杂性的情况下考虑到这一点。t的预期回报水平∈ 图6中报告了每个估计状态的[101000]。CMGPD估计值及其95%置信区间(阴影区)与所有制度下的经验值相当接近,因此证实了我们估计程序的优点。使用MGPD和GPD(使用CMGPD估计的阈值)进一步估计收益。

19
kedemingshi 在职认证  发表于 2022-6-14 05:15:01
CMGPD估计值总是更接近表6:CMGPD相对于纳斯达克数据的ξ、σ、u的后验分布。ξξξξξ-0.08(-0.12,-0.08)0.04(-0.06,0.19)-0.30(-0.35,-0.22)0.04(-0.3,0.63)-0.12(-0.20,-0.002)-0.14(-0.20,-0.06)σσσσσσ0.95(0.83,1.08)1.42(1.12,1.66)1.25(1.09,1.42)2.00(1.04,3.28)1.32(1.06,1.59)0.86(0.78,0.97)uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu根据苏格兰皇家银行数据估算。模型BIC DIC WAICMNPD22425.55 22422.27 22289.93CMNPD21510.00 21413.04 21462.25CMNPD21424.62 21356.38 21381.23CMNPD21429.53 21345.34 21392.57经验值高于MGPD值。此外,GPD估计值在所有阈值较低的情况下都与MGPD估计值重叠,而在其他情况下,CMGPD明显优于GPD。因此,将整个数据集分为极端情况,使用后验估计会更好。4.2苏格兰皇家银行每日报告考虑的第二个财务数据集是2000年1月至2018年2月苏格兰皇家银行(RBS)股票每日报告,共4635次观察。在这种情况下,正收益和负收益同时建模,我们重点关注下尾的估计(为方便起见,采用了符号变化)。现在研究了MNPD和CMNPD模型的估计效率。

20
何人来此 在职认证  发表于 2022-6-14 05:15:04
对于所有模型,首先观察到图6:一系列t∈ [101000],对应于0.90到0.999之间的分位数。-20 0 20 40 60年收益率2000年1月11日2001年9月2003年8月2005年6月2007年4月2009年2月2011年1月2013年11月2014年9月2016图7:RBS每日负收益率时间序列,使用CMNPD估计变化点。只需要一个法线分量。同样,与静态方法相比,所有模型选择标准都支持转换点方法,如表7所示,WAIC选择了具有6种制度的模型。第一个CMNPD变化点的后验分布也证实了这一点,该变化点位于序列的开头,后验平均值为61%和95%可信区间(36,78)。图7中报告了根据CMNPD模型估计的状态。估计的变化点位于2003年4月、2007年7月、2010年6月、2011年6月和2012年8月,后验分布如图8所示。这些制度显示了不同程度的损失,表8中报告了尾部参数。第一个和最后三个区域代表中等规模亏损期,而第二个区域代表高度稳定期。第三种制度是迄今为止最有趣的:它与英国历史上最严重的银行倒闭同时发生,最终导致2009年1月的蓝色星期一崩盘。索引频率1000 1500 2000 2500 30000 50 100 150 200 250 300图8:根据RBS数据确定的CMNP变更点位置的后柱状图。虚线表示后均值。得益于英国政府发布的英国银行救助计划,该银行最终得以生存。这是唯一具有明显重尾行为的区域(ξ>0)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 12:25