楼主: 可人4
558 19

[量化金融] 基于惩罚样条的半参数随机波动率建模 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-14 14:29:53
这与这样一个事实有关,即基系数系统地向估计分布的尾部衰减,这将需要自适应的平滑量,而不是全局平滑参数。作为实现这种适应性的一种简单而有效的策略,我们考虑了B样条基密度与尾部之间越来越宽的距离,而不是常见的等距规格。由于我们仍然依赖(8)中的未加权差异惩罚,这有效地增加了分布尾部的惩罚。2.3推论2。3.1参数估计使用正向算法可以非常快速地评估(8)中给出的惩罚对数概率。因此,在典型情况下,即使对于高m,惩罚对数似然的数值最大化也是可行的,因此非常接近(3)中的似然;第4节给出了一些计算时间。由于表达式(8)的第一部分不受数值过流的影响,因此需要计算其对数,因为我们处理的是矩阵积,因此需要计算对数。然而,解决这个问题的技术是标准的:西葫芦和麦克唐纳(2009)描述了一种简单的缩放策略,用于计算HMM类型矩阵乘积可能性的对数(参见他们的第3章)。在实践中,还必须选择m的值、对数波动性过程中使用的区间数,以及表中考虑的可能gt值的范围8–预印本数值积分。根据我们的经验,估计值通常稳定在50左右(参见Langrock等人,2012年;Langrock和King,2013年)。GT的最小值和最大值必须选择足够大,以覆盖对数挥发过程的基本域,但不能太大,以保持网格的充分性。

12
大多数88 在职认证  发表于 2022-5-14 14:29:56
Langrock等人(2012年)对此问题提供了更多指导。数值最大化的另一个技术问题是局部极大值问题:有时,数值搜索可能无法找到最大似然估计,而返回局部极大值。解决这个问题的最佳方法似乎是使用许多不同的初始值集,以确定和验证全局最大值。对于潜在对数波动过程的参数和εt的密度,可以使用参数引导进行不确定性量化,但计算负担相对较高。2.3.2平滑参数的选择交叉验证技术可用于选择平滑参数。对于给定的日志返回序列,我们建议生成C个随机分区,以便在每个分区中,适当百分比的观测值构成校准样本,而剩余的观测值构成验证样本。对于每个C分区和任何给定的λ,然后通过仅使用校准样本(将验证样本中的数据点视为缺失数据)估计参数来校准模型。随后,可在验证样本上使用适当的取芯规则(Gneiting and Raftery,2007),以评估给定λ的校准模型。为了计算方便,我们考虑在校准阶段安装的模型下,验证样本(现在处理校准样本中的数据点)的对数似然性作为关注分数。从预先指定的一组可能的平滑参数中,例如,{2n | n=r,r+1,…,s},其中r和s是整数,然后我们在所有C交叉验证样本中选择平均分数最高的λ。

13
可人4 在职认证  发表于 2022-5-14 14:29:59
样本数量C需要足够高,以给出有意义的分数,但不能太高,以使该方法在计算上可行。在我们的实际数据分析(见下文)中,考虑C=40个样本会产生稳定的结果,但在计算上是可行的9–预印本2。3.3模型检查我们已经看到,HMM正向算法的使用提供了一种评估SV模型可能性的有效且方便的方法。HMM机器也可以用来检查给定模型的拟合优度。继西葫芦和麦克唐纳(2009)之后,我们考虑提前一步预测伪残差,给出byrt=Φ-1.F(yt | yt-1,yt-2.y).这里Φ表示标准正态分布的累积分布函数,和f(yt | yt-1,yt-2.y) 是给定截至时间t的所有观测值的累积分布函数- 1.使用HMM类型近似,这可以写成asF(yt | yt)-1,yt-2.y)≈mXi=1ζ如果(yt | gt=b*i) (9)=mXi=1ζiZyt-∞经验(-B*i/2)fε(x exp(-B*i/2)dx,其中ζi是向量|αt的第i个条目-1.Ohm/(∑αt)-1) ,定义为△t-1=δP(y)OhmP(y)Ohm · · · OhmP(yt)-1) ,t=2,T,带δ,P(yk)和Ohm 定义如上所述。这些∧αt构成了与HMM前向概率类似的SV模型;有关后者的更多详细信息,请参见附录。由于对数波动过程的离散化,在(9)中给出的表示仅为近似值,但就可能性而言,这种近似值的精度也可以通过增加m来任意精确。在SV模型中,Kim等人(1998)首次使用了这种残差。如果拟合模型正确,则伪残差分布为标准正态分布。

14
能者818 在职认证  发表于 2022-5-14 14:30:03
因此,预测伪残差可用于识别极值,并可通过分位数图或正态性正式测试等方法检查模型的总体适用性。2.3.4解编码再次基于现有的HMM机制,可以使用维特比算法(Viterbi algorithm,这是一种高效的动态规划)获得潜在对数波动率的估计值10–用于计算最有可能引起HMM观察的马尔可夫链状态序列的印前算法(见Langrock等人,2012年,或西葫芦和麦克唐纳,2009年第5章)。3模拟实验为了生成符合上述许多风格化事实的艺术数据,我们使用如(2)所示的SV模型,φ=0.98,σ=0.1,εt指定为εt=0.02(ζ1,t- 1) αt(ζ2,t+1)1-αt+0.006,其中ζ1和ζ2分别是具有6个和8个自由度的Student-t随机变量的相互独立的iid序列,以及αtare iid Bernoulli变量,每个变量的值为1,概率为0.35。这种规格会导致偏态和细态分布(偏态≈ -0.22; 峰度≈ 3.58)平均值为零。有关此分布形状的说明,请参见图1。对于该模型,我们进行了200次模拟运行,每次运行产生的观测值T=4000。在每次运行中,生成序列的最后1000个观测值仅用于评估各种模型的预测能力,这些模型之前被用于前3000个观测值。

15
nandehutu2022 在职认证  发表于 2022-5-14 14:30:06
为了使相当广泛的模拟研究可行,我们没有在每次模拟运行中对平滑参数λ进行交叉验证。相反,我们只在10次初步模拟运行中进行交叉验证,尝试256、512、1024、2048、4096和8192的值,然后将主要200次模拟运行的λ固定在初步运行中交叉验证最常选择的值(即λ=1024)。该过程产生了良好的性能(见下文),但事实上,通过在每次模拟运行中进行交叉验证,结果可能会得到进一步改进。我们设定K=15,得到31个B样条基密度,用于估计。为了获得半参数模型SVsp的基准,我们还使用第2.1节中描述的基于HMM的离散化方法,对每个生成的序列进一步拟合了基本模型SV和SVT。对于SVSP模型,参数φ和σ的样本平均估计值分别为0.978(样本标准误差:0.007)和0.103(0.017)。对于SV/SVT模型,参数φ和σ的样本平均估计值分别为0.972/0.977(样本标准误差:0.010/0.007)和0.117/0.102(0.023/0.017)。SVM模型低估了持久性参数,高估了对数的方差11–预印过程。后者是由于模型无法捕捉到真实条件分布的轻微过度峰度(参见第4.2节中关于该问题的进一步评论)。相比之下,SVspmodel和SVT Model对与对数波动过程相关的参数进行了近似无偏的估计。关于条件过程yt,图1显示了ε的真实pdf和使用非参数方法估计的相应pdf。

16
mingdashike22 在职认证  发表于 2022-5-14 14:30:10
从图中我们可以看到,所有200个功能似乎都很合理。-0.10-0.05 0.00 0.05 0.100 5 10 15xfε(x)图1:模拟实验中考虑的εt的真实密度(红线)及其使用非参数方法(灰线)获得的估计值。在给定的场景中,我们还评估了三种不同建模方法的预测能力,它们由SV、SV和SVsp模型表示。我们通过计算,在每次模拟运行中,以及在前3000次观测的三种模型下,最后1000次观测的对数似然分数,用llki(SV)、llki(SVt)和llki(SVsp)表示,i表示模拟运行。将这些分数与使用真实模型(即实际用于生成艺术数据的模型)时获得的相应分数进行比较;我们用llki(SVtrue)表示该分数。在这个模拟实验中,在偏态和细态条件分布下,SV、SV和SVspon一方面获得的分数与获得的分数之间的平均差异12–另一方面,当Xi=1时,获得了真实模型的预印本llki(SV)- llki(SVtrue)= -9.48,Xi=1llki(高级副总裁)- llki(SVtrue)= -9.14和xi=1llki(SVsp)- llki(SVtrue)= -3.52.因此,平均而言,SVspmodel对样本外数据的拟合程度远远好于其参数模型。考虑到单独的模拟运行,SVspmodel在200个案例中有176个案例的预测性能优于两个参数模型。考虑到为εt选择的分布的偏度,这些结果并不令人惊讶。

17
nandehutu2022 在职认证  发表于 2022-5-14 14:30:13
尽管如此,它们确实证明了我们方法的实际可行性和潜在好处。为了获得这些结果的基准,我们进行了第二次模拟研究,其中我们从SVT模型生成数据,将ε(0)tin(1)指定为具有10个自由度且u=0.02的Student-t分布。除了条件分布的真实分布外,第二个模拟实验与第一个完全相同。考虑到SV、SV和SVsp三个模型,我们得到Xi=1llki(SV)- llki(SVtrue)= -5.44,Xi=1llki(高级副总裁)- llki(SVtrue)= -0.62和xi=1llki(SVsp)- llki(SVtrue)= -2.30 .在这种情况下,在200个案例中,有152个案例中(正确的)SVT模型比其他两个模型具有更好的预测性能,而在164个案例中,SVspmodel仍然比(错误的)SVT模型具有更好的预测性能。因此,总的来说,结果表明a)在真实条件分布偏离正态分布或Student-t分布施加的函数形式的情况下(例如,如果它是倾斜的),非参数方法可以显著提高预测能力,andb)在适当的情况下,它几乎可以执行参数化建模方法13–预印本4申请退库4。1数据SVspmodel适用于索尼公司、默克公司和微软公司三只股票以及标准普尔500指数的一系列每日日志回报。2000年1月3日至2013年8月1日期间的调整收盘价pt从“finance.yahoo.com”下载,每日日志收益计算为yt=log(pt/pt)-1).

18
能者818 在职认证  发表于 2022-5-14 14:30:16
为了评估各种模型的样本外预测性能,我们将四个系列分为两部分:o样本期:2000年1月3日至2007年12月31日,o样本期:2008年1月2日至2013年8月1日。划分日期选择在最近金融危机爆发之前,这场危机最终导致雷曼兄弟控股公司(LehmanBrothersHoldings Inc.)于2008年9月倒闭。所分析的四个时间序列如图2所示。-0.3-0.2-0.1 0.0 0.1 0.2 0.3 Sonlog-返回日期2000年1月3日2007年12月31日2013年8月1日-0.3-0.2-0.1 0.0 0.1 0.2 0.3Merck&Co.log-返回日期2000年1月3日2007年12月31日2013年8月1日-0.3-0.2-0.1 0.0 0.1 0.2 0.3微软测井-返回日期2000年1月3日2007年12月31日2013年8月1日-0.3-0.2-0.1 0.0 0.1 0.2 0.3S&P 500log-return03 2000年1月31日2007年12月1日2013年8月图2:三家公司(索尼、默克和微软)股票和标准普尔500指数的对数收益时间序列;样本内和样本外周期的观察结果分别以黑色和灰色显示14–预印本为了进行比较,我们还分别对四个系列中的两个基本模型SV和SVtto进行了设置,使用相同的划分,将其划分为样本期内和样本期外。所有模型仅使用样本期内的数据进行拟合,样本期外的数据用于评估三种不同模型的预测性能(如下所述)。4.2结果对于四个系列中的每一个,SVSPM模型均使用K=20,因此使用41个B样条密度来表示εt的密度,m=对数波动过程离散化中的100个区间,对区间[b,b]中的对数波动值进行数值积分=[-5, 5]. 通过交叉验证选择平滑参数,如第2.3.2节所述,在每个C=40交叉验证分区中,使用校准阶段90%的数据点。

19
何人来此 在职认证  发表于 2022-5-14 14:30:20
在2.7 GHz和4 GB RAM的i7 CPU上安装SVspmodel每个系列大约需要10分钟。表1:将三种不同模型与所考虑的四系列对数收益进行拟合时获得的参数估计。据英国国家统计局(SVSVSVSVSSSVSP(7月)的(7月)的(7月)的(7月)的(7月)的(7月)索尼0.957 0.249 0.0.0.019 0.0 0.9 0.9 0.0 0 0.0 0.0 0.0 0.0.0.0.0.0.0.0 0.0.0.0.0 0 0 0 0.0 0.0.0.0 0.0.0 0.0.0.0 0 0.0.0 0 0 0 0.078 0.0 0 0.0.0 0 0 0 0.0 0 0 0 0.0 0 0 0 0 0.979 9 0.0.0.0 0 0 0.0 0 0 0 0 0 0 0.0 0.0 0 0 0.0 0 0 0 0 0.0 0 0 0 0 0 0 0.0 0 0.0 0 0 0 0 0 0 0.0 0 0 0 0 0 0 0.参数φ,σ,表1给出了四个系列的β(仅适用于SVT模型的SVand)和ν(仅适用于SVT模型)。SVM模型的结果说明了条件正态分布捕捉极端收益的问题。特别是对于默克公司的股票,在2004年9月30日,罗非昔布从市场上的退出造成了巨大的损失,SVC表现糟糕。事实上,SVM模型处理相关极端负反馈的唯一方法-0.31发生在市场平静时期,是指对数波动过程具有非常高的不确定性(用高σ和小φ表示)。这导致了波动性的不平稳。相比之下,SVT模型的轻量级条件性分布导致φ和σ的估计更为合理,结果为sim.——15–预印本与SVspmodel的预印本相同。在这两个模型中,极端收益被分配到收益分布的尾部,而不是像SVM模型那样分配到对数波动过程中的大跳跃。其他两个股票收益率序列也发现了同样的模式——尽管程度较小。仅对于股票指数S&P 500,使用SV模型得到的σ估计值与使用SV和SVsp得到的相应估计值具有相同的大小。

20
何人来此 在职认证  发表于 2022-5-14 14:30:23
这并不令人惊讶,因为在指数中,个别公司的极端回报所起的作用较小,这也反映在已建立的SVT模型中条件分布的尾部要轻得多。-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25索尼-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25默克公司。-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25 Microsoft-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25S&P 500图3:使用非参数方法测试的ε的条件密度,考虑四个对数收益序列,以及通过线性组合(灰色)生成这些密度的基础加权B样条。图3显示了所考虑的四个系列的SVSP模型中条件分布的非参数估计密度。非参数估计分布fε的偏度为-0.73, -2.61, -1.23和-索尼、默克、微软和P 500分别为0.77。这与金融资产的程式化事实一致,金融资产传播了收益/损失的不对称性,因为大的提取通常超过大的向上移动(Cont,2001),导致条件分布中的左尾更大16–比右尾更具印前效果(达勒姆,2006年)。然而,在某种程度上,偏斜也源于靠近中心的不对称密度,这一现象可能与我们的模型中杠杆效应的缺失有关。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 14:10