楼主: mingdashike22
426 19

[量化金融] 基于惩罚样条的半参数随机波动率建模 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-25 10:42:56
这与以下事实有关:基系数系统地向估计分布的尾部衰减,这将需要自适应的平滑量,而不是全局平滑参数。作为实现这种适应性的简单而有效的策略,我们考虑B样条基密度与尾部之间的距离越来越宽,而不是常见的等距规格。由于我们仍然依赖(8)中的未加权差异惩罚,这有效地增加了分布尾部的惩罚。2.3推论2.3.1参数估计使用正向算法可以非常快速地评估(8)中给出的惩罚对数可能性。因此,在典型情况下,即使对于高m,惩罚对数似然的数值最大化也是可行的,因此非常接近(3)中的似然;第4节给出了一些计算时间。由于表达式(8)的第一部分不受数值过流的影响,因此需要计算其对数,因为我们处理的是矩阵积,因此需要计算其对数。然而,解决这个问题的技术是标准的:西葫芦和麦克唐纳(2009)描述了一种简单的缩放策略,用于计算HMM类型矩阵乘积可能性的对数(参见他们的第3章)。在实践中,还必须选择m的值、对数波动率过程中使用的区间数,以及中考虑的可能gt值的范围8–预印数值积分。根据我们的经验,估计值通常稳定在50左右(参见Langrock et al.,2012;Langrock and King,2013)。GT的最小值和最大值必须选择足够大的值,以覆盖对数挥发过程的基本域,但不能太大,以保持网格的有效性。

12
mingdashike22 在职认证  发表于 2022-6-25 10:42:59
Langrock等人(2012年)对此问题提供了更多指导。数值最大化中的另一个技术问题是局部极大值问题:有时,数值搜索可能无法找到最大似然估计,而返回局部极大值。解决这个问题的最佳方法似乎是使用许多不同的初始值集,以发现和验证全局最大值。对于潜在对数波动过程的参数和εt的密度,可以使用参数引导进行不确定性量化,但计算负担相对较高。2.3.2平滑参数的选择交叉验证技术可用于选择平滑参数。对于给定的日志返回序列,我们建议生成C个随机分区,以便在每个分区中,适当百分比的观测值形成校准样本,而剩余的观测值构成验证样本。对于每个C分区和任何给定λ,然后通过仅使用校准样本估计参数来校准模型(将验证样本中的数据点视为缺失数据)。随后,可在验证样本上使用适当的取芯规则(Gneiting和Raftery,2007),以评估给定λ的校准模型。为便于计算,我们将校准阶段确定的模型下验证样本的对数似然性(现在处理校准样本中的数据点,请丢失数据)作为关注分数。从一些预先指定的可能的平滑参数集,例如{2n | n=r,r+1,…,s},其中r和s是整数,然后我们在所有C交叉验证样本中选择平均得分最高的λ。

13
大多数88 在职认证  发表于 2022-6-25 10:43:01
样本数量C需要足够高,以给出有意义的分数,但不能太高,以使该方法在计算上可行。在我们的实际数据分析(见下文)中,考虑C=40个样本可以得到稳定的结果,但在计算上是可行的9–预印本2.3.3模型检查我们已经看到,HMM正向算法的使用提供了一种评估SV模型可能性的有效且方便的方法。HMM机制也可以用来检查给定模型的拟合优度。继西葫芦和MacDonald(2009)之后,我们考虑一步超前预测伪残差,该残差由byrt=Φ给出-1.F(yt | yt-1,yt-2.y).这里Φ表示标准正态分布的累积分布函数,和f(yt | yt-1,yt-2.y) 是Yt的累积分布函数,给定截至时间t的所有观测值- 1、使用HMM类型近似,可以写成asF(yt | yt-1,yt-2.y)≈mXi=1ζiF(yt | gt=b*i) (9)=mXi=1ζiZyt-∞经验值(-b*i/2)fε(x exp(-b*i/2))dx,其中ζi是向量|αt的第i个条目-1.Ohm/(|αt-1) ,定义为▄αt-1=δP(y)OhmP(y)Ohm · · · OhmP(yt-1) ,t=2,T,带δ,P(yk)和Ohm 定义如上所述。这些|αt构成与HMM前向概率类似的SV模型;有关后者的更多详细信息,请参见附录。由于对数波动率过程的离散化,所以(9)中给出的表示仅为近似值,但就可能性而言,该近似值的精度也可以通过增加m来任意精确。在SV模型中,Kim et al.(1998)首次使用了此类残差。如果拟合模型正确,则伪残差为标准正态分布。

14
mingdashike22 在职认证  发表于 2022-6-25 10:43:04
因此,预测伪残差可用于识别极值,并可通过分位数-分位数图或正态性正式测试等方法检查模型的一般适用性。2.3.4解编码再次基于现有的HMM机制,可以使用维特比算法(一种高效的动态规划)获得潜在对数波动率的估计值10–印前算法,用于计算最有可能引起HMM观察的马尔可夫链状态序列(参见Langrock等人,2012年,或Zucchiniand MacDonald,2009年第5章)。3模拟实验为了生成符合上述许多程式化事实的人工数据,我们使用如(2)所示的SV模型,φ=0.98,σ=0.1,εt指定为εt=0.02(ζ1,t- 1) αt(ζ2,t+1)1-αt+0.006,其中ζ1和ζ2分别是具有6和8个自由度的Student-t随机变量和αtare iid Bernoulli变量的相互独立iid序列,每个变量的概率为0.35。该规范导致了偏态和细态分布(偏态≈ -0.22; 峰度≈ 3.58),平均值为零。有关此分布形状的说明,请参见图1。对于该模型,我们进行了200次模拟运行,每次运行产生的观测值T=4000。在每次运行中,所生成序列的最终1000个观测值仅用于评估各种模型的预测能力,这些模型之前被用于前3000个观测值。

15
何人来此 在职认证  发表于 2022-6-25 10:43:07
为了使相当广泛的模拟研究可行,我们没有在每次模拟运行中对平滑参数λ进行交叉验证。相反,我们仅在10次初步模拟运行中运行交叉验证,尝试值256、512、1024、2048、4096和8192,然后在主要200次模拟运行中,以初步运行中交叉验证最常选择的值固定λ(即λ=1024)。该过程产生了良好的性能(见下文),但事实上,通过在每次模拟运行中进行交叉验证,结果可能会得到进一步改进。我们设定K=15,得到了31个B样条基密度,用于估计。为了获得半参数模型SVsp的基准,我们还使用第2.1节中描述的基于HMM的离散化方法,进一步拟合了基本模型SV和SVtto每个生成的序列。对于SVspmodel,参数φ和σ的样本平均估计值分别为0.978(样本标准误差:0.007)和0.103(0.017)。对于SV/SVT模型,参数φ和σ的样本平均估计值分别为0.972/0.977(样本标准误差:0.010/0.007)和0.117/0.102(0.023/0.017)。SVmodel低估了持久性参数,高估了日志的方差11–预印本波动过程。后者是由于模型无法捕捉到真实条件分布的轻微超额峰度(参见第4.2节中关于此问题的进一步评论)。相比之下,SVspmodel和SVtmodel都得出了与对数波动率过程相关的参数的近似无偏估计值。关于条件过程yt,图1显示了ε的真实pdf和使用非参数方法估计的相应pdf。

16
大多数88 在职认证  发表于 2022-6-25 10:43:10
从图中我们可以看出,所有200家公司似乎都很合理。-0.10-0.05 0.00 0.05 0.100 5 10 15xfε(x)图1:模拟实验中考虑的εt的真实密度(红线)及其使用非参数方法(灰线)获得的200估计值。在给定场景中,我们还评估了以SV、SV和SVsp模型为代表的三种不同建模方法的预测能力。我们通过计算,在每次模拟运行中,以及在前3000次观测的三种模型下,最后1000次观测的对数似然得分,用llki(SV)、llki(SVt)和llki(SVsp)表示,其中i表示模拟运行。将这些分数与使用真实模型(即实际用于生成艺术数据的模型)时获得的相应分数进行比较;我们用llki(SVtrue)表示该分数。在本模拟实验中,在偏态和细态条件分布下,SV、SV和SVspon获得的分数与获得的分数之间的平均差异12–另一方面,当Xi=1时,获得真实模型的预印本llki(SV)- llki(SVtrue)= -9.48,Xi=1llki(SVt)- llki(SVtrue)= -9.14和xi=1llki(SVsp)- llki(SVtrue)= -3.52.因此,平均而言,SVspmodel对样本外数据的拟合程度大大优于其参数对应数据。考虑到单独的模拟运行,SVspmodel在200个案例中有176个案例的预测性能优于两个参数模型。考虑到为εt选择的分布的偏度,这些结果并不令人惊讶。

17
kedemingshi 在职认证  发表于 2022-6-25 10:43:12
尽管如此,它们确实证明了我们方法的实际可行性和潜在益处。为了获得这些结果的基准,我们进行了第二次模拟研究,其中我们从SVT模型生成数据,将ε(0)tin(1)指定为具有10个自由度且u=0.02的Student-t分布。除了条件分布的真实分布外,第二次模拟实验与第一次完全相同。考虑到SV、SV和SVsp三种模型,我们得出Xi=1llki(SV)- llki(SVtrue)= -5.44,Xi=1llki(SVt)- llki(SVtrue)= -0.62和xi=1llki(SVsp)- llki(SVtrue)= -2.30 .在这种情况下,在200个案例中,有152个案例中(正确的)SVT模型比其他两个模型具有更好的预测性能,而在164个案例中,SVspmodel仍然比(错误的)SVmodel具有更好的预测性能。因此,总的来说,结果表明a)在真实条件分布偏离正态分布或Student-t分布施加的函数形式的情况下,非参数方法有可能显著提高预测能力(例如,如果它是倾斜的),andb)在适当的情况下,它可以执行几乎与参数化建模方法一样好的建模方法13–预打印4股票回报应用程序4.1数据SVspmodel用于三只股票(即索尼公司、默克公司和微软公司)以及股票指数标准普尔500指数的一系列每日日志回报。2000年1月3日至2013年8月1日期间的调整收盘价pt从“Finance.yahoo.com”下载,每日日志收益计算为yt=log(pt/pt-1).

18
可人4 在职认证  发表于 2022-6-25 10:43:15
为了评估各种模型的样本外预测性能,我们将四个系列分为两部分:o样本期:2000年1月3日至2007年12月31日,o样本期:2008年1月2日至2013年8月1日。划分日期选择在最近的金融危机爆发之前,这场危机最终导致雷曼兄弟控股公司(LehmanBrothersHoldingsneneneba Inc.)于2008年9月倒闭。所分析的四个时间序列如图2所示。-0.3-0.2-0.1 0.0 0.1 0.2 0.3SONLOG-返回日期2000年1月3日2007年12月31日2013年8月1日-0.3-0.2-0.1 0.0 0.1 0.2 0.3Merck&Co.log-返回日期2000年1月3日2007年12月31日2013年8月1日-0.3-0.2-0.1 0.0 0.1 0.2 0.3微软件日志-返回日期2000年1月3日2007年12月31日2013年8月1日-0.3-0.2-0.1 0.0 0.1 0.2 0.3S和P 500对数-return03 2000年1月31日2007年12月31日2013年8月1日图2:三家公司(索尼、默克和微软)股票和标准普尔500指数的对数回报时间序列;样本内和样本外周期的观察结果分别以黑色和灰色显示14–预打印为了进行比较,我们还使用相同的划分方法将四个系列中的两个基本模型SV和SVtto分别划分为样本期内和样本期外。所有模型仅使用样本期内的数据进行拟合,样本期外的数据用于评估三种不同模型的预测性能(详情如下)。4.2结果对于四个系列中的每一个,SVspmodel使用K=20,因此41个B样条密度来表示对数波动过程离散化中εt,m=100区间的密度,并对区间[B,B]中的对数波动值进行数值积分=[-5, 5]. 如第2.3.2节所述,使用校准阶段90%的数据点,在每个C=40个交叉验证分区中,通过交叉验证选择平滑参数。

19
mingdashike22 在职认证  发表于 2022-6-25 10:43:18
在2.7 GHz和4 GB RAM的i7 CPU上安装SVspmodel每个系列大约需要10分钟。表1:将三个不同模型与所考虑的四系列对数收益进行拟合时得出的参数估计。SVSVtSVsp^φ^σ^β^φ^β^ν^φ^σ索尼0.957 0.249 0.019 0.992 0.092 0.017 6.698 0.994 0.087Merck 0.825 0.545 0.014 0.992 0.086 0.012 4.670 0 0.993 0.078Microsoft 0.979 0.239 0.015 0.994 0.116 0.014 6.305 0.994 0.122S&P 500 0.991 0.114 0.010 0.992 0.104 0.009 25.724 0.998 0.088参数φ、σ、,表1给出了四个系列的β(仅适用于SVT模型的SVand)和ν(仅适用于SVT模型)。SV模型的结果说明了条件正态分布捕捉极端收益的问题。特别是对于默克公司的股票,在2004年9月30日,罗非昔布从市场上撤出造成了巨大损失,SV表现不佳。事实上,SVmodel处理-0.31发生在市场平静时期,这意味着对数波动率过程具有非常高的不确定性(用高σ和小φ表示)。这导致波动性不平稳。相比之下,SVtmodel的leptokurtic条件分布导致φ和σ的估计更为合理,结果更为相似15–预印本与SVspmodel的预印本相同。在这两个模型中,极端收益分配到收益分布的尾部,而不是像SVmodel中那样分配到对数波动过程中的大幅跳跃。其他两个股票收益率系列也存在相同的模式,尽管程度较小。仅对于股票指数S&P 500,使用SV模型得到的σ估计值与使用SV和SVsp得到的相应估计值具有相同的量级。

20
何人来此 在职认证  发表于 2022-6-25 10:43:21
这并不奇怪,因为在指数中,个别公司的极端回报所起的作用较小,这也反映在已建立的SVT模型中条件分布的尾部要轻得多。-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25索尼-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25默克公司。-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25 Microsoft-0.10-0.05 0.00 0.05 0.100 5 10 15 20 25标准普尔500图3:使用非参数方法测试的ε的条件密度,考虑四个对数收益序列,以及通过线性组合(灰色)生成这些密度的基础加权B样条线。图3显示了所考虑的四个系列的SVspmodel中条件分布的非参数估计密度。非参数估计分布fε的偏度为-0.73, -2.61, -1.23和-索尼、默克、微软和P 500分别为0.77。这与归因于金融资产的程式化事实相一致,金融资产传播了损益不对称,因为大规模的提取通常超过大规模的向上移动(Cont,2001),导致条件分布中的左尾更多16–预印本,而非右尾(Durham,2006)。然而,在某种程度上,偏斜也源于靠近中心的不对称密度,这一现象可能与我们的模型中杠杆效应的缺失有关。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 14:08