楼主: nandehutu2022
2081 40

[量化金融] 基于贝叶斯模型平均的半参数GARCH算法 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-6-1 06:50:37
重点是比较条件波动率样本内和样本外估计中估计的系数函数和损失度量的结构特征。(3)和表1给出了比较参数模型的模型定义。每个模型的创新分布为Fsdt,ν。通过截断似然,约束参数以确保{rt}的平稳性和{σt}的正性,类似于(15)。对于每个参数模型,除ν外,大多数参数都使用fl-prior,其中prior与ν成比例-2、从四个数据生成过程(DGP)生成独立的T观测序列,标记为DGP 1、DGP 2、DGP 3和DGP 4。DGP可以(3)的功能系数形式写入,DGP i用于∈ {1,…,4},给定byrt=σti、 t,σt=0.1+gi(i、 t型-1) σt-1,其中{i、 t}是来自Fsdt的i.i.d.序列,8表示i∈ {1,2},来自Fsdt,5表示i∈ {3, 4}.系数函数g(·),g(·)规定如下。g级() = 1.1- 0.48( + 0.77)++ 0.58( + 0.473)+;g级() = 0.85 + 0.1;g级() = 0.82 + 0.15[6/(3 + )];g级() = 0.8+[0.1+0.15I(-∞,0)()].函数g(·)是一条二次样条曲线,在-0.77和-0.473处有两个节点。g(·)的动机是构建一个具有结构特征的系数函数,这些结构特征无法被大多数参数化GARCH模型完全捕获,但从实证角度来看,并非完全不现实。例如,g(·)意味着相对较小的负回报对次日条件波动率的影响不同于相同幅度的小正回报率,而一旦回报率超过某个阈值,负回报率的影响停止随其幅度增长。函数g(·)、g(·)和g(·)分别对应于一阶GARCH、Beta-t和GJR模型的系数函数。

22
何人来此 在职认证  发表于 2022-6-1 06:50:40
可以检查所有DGP是否满足(4)中的协方差平稳性条件,如下所示:(1,t)]=0.977,E[克(2,t)]=0.95,E[克(3,t)]=0.97,andE[克(4,t)]=0.975。我们从两个DGP中的每一个生成长度为T=4001的Nsim=500个独立序列。使用每个生成序列的前4000个观测值计算条件波动率的后验平均估计值(以及本节中列出的其他感兴趣量);每个序列的最后一次观察是为了量化样本外性能。为了通过(13)计算SP-GARCH模型的后验均值估计,采用了第3.3节详述的自适应MCMC采样算法。samplingalgorithm运行5.5×10次迭代,其中在计算后验平均值估计时,忽略了前0.5×10次老化迭代。潜在节点k,karechosen作为标准化学生t分布的分位数,具有8个自由度,水平为0.1,分别为0.9;(21)中的步长参数π设置为0.1;(18)中的收缩参数σβ设置为2500。为了计算参数模型的后验平均值估计,我们使用独立采样器和多元高斯混合方案,如(22)所示。将高斯混合的平均向量和基本协方差矩阵设置为sameadaptive RWM采样器生成的导频链的样本平均值和协方差矩阵,如第3.3节中采样算法步骤2(b)中使用的样本平均值和协方差矩阵。独立采样器对于参数GARCH模型在Chen和So(2006)以及Chen et al。

23
能者818 在职认证  发表于 2022-6-1 06:50:43
(2012).图4为每个模型绘制了效率函数500个后验平均值估计值的蒙特卡罗(MC)平均值,以及95%的MC置信区间。MC平均值和MC置信区间均使用等距网格逐点计算[-4,4],间距为0.01。对于DGP 1,只有SP GARCHis能够捕获真系数函数的基本特征。有趣的是,GJR和Beta-t模型都试图捕捉到接近零的g(·)的不对称性,其中发现了大多数创新,但遗漏了大型创新的重要特征。对于与GARCH模型相对应的DGP 2,除Beta-t之外的所有模型都能够近似于简单的二次函数。Beta-t模型表现不佳,因为如果新息分布的尾比高斯分布的尾更重,则其系数函数偏离二次函数。相反,当真实模型为Beta-t时,对于DGP 3,二次模型(GARCHand GJR)提供的近似值较差,因为对于小型创新,g(·)的增长速度比二次模型快,但对于大型创新,g(·)的增长速度比二次模型慢得多。SP GARCHis能够很好地近似于g(·),但创新分布的尾部除外,该尾部数据稀疏。最后,当真实模型为GJR时,SP-GARCH可以很好地学习g(·)的形状。

24
能者818 在职认证  发表于 2022-6-1 06:50:46
预期的是,近似值会越来越偏向 深入创新分布的尾部。图4:每个图包含效率函数500个后验平均值估计值的MC平均值(红色虚线)、逐点95%MC置信带(粉色阴影区域)和真实函数(黑线)。为了比较两个DGP模型之间条件挥发度的后验平均值估计的质量,考虑了Lploss的样本内和样本外版本。对于第i个模拟序列,定义了样本内Lploss,对于p≥ 1,asL(In)p,i=“T- 1吨-1Xt=1 |σi,t- σi,t | p#1/p,其中^σi,是对第i个模拟序列进行tth观察时的波动率的后验平均估计,σi,是相应的真实波动率;对于不同序列的持续观测,确定了样本外Lploss,对于p≥ 1,asL(Out)p=“NsimNsimXi=1σi,T- σi,T | p#1/p。注意,样本外Lploss是按横截面计算的,而不是按时间序列计算的。案例p∈ 本研究考虑了{1,2}:当p=2时,损失测度L(·)p对应于通常的均方根误差(RMSE);当p=1时,L(·)p对应于通常的平均绝对误差(MAE)。报告了每个HP实现的500个样本内Lploss的MC平均值∈ {1,2},表2中的每个模型和每个DGP,其中L(in)pdenotes(1/500)Pi=1L(in)p,i。表3是表2的样本外类似物。我们进行了一些观察:(i)将表2与图4进行比较,很明显,条件波动率估计对系数函数的错误描述很敏感。(ii)与参数模型相比,SP-GARCH对此类错误规范具有鲁棒性,因为它可以适应广泛的系数函数。

25
kedemingshi 在职认证  发表于 2022-6-1 06:50:50
(iii)对于某些类别的效率函数,产生的效率损失(由于未使用正确的参数模型)非常小。例如,当真正的DGP isGARCH时,SP-GARCH与GJR模型一样有效,因为GJR的自由度仅比GARCH多一点,而SP-GARCH是一个更灵活的模型。(iv)样本外保留了SP-GARCH的相对准确性。这表明精度增益不是由过度拟合引起的。DGP 1 DGP 2 DGP 3 DGP 4’L(In)’L(In)’L(In)’L(In)’L(In)’L(In)’L(In)’L(In)’L(In)GARCH 0.296 0.229 0.035 0.026 0.228 0.124 0.196 0.115GJR 0.292 0.219 0.041 0.030 0.229 0.126 0.063 0.039Beta-t 0.267 0.201 0.087 0.054 0.058 0.044 0.268 0.116SP-GARCH 0.093 0.069 0.040 0.030 0.102 0.066 0.096 0.055表2:估计和真实条件波动率之间500个样本内Lploss值的MC平均值。DGP 1 DGP 2 DGP 3 DGP 4L(Out)L(Out)L(Out)L(Out)L(Out)L(Out)L(Out)L(Out)GARCH 0.308 0.233 0.037 0.026 0.265 0.138 0.171 0.107GJR 0.319 0.227 0.042 0.030 0.266 0.137 0.073 0.042Beta-t 0.266 0.205 0.050 0 0.062 0.043 0.204 0.106SP-GARCH 0.094 0.068 0.041 0.029 0.137 0.069 0.096 0.056表3:估计和真实条件波动率之间的样本外Lploss值。5实证研究作为一项实证研究,SP-GARCH模型适用于五个股票市场指数和五只股票的每日收益。目的是通过分析估计的系数函数,深入了解每个序列的条件可变过程。投资股票市场指数为:标准普尔500指数(美国)、富时100指数(英国)、DAX指数(德国)、日经225指数(日本)和恒生指数(香港);五只股票分别是:苹果、ARM、英特尔、Nvidia和SanDisk。

26
nandehutu2022 在职认证  发表于 2022-6-1 06:50:53
获取每个指数或股票的每日日志回报样本。除ARM和Nvidia外,大多数样本于1996年1月开始采集,其中ARM和Nvidia的样本分别于1998年4月和1999年1月开始采集。所有样本于2015年11月结束。Nvidia的样本量最小,为4236个观测值,FTSEHA的样本量最大,为5176个观测值。对于每个样本,使用第3.3节详述的MCMC采样算法计算系数函数的后验平均值估计和95%可信区间。潜在节点的顺序、采样算法的配置和超参数的值与第4节中用于模拟研究的相同。在图5中,绘制了十个样本中每个样本的系数函数的后验平均值估计值,以及逐点95%可信区间。令人惊讶的是,根据系数函数的结构特征,样本可以很容易地分为两组;股票指数的系数函数与单个股票的系数函数之间似乎存在着明显的区别。对于股票指数,函数似乎是二次函数,通过将minimumsaway从零移动产生不对称;对于单个股票,函数似乎是分段线性的,具有不对称性,这是由负创新和正创新具有不同陡度的斜率造成的。对于英特尔(Intel)和SanDisk等个别股票而言,出现大规模负面创新似乎也存在“门槛效应”。图5:股票指数和个股的系数函数的后验平均估计数(红色实线)和逐点95%可信区间(粉红色阴影区域)。ν和u的后文总结如表4所示。

27
能者818 在职认证  发表于 2022-6-1 06:50:56
对于每个参数样本组合,我们报告后验平均值(mean)和95%可信区间(Lower,Upper)。可以观察到,单个股票的创新分布比股票指数的创新分布具有更大的尾部,如ν的估计所示。u的估计值表明,dailyreturn过程的长期(无条件)平均值都是正的,但幅度很小,苹果的最大预期日回报率约为0.1%。νuMean Lower Upper Mean Lower UpperS&P 500 8.935 7.109 11.363 0.029 0.006 0.052FTSE 11.189 8.546 14.958 0.010-0.012 0.032DAX 11.498 8 8 8.688 15.576 0.052 0.022 0.081日经指数11.138 8.504 14.782 0.013-0.021 0.046恒生指数7.304 5.980 9.045 0.034 0.003 0.065苹果5.023 4 4 5.735 1 0.118 0.062 0.173臂4.666 4.089 5.338 0.061-0.006 0.126Intel 6.861 5.840 8.095 0.049 0.002 0.096Nvidia 4.930 4.3185.648 0.043-0.027 0.114SanDisk 4.191 3.732 4.709 0.049-0.022 0.120表4:股票指数和个股的ν和u的后验汇总。人们可能有兴趣估计回报过程的长期(无条件)波动性,作为长期每日风险的定量度量;σ=Var(rt)1/2。对于SP-GARCH模型,这可以使用(5)和(9)来完成。在图6中,通过在无条件波动率和无条件均值的乘积空间中绘制每个样本来生成散点图;{σ} × {u}. 该图有助于比较样本的长期每日风险回报率,这可能与投资组合中的资产相对应。

28
kedemingshi 在职认证  发表于 2022-6-1 06:50:59
从图中可以看出,与其他样本相比,DAX和Apple都表现出良好的风险回报特征<1 2 3 4 6 7 9700.020.040.060.080.10.12标准普尔500指数日经行Sengapplearmingtelnvidiasandisk图6:散点图,显示股票指数和个股无条件预期回报的后验平均数与相应无条件波动率的后验平均数。当抽样算法应用于实际数据时,为了说明构建的马尔可夫链的混合特性,当后验分布取决于苹果数据时,丢弃初始老化迭代后,在图7的面板(a)和(b)中,根据迭代计数减去5.5×10绘制维度b和β中链的实现值。看起来链条在两个维度上都稳定下来,可以快速混合。在面板(b)中,令人欣慰的是,该算法似乎能够有效地在多个模式之间切换,包括精确为零的点质量。面板(c)中的散点图显示了β带联合边缘后验分布的复杂景观。图7:马尔可夫链的迹线图和散点图,显示了苹果β带的边缘后验分布和联合边缘后验分布的实现。还可以检查二元向量的马尔可夫链的混合特性,即模型空间中的马尔可夫链。可视化此类链的样本路径(ortrace)的一种方法是,首先将K维二元向量m【i】的每个实现映射到标量τ【i】,对于i∈ {1,…,N},这样映射是一对一的,然后用τ[i]与i作图,对于i∈ {1,…,N}。通过将每个二进制向量视为K位二进制数,很容易找到这样的映射。

29
nandehutu2022 在职认证  发表于 2022-6-1 06:51:03
映射的标量是二进制数的十进制等价物。为了说明这一想法,该映射用于为标准普尔500和苹果公司生成图8中的跟踪图。对于这两个示例,链似乎在模型空间中快速混合。图8:模型空间中马尔可夫链的迹线图,显示了标准普尔500指数和苹果指数τ=n(m)的边缘后验分布样本,其中n:{0,1}K→n将二进制向量转换为非负十进制整数。SP-GARCH模型复杂性的一个简单度量是为回归样条线选择的节点数,由km=KXi=1mi给出。利用马尔可夫链的已实现二元向量,可以很容易地计算Km的边际后验概率。表5中报告了Km的每个样本的后验概率≤ 3、对于股票指数,最受青睐的模型是无节点模型;对于单个股票,更复杂的模型是首选的,因为大多数后验概率都在Km=2上。Km0 1 2 3S&P 500 0.991 0.009 0.000 0.000FTSE 0.987 0.013 0.000 0.000DAX 0.935 0.064 0.001 0.000日经0.762 0.236 0.002 0.000恒生0.957 0.042 0.001苹果0.000 0.009 0.976 0.015 ARM 0.000 0.313 0.672 0.015英特尔0.000 0.004 0.982 0.014Nvidia 0.000 0.135 0.851 0.014SanDisk 0.000 0.018 0.965 0.017表5:通过非零数量测量的模型复杂性的边际后验概率结系数。由于联合后验分布的多模态,图5中所示的估计系数函数的结构特征可能不是唯一的,并且我们的MCMC采样器没有有效地探索所有模式。

30
mingdashike22 在职认证  发表于 2022-6-1 06:51:06
这种可能性可能导致我们关于系数函数形状的结论无效。例如,可能存在一个参数化GARCH模型,该模型与SP-GARCH模型一样能很好地拟合数据,但对系数函数的估计在结构上有所不同。防止这种可能性的一种方法是,使用模型充分性度量将SP-GARCH与参数模型进行比较。我们需要确保在SP-GARCH下对系数函数的推断不同时,SP-GARCH能够更充分地描述数据。我们根据Spiegelhalter et al.(2002)的偏差信息准则(DIC)进行了模型比较研究,该准则可被视为Akaike信息准则(AIC)(Akaike,1973)的贝叶斯推广。theDIC的成功应用包括Berg et al.(2004)和Chan and Grant(2016)用于比较随机波动率模型,以及Ardia(2009)用于比较马尔可夫转换GARCH模型。在计算DIC时,可以同时获得模型fit和模型复杂性的度量。DIC最小的模型实现了最佳的IT复杂性权衡效果。通常,由于其高度复杂性,像SP-GARCH这样的柔性半参数模型在DIC下不会表现良好。然而,当更复杂的模型不能显著提高可能性(即模型t)时,拟议的BMA方法将导致后部肿块集中在更简单的模型上。因此,研究SP-GARCH在考虑到fit和复杂性的情况下如何与参数模型进行比较是一件有趣的事情。一些研究调查了潜在变量模型的DIC的定义和计算(Celeux等人,2006;Li等人,2013;Ardia,2009;Chan和Grant,2016),但尚未在BMA的背景下检查DIC。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 06:56