楼主: 能者818
1217 21

[量化金融] 金融密度预测:风险中性的综合比较 [推广有奖]

11
能者818 在职认证  发表于 2022-6-6 18:31:33
过滤后,我们获得了分布在254个月周期的6659个期权价格的数据集。横截面上的平均罢工次数为26次,从最少8次到最多72次不等。表1总结了optiondataset的统计信息。ITM和OTM期权的斜率不同,并针对每个到期日进行计算。在1996年10月之前,结算价格是使用恒定隐含波动率计算的(阿隆索、布兰科和鲁比奥,2005)。MEFF是西班牙的官方期货和期权交易所。IBEX 35期权的到期日不得短于每月。因此,使用较短的周期将导致预测缺乏直接期权报价的期限,需要强大的外推假设。另一方面,使用更长的到期周期将需要减少非重叠期的数量,并依赖流动性较低的后月合约。从数据集中删除市场价格不是罢工的凸函数和递减函数的看涨期权衍生等价合同。表1:IBEX 35选项数据选项类型Total numberAverage per dayMaximum per dayMinimum per dayCallsPutsOverallMoneynessF/KNo的汇总统计信息。期权中(%)深度OTM看跌期权>1.1026.36OTM看跌期权1.03-1.1021.37靠近货币0.97-1-0322.47OTM看涨期权0.90-0.9723.14深度OTM看涨期权<0.906.67注:校准贝茨模型至少需要8个期权。因此,在七个观察日内,我们补充了货币期权合同的横截面,其最后交易价格与同期的买入和卖出价格一致。这导致增加了9个期权(样本的0.1%)3.2期货价格从1990年11月19日至2016年12月23日,每个月IBEX记录了35个期货价格。

12
nandehutu2022 在职认证  发表于 2022-6-6 18:31:37
与期权相反,前一个月IBEX 35期货的每日结算价格计算为17:29至17:30之间的市场交易量加权平均值。1992年10月6日记录的IBEX 35期货最低价格为1882,2007年12月11日达到的最高价格为15945.5。另外,在每个月到期日,MEFF通过平均IBEX 35指数的现货价格(从16:15到16:45),每分钟观察一次,来确定每个期货的最终结算价格。在我们的研究中,这些结算价格构成了theIBEX 35期权和期货的基础资产,因此用于评估所有预测方案的预测能力。3.3利率和分割对于1999年1月至2016年12月的观察期,我们采用1个月的利率。在早期,由于欧元银行同业拆借利率不可用,我们采用1个月的Mibor。在每个预测期内,使用相应的CT/360天计数惯例,一致应用所有利率。此外,期货合约的使用有利于使股息估计变得无关紧要;因此,股息相关的不确定性不会影响我们的密度预测。1992年7月21日之前,IBEX 35期货尚未交易。对于较早的日期,其回报率由西班牙IBEX 35回报率代表,其回测价格自1989年12月29日起可用。校准模型参数是在严格的事前基础上进行校准的,只考虑每个观测日期可用的当前或历史信息。4.1历史密度历史模型可根据过去价格的任何足够长的周期进行校准。虽然这提供了灵活性,但不同的校准窗口会产生不同的输入值,从而产生不同的密度预测。

13
何人来此 在职认证  发表于 2022-6-6 18:31:41
为了应对这种不确定性,我们考虑两个校准周期:(i)更短的6个月窗口和(ii)更长的5年周期。bootstrapping方法不需要任何统计校准,因为它只需要随机选择相关历史时期的回报。对于对数正态分布规范,从每个历史时期的收益中获得平均收益和标准偏差。接下来,通过最大似然估计(MLE)对基于ARCH的参数进行标定。即使真正的创新不是正常的,Bollerslev和Wooldridge(1992)表明,假设残差的高斯密度可以提供一致的参数值。因此,对于GARCH-N和GJR-FHS模型,通过最大化观测每个历史收益序列的对数可能性来估计参数,其由下式给出: 2 21ln/()tjjjjL  (11) 对于GARCH-t,我们采用两步估计过程。首先,从(11)中获得除数据外的所有参数的MLE值。然后,在Christoffersen(2012)之后,计算MLEofdis以匹配多余峰度残差为6/4d.对每个观测日期分别估计历史参数,从而对每个模型和观测窗口执行254次标定。最后,对于所有时间序列模型,使用校准动力学生成100000条价格路径,使用方程(4)。4.2. 风险中性密度RND从每个观察日的期权价格横截面中获得。对于对数正态分布模型,货币波动率是通过对每个横截面中最接近货币隐含波动率的两个变量进行线性插值来计算的。

14
能者818 在职认证  发表于 2022-6-6 18:31:44
在Heston、Bates和Variance Gamma模型中,通过最小化定价误差之和来校准参数。我们选择处理相对误差,这有效地为所有期权合同分配了类似的权重,从而在不同的罢工地区产生更一致的结果。表示在日期T可用的期权价格的数量,我们估计参数集这将每个随机模型的相对误差之和降至最低,因为我们还试图校准GARCH参数,同时使用GARCH(1,1)下样本收益的对数似然度和()tdresiduals。然而,这种方法并没有产生改进的预测结果。尽管绝对误差很受欢迎,但使用绝对误差会导致对更昂贵的ITM选项的权重过高,而对更便宜的OTM合同的权重过低,从而可能导致校准偏差。()1ttnciciisre(12) 式中,i表示横截面中每个期权的中端市场价格和()iC是使用参数集获得的模型相关值.  校准中包括对模型参数允许值的所有自然约束。对于VarianceGamma过程,我们还考虑了限制12/2v, 这是为了避免校准过程中的数值放大(参见Itkin,2010和Crisóstomo,2017)。按照此步骤,分别估计每个观测日期的风险中性参数,每个模型执行254次标定。最后,对于Malz(2014)实施Breeden-Litzenberger公式,我们采用astep size0.01tF, 这避免了预测密度中的负概率。有关容许参数值的描述,请参见Heston(1993)、Bates(1996)和Madan、Carr和Chang(1998)。5.

15
mingdashike22 在职认证  发表于 2022-6-6 18:31:47
密度预测验证评估金融密度并不是特别简单。虽然在经典的推断中,可以在类似的条件下重复实验,以评估它们是否符合特定的分布,但在财务预测中,只有一种实现可用于评估每个密度预测。解决这个问题的一种方法是使用集合预测,从而将一系列预测密度和相应的实现序列结合起来。然而,即使是集合,流动期权价格的有限可用性也使得很难生成大量非重叠预测。为了应对潜在的样本问题,我们评估了21年来所有密度方案的预测能力,从而分析了254个不重叠的月度周期。据我们所知,这是可比研究中最高的。2007年之前,大多数预测密度通过基于PIT的拟合优度分析进行评估。然而,PIT分析并不能提供有关每种竞争方法的准确性或其误差大小的信息。因此,我们用两个额外的评分规则来补充拟合优度分析:(i)对数评分,用于评估预测最终实现的每个模型的准确性;(ii)基于回归的CRP,根据预测误差对所有密度模式进行排序。5.1拟合优度分析Diebold、Gunther和Tay(1998)表明,概率预测序列与相应实现之间的统计一致性可以通过PIT分析进行评估。对于给定的日期,PIT表示观察到事后实现的事前分布的分位数。

16
能者818 在职认证  发表于 2022-6-6 18:31:50
因此,*()txttPIT f x dx(13) 直观地说,在一个明确规定的模型中,观察到的实现应该与预测分布的随机抽取不可区分,因此PitValue序列应该在(0,1)范围内均匀分布。然而,基于统一变量的统计测试对于小样本来说通常不够强大(Mitchell和Hall,2005)。因此,Berkowitz(2001)建议将PIT值重新格式化为转换序列(T-PIT),如果正确指定了预测密度,则应通过i.i.d.(0,1)变量形成转换序列。Berkowitz试验首先计算T-PIT值为1-()ttT-PIT-PIT接下来是AR(1)模型1-(-)t t t t t t PIT t PIT      (14) 估计使用似然比检验LR3=22((0,1,0)–(),,)LL联合评估均值、方差和序列相关性  ,  比较了严格模型的可能性,其中0, var(t)) = 1和0, 与一个无限制的。这种重新表述带来了与高斯变量相关的更强大的测试。然而,LR3测试并未直接解决T-PIT值的正常性问题。如果显示T-PITsequence 0和var(t)  =  1,但在更高的时刻是不正常的,Berkowitz的测试将无法检测到此类故障(Dowd,2004)。因此,我们用Kolmogorov-Smirnov(KS)和Jarque-Bera(JB)测试来补充THEL3。

17
nandehutu2022 在职认证  发表于 2022-6-6 18:31:53
KS测试检查T-PIT分布和a(0,1)变量之间的最大距离是否具有统计显著性,而JB测试考虑T-PIT值的偏度和峰度,评估LR3测试中未涵盖的较高力矩。5.2对数分数不同预测方案的准确性可通过使用事前密度评估的预期后实现的可能性进行比较。继Liu等人(2007)、Shackleton、Taylor和Yu(2010)以及Hog和Tsiaras(2011)之后,我们计算每个预测方案实现的对数可能性为1*log(())NtttL f x(15) 式中,Tf表示在观测日期计算的事前密度,txdenotes theex post implementation at time*t。对于每种方法,对数规则根据其事前发生概率为每个实现分配损失分数,并且通过将这些分数在整个样本上进行聚合,可以根据其样本外精确度对密度模型进行排序。此外,当所有模型都可能被错误指定时(如金融预测中的情况),根据Kullback-Leibler Information Criteria(KLIC)(Bao、Lee和Saltolu,2007),具有最大值的模型生成与真实生成密度最接近的预测密度。5.3连续排名概率分数对数分数考虑事后实现的可能性,但忽略任何其他概率质量。相反,CRP考虑了整个预测分布,测量了实际实现和所有其他概率结果之间的统计距离(Matheson和Winkler(1976))。

18
大多数88 在职认证  发表于 2022-6-6 18:31:56
因此,CRP对密度给出了很好的分数,这些密度赋予了与物化值接近但不完全相同的事前值很高的概率(Gneiting and Raftery(2007))。通过MCDFANDRCD表示预测模型和实现的累积分布,CRP如下所示: 2()()mrtCRPS CDF x CDF x dx(16) 其中:**0()1RTFOR x xCDF xfor x x(17) Kullback和Leibler(1951)Hersbach(2000)表明,CRP具有参数X的维度,该维度通过HDX进入微积分,从而有助于CRP解释为整个密度预测的平均绝对误差的推广。然而,在我们的实证样本中,IBEX 35期货的结算价格从1882年的最小值到15945.5的最大值不等。因此,根据观察日期,例如200个指数点的CRP可能有明显不同的解释,这阻碍了不同时期各个CRP值的一致性。因此,我们略微修改了CRP,以考虑返回偏差,而不是指数点。最后,为了汇总整个样本的CRP值,我们计算每种方法的基于平均回报的CRP,如下所示: 211()()Nrb m riCRPS CDF x CDF x dxN(18) 对于给定的预测方案,arbCRPSof 0.05可以解释为事后实现与所有事前概率质量之间的平均返回偏差为5%,从而提供了对竞争预测进行排序的直接方法。6、实证结果由于测试的变体数量较多,我们首先总结了不同的预测模式及其命名约定。我们首先考虑两种简单的历史方法:平均密度法(LN-HIS)和历史收益自举法(BTS)。

19
nandehutu2022 在职认证  发表于 2022-6-6 18:31:59
我们还评估了两个标准的GARCH模型,无论是正常的还是学生的t创新(GARCH-N/GARCH-t)。最后,我们用过滤历史模拟(GJR-FHS)测试了一个非对称GJR-GARCH模型。使用6个月(6m)或5年历史(5y)校准所有历史模型的所需参数。对于RND,我们再次考虑一个简单的对数正态模型(LN-ATM)。然后,我们评估了随机波动率模型(HESTON)和跳跃扩散过程(BATES)得到的密度。最后,我们考虑了Breeden-Litzenberger公式(BL-MALZ)的纯间断方差Gamma过程(VG)和theMalz(2014)实现。6.1坑柱状图目视检查通过简单检查坑柱状图,可以对事前密度方案和观察到的实现之间的一致性进行合理评估。在可靠的预测中,PIT值的直方图应类似于均匀分布,偏离水平线表示实现频率高于或低于exante预测的区域。图1显示了所有预测方案的PIT直方图。可以强调三个主要方面。首先,所有校准到6个月周期的历史方法都明显低估了重大损失的可能性。与exante概率(即水平虚线)相比,严重下行运动(即:最左侧的直方图条)的高发生率可以看出这一点。第二,尽管校准为5年期的模型改善了左尾拟合,但相反,它们将太多的概率定位为显著的上行运动。最显著的偏差出现在GARCH-t(5y)中,与预期概率相比,在右尾几乎没有观察到任何实现。

20
nandehutu2022 在职认证  发表于 2022-6-6 18:32:02
相比之下,GJR-FHS(5y)显示出合理的平面直方图,表明该模型在整个密度范围内产生一致的结果。第三,尽管RND方法被校准为相同的输入,但根据模型的动态,RND方法会产生显著不同的TOUTCOME。虽然贝茨模型生成了一个非常一致的直方图,但赫斯顿和BL-MALZ模型显示出很大的偏差,这两种模型都将太多的权重放在了左尾,而低估了分布的中心或右尾。6.2统计一致性:拟合优度测试一个良好指定的模型应同时通过Berkowitz、JB和KS统计测试,拒绝表明在以下任一方面偏离T-PIT正态性:(i)平均值、sigma或自相关,(ii)不对称性和峰度,或(iii)理论值和观察到的CDF之间的距离。表2和表3总结了拟合优度测试和T-PIT描述性统计的结果。图1:矿坑实现柱状图注:水平线表示每个密度区域的预期实现数量,垂直条表示实际观察数量。6.2.1历史方法在所有历史方案中,只有GJR-FHS(5y)和GARCH-N(5y)同时通过Berkowitz、JB和KS测试,显著性水平为5%。此外,GJR-FHS(5y)在所有拟合优度检验中表现出比GARCH-N(5y)更令人满意的p值,从而成为统计上最可靠的历史模型。在大多数历史模型中(10个模型中有6个模型)被拒绝是因为JB测试失败,这突出了评估T型坑分布的不对称性和峰度的关键作用。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 20:35