楼主: 大多数88
1652 21

[量化金融] 有限样本量下Anderson-Darling检验的有效性 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-8 05:39:44
(11) 作为AD Asym指示器,以便将其性能与标准AD测试进行比较。2.1在有限样本量下测试Anderson Darling在本节中,我们将AD测试和我们提出的修改(公式11)与AIM进行比较,以便在观察次数较少时获得关于AD Asym性能的一些见解。我们注意到,出于风险管理目的,如在CCR案例中,主要目标是更有效地拒绝预测(理论)分布,其方差小于实际(经验)分布(即波动率低估)。我们假设不同的理论概率密度函数(PDF),进行数值模拟。特别是,我们将假设为理论PDF的高斯分布N(0,1)与具有相同平均值但不同方差的其他高斯分布进行比较。我们将AD测试的拒绝率作为生成样本集所考虑的实际标准偏差的函数,对已完成的观察次数进行估计。我们预计,对于足够大的样本量,AD测试会以100%的拒绝率拒绝不同的分布,只有当实际方差等于理论方差,即等于1时,才会例外。在后一种情况下,拒绝率取决于测试所需的置信水平,在我们的情况下,设定为5%。在图2中,我们报告了小样本分析的结果。正如预期的那样,标准差越大,回收率越高,但总体表现不高。例如,当考虑5个观察值时,我们获得了大约50%的拒绝率,标准偏差是经验偏差的两倍。

12
可人4 在职认证  发表于 2022-5-8 05:39:47
随着观察次数的增加,小标准差和大标准差之间的不对称性变得越来越不明显:当n=100时,排斥率变得对称。特别是,AD测试在我们更感兴趣的地方(图2-a的右部分)表现更好,拒绝了波动性低估的最极端情况。事实上,当真实数据的分布与预测分布相同,但方差较大时,AD测试的拒绝率较高。原因是,如前一节所述,方差较大的已实现PDF具有较大的概率(a)AD-SS。(b) 毫无疑问。图2:拒收率与标准偏差(a)样本量的函数关系,共5次观察。(b) 样本量为20次观察。图3:拒识率作为标准偏差的函数,即使观察很少,也会产生异常值(关于预测PDF)。相反,如果认为已实现的PDF的方差低于预测值,则所有观测值都将落在预测分布内,并且更难确定这两个分布是否不同。我们使用不同的样本量,将AD测试与我们的AD Asym版本进行比较,复制相同的分析。图2-b显示,当波动性被高估(σ<1)时,我们有类似的拒绝率,当波动性被低估时,我们有更高的拒绝率。因此,我们得出结论,如果我们需要避免挥发失估,AD-Asym测试表现更好,尤其是在有限的样本中。图3-a描绘了样本量由五个观察值组成时的结果:当预测分布的波动性减半时,AD-AsymDuble拒绝了无效假设(例如,当σ=1.5时,AD-Asym拒绝了40%,而不是22%);当观测值为20时,结果类似,如图所示。

13
mingdashike22 在职认证  发表于 2022-5-8 05:39:51
3-b.为了扩展我们的结果,我们比较了不同统计测试的拒绝率,以确定一个样本是否属于给定的理论分布,在我们的情况下,该样本总是有限的。特别是,我们考虑了五种不同的统计测试:o标准对称AD测试,如前几节所述(SS)o带有尾部敏感指示的AD测试(AD Asym)o假设波动性高估的Cramer Von Mises(CM)(a)测试。(b) 假设波动率低估的测试。(c) 假设平均高估和正确波动率的测试。(d) 假设平均高估和波动性低估的测试。图4:不同统计测试的拒绝率oKolmogorov-Smirnov(KS)。图4显示了我们的分析结果与n的函数关系;特别是,在每个图中,假设高斯N(0,1)理论分布和经验高斯分布具有不同的均值和标准差,比较不同统计检验的校正率。正如预期的那样,当波动性被低估时,AD-Asym测试显示出比其他测试更好的整体性能(更高的拒绝率)。众所周知,财务回报的分布经常表现出厚尾行为,因此我们分析了不同统计测试的表现,考虑到高斯(0,1)理论分布和方差等于toone和ν自由度的经验t-Student分布。无花果。5.我们展示了我们的分析结果。总体结果表明,AD Asym性能高于与AD测试相关的性能,尽管我们知道此类测试受到所考虑的自由度的强烈影响。考虑到t-Student分布的厚尾性质,可以解释这一事实。与具有相同方差的高斯分布相比,t-Student分布意味着更高的风险。

14
kedemingshi 在职认证  发表于 2022-5-8 05:39:54
由于这个原因,使用高斯分布意味着低估了通过不对称测试更好地识别的风险,如前一节所述。此外,我们观察到,当n=150时,拒绝率没有收敛到100%,这与高斯情况相反。如果考虑到理论和经验分布的前两个矩(平均值和方差)完全满足,则可以发现这种行为的原因,需要估计更高的矩,以便观察PDF之间的差异。考虑到对于固定数量的观测值,不确定性随着矩阶的增加而增加,可以合理地预计,获得收敛所需的观测值数量必须大于使用高斯PDF获得的观测值(见第1.1节)。(a) v=2.8自由度的t-Student。(b) v=3自由度的t-Student。(c) ν=3.5自由度的t-Student。图5:假设高斯N(0,1)理论分布和t-Student分布,AD测试(带菱形的蓝线)和AD Asym测试(红线温点)的拒绝率3数值练习一旦从理论角度理解了主要影响,我们在现实案例中测试AD。

15
能者818 在职认证  发表于 2022-5-8 05:39:57
我们认为欧元银行同业拆借利率6个月的利率自1999年以来具有历史时间序列,因此,如果我们使用三年的历史数据进行估计,并且预测期为两年,则在回溯测试样本中有五/六个观察值。然而,为了在有限的样本量下解决AD测试的性质,但有可能将我们的分析扩展到更高的样本量,我们使用适用于截至2012年3月的五天时间序列的Hodrick Prescott[12]过滤器来确定利率时间序列。通过这种方式,我们能够获得更稳健的利率模型校准结果。然后,我们根据经过对数过滤的时间序列的周期分量估计Black Karasinski[9]利率模型,以便使用估计的参数生成具有所需样本的“有效”时间序列进行回溯测试。我们使用Black Karasinski短期利率模型,因为其分析的可处理性,以及利率不能为负的额外好处。事实上,Black Karasinski使用Ornstein-Uhlenbeck随机过程:dyt=k,对利率y(t)=exp(r(t))的周期分量的对数进行建模α - ytdt+σdWt(12),其中k表示ytlog循环向其长期平衡值α(平均水平)的速度,σ表示过程的波动性,wt表示布朗运动。我们在整个数据集上使用矩匹配近似公式方法估计以下参数:Θ≡ [~α = -0.0004871;~k=0.011853;■σ=0.018855]矩匹配法确保均值回归水平为正,这与风险因素的值一致。

16
何人来此 在职认证  发表于 2022-5-8 05:40:01
特别是,估计方法基于两步公式,其中平均回归水平被准确估计,然后插入平均回归率:α=nnXk=1y(tk)(13)k=Pnk=1y(tk)- y(tk-1)Pnk=1y(tk)- A.(14) 在图6中,我们绘制了6个月欧元银行同业拆借利率、过滤周期和趋势成分。WeFigure 6:用Hodrick Prescott筛选出的6个月期欧元银行利率,并使用估计参数[Θα,Θk,Θσ]模拟利率情景,使用估计的Θ参数和恒定数量的回测观察值,以验证不同时段测试的统计特性。在图7中,我们展示了使用一个带有5个观察值的回溯测试样本进行模拟的AD和KS拒绝率的结果。所有模拟都使用相同的参数执行了1万次。根据模拟过程的平均标准偏差(使用Θ参数)和(a)时间范围:1周之间的比率绘制拒收率。(b) 时间范围:1个月。(c) 时间范围:1年。(d) 时间范围:2年。图7:在回溯测试样本中使用5个观察值的AD vs KS拒绝率每个回溯测试日期的标准偏差(考虑三年的时间窗口并保持k恒定进行校准): = 按附录B所述估算过程的方差。因此,正 这意味着低估了回溯测试子样本的波动性,因此我们预计两个测试的拒绝率都较高,而回溯测试的拒绝率为负值 这意味着回溯测试的波动率高于生成“有效”时间序列的波动率,因此我们预计拒绝率更低,甚至为零。数值计算似乎证实了图中所示的理论分析。

17
mingdashike22 在职认证  发表于 2022-5-8 05:40:04
1-2当样本量较低时,与KS相比,AD试验的拒收率较高。我们使用10次、25次和100次观测来控制这些结果,以获得类似的结果。最后,我们注意到,使用三年时间估计的波动率是过程的方差,如附录B所述,取决于平均回归率k,因此为了避免用于模拟过程(Θ)的波动率与用于回溯测试的波动率之间的偏差,我们选择取常数k,我们验证的总体影响对于我们而言可以忽略不计。黑色卡拉辛斯基过程的变化取决于时间范围,因此我们预计x轴上的差异如图7所示。图7的极端边界几乎没有观察到,因此我们将其从分析中剔除。图8:人口分布 = ■σsim/~σbkton平均值低于用于模拟“实际”实际利率的平均值。这在图8中得到了证实,我们绘制了.4 Anderson-Darling Test的实证应用在本节中,我们展示了一个风险因素回溯测试的示例,该示例将AD和KS Test应用于使用Black Karasinski[9]短期利率模型获得的利率预测值。我们计算了这个练习,以展示一个预测长时间范围的真实测试用例,同时验证了AD测试在真实情况下的性能。我们仍然注意到,我们有兴趣在不同的时间段对按未来计价的分布进行回溯测试,因为监管措施和管理风险来自利率产品的整个分布。为了简单起见,我们仍然使用方程式(12)中给出的黑色卡拉辛斯基,用于Euribor 6个月时间序列,其中参数使用3年历史数据和方程式(13)中所示的矩匹配方法进行校准。

18
nandehutu2022 在职认证  发表于 2022-5-8 05:40:07
我们稍微修改了短期利率模型(12),以便使用替代模型设置进行测试,如下所示yt=kα(t)- ytdt+γσdWt(15),其中参数γ是对波动率值的调整。图9绘制了设置γ=1时的Euribor6个月和两年预测分布图。我们注意到,回溯测试时间窗口涵盖了莱曼危机期间发生的利率制度转换,一般来说,利率模型在正确预测危机和下一个时期方面存在严重问题。图9显示:(i)由于预测期较长,只有五个回溯测试日期可用于测试模型;(ii)经验数据往往落在预测分布的极端尾部;(iii)只有通过增加模型波动率或调整平均值,才能获得实现的价值。表2报告了五个回溯测试日期的模拟利率和相应的实际利率。表3报告了不同波动水平的AD、AD Asym和KS测试结果,假设波动率为5%,我们在每个回溯测试日期使用3000个模拟。图9:欧元银行同业拆借利率6个月:2年期预测分布日期2004年12月24日22日2006年12月19日2008年12月17日2014年12月12日价值2.211 3.8291 2.7634 1.0449 0.1685最小值2.0609 1.2958 2.2502 1.8545 0.16382平均值3.3743 2.3433 3.4989 3.3177 1.2567最大值5.5148 3.7534 4.9848 5.357 4.8442表2:欧元银行同业拆借利率6个月和两年期统计预测值可信度:所有测试都拒绝了模型正确的假设(见粗体行和列)。为了比较AD的性能,通过增加波动率将AD Asym和KS测试参数化。

19
能者818 在职认证  发表于 2022-5-8 05:40:10
特别是,我们在每个回溯测试日期将γ从估计波动率的1倍增加到3倍,并且我们观察到,在预测分布非常大的情况下,预期测试接受零假设。相反,与AD和KS相比,AD Asym对此类调整的反应较小。我们认为这是我们测试保守性的实证证据。最后,我们用不同的曲线项(即1年期、5年期和10年期)检查这些结果的稳健性,以获得相似的结果。测试/γ1 2.5 2.75 3拒绝接受的不对称拒绝接受表3:2年时间范围内欧元银行6个月预测值的AD、AD Asym和KS结果。当p值低于置信水平时,测试拒绝无效假设。5结论欧洲CCR/CRD IV要求对用于计算交易对手信用风险敞口的模型预测进行深入分析。因此,银行需要执行回溯测试计划,该计划的结果对于评估影响交易对手风险敞口和风险加权资产的模型缺陷非常重要。与此同时,银行在长期预测风险因素,但满足模型校准三年数据要求时,面临一种常见情况:样本数据非常有限。在这方面,从纯统计的角度来看,使用重叠时间窗口来验证模型性能不能被视为对减少预测变量统计不确定性的显著改进。

20
何人来此 在职认证  发表于 2022-5-8 05:40:15
作为一个序列,应该考虑到小数据集有限的统计能力所带来的强大约束,开发一种适当的CCR模型回溯测试方法。在这方面,值得注意的是,一般来说,统计测试应该能够轻松检测模型的波动率低估,从风险管理的角度来看,这比波动率高估更危险。由于这些原因,在这项工作中,我们将重点放在安德森-达林(AD)测试上,目的是了解测试何时能够检测到波动性低估,并且我们推导了AD测试的扩展,可用于风险管理目的。这种扩展的主要思想是观察到,在分布的实际方差大于预测方差的情况下,AD测试拒绝更多,但由于与小样本量相关的不确定性,拒绝率无论如何都很低。因此,当模型的可用性被低估时,预测分布和实际分布之间的差异较大时,我们放大了这种不对称效应,引入了更明显的非线性行为。这意味着,当预测分布的方差小于真实分布时,测试拒绝能力将更高。在样本量有限的情况下,为了保持保守,这个特性也应该保持不变。我们在有限样本量的情况下验证了修正测试的性质,表明当预测分布错误时,与标准的统一测试相比,修正测试具有更好的整体拒绝性能。我们使用一个数字样本,用Black Karasinski短期利率模型预测两年期内的6个月欧元银行同业拆借利率值,并将其与AD检验和其他统一检验(如Kolmogorov-Smirnnov检验)进行比较,以检查这一结果。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 17:53