楼主: 大多数88
951 21

[量化金融] 有限样本量下Anderson-Darling检验的有效性 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

68%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
63.1498
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23514 点
帖子
3880
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《The efficiency of Anderson-Darling test with limited sample size: an
  application to Backtesting Counterparty Credit Risk internal model》
---
作者:
M. Formenti, L. Spadafora, M. Terraneo, F. Ramponi
---
最新提交年份:
2015
---
英文摘要:
  This work presents a theoretical and empirical evaluation of Anderson-Darling test when the sample size is limited. The test can be applied in order to backtest the risk factors dynamics in the context of Counterparty Credit Risk modelling. We show the limits of such test when backtesting the distributions of an interest rate model over long time horizons and we propose a modified version of the test that is able to detect more efficiently an underestimation of the model\'s volatility. Finally we provide an empirical application.
---
中文摘要:
在样本量有限的情况下,本文对安德森-达林检验进行了理论和实证评估。该测试可用于在交易对手信用风险建模的背景下对风险因素动态进行回溯测试。当回溯测试利率模型在长时间范围内的分布时,我们展示了这种测试的局限性,并且我们提出了一种改进的测试版本,能够更有效地检测模型波动性的低估。最后,我们提供了一个实证应用。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Anderson Darling Anders der ING

沙发
何人来此 在职认证  发表于 2022-5-8 05:39:13 |只看作者 |坛友微信交流群
有限样本下Anderson-Darling检验的有效性:对交易对手信用风险内部模型进行回溯检验的应用*Matteo Formenti+1,2,Luca Spadafora 1,3,Marcello Terrano和Fabio RamponiUniCredit S.p.A.,Piazza Gae Aulenti 3,20154米兰,意大利大学卡洛·卡塔尼奥分校,经济管理学院,C.soMatteotti,22-21053卡斯特拉大学,数学、物理和自然科学学院,经博物馆,布雷西亚梅19,41-25121,2015年(印前版)摘要这项工作在样本量有限的情况下对安德森-达林试验进行了理论和实证评估。该测试可用于在交易对手信用风险建模的背景下对风险因素动态进行回溯测试。当回溯测试利率模型在长期范围内的分布时,我们展示了这种测试的局限性,我们提出了一种改进版的测试,能够更有效地检测模型波动性的低估。最后,我们提供了一个经验应用。杰尔:C19。C22关键词:安德森-达林测试、回溯测试、交易对手信用风险。*本文中表达的观点、想法和意见是作者以个人身份提出的,不应归于UniCredit S.p.A.或UniCredit S.p.A.代表或雇员的作者+更正作者,mformenti@liuc.itIntroductionBacktesting定义为“模型预测与实际值的定量比较”(BCBS,[7])。在交易对手信用风险(CCR)中,模型预测考虑利率、信用利差、权益或商品价值的估计,这些是推动场外衍生品按市值计价的潜在风险因素,直至合同的最长到期日。

使用道具

藤椅
mingdashike22 在职认证  发表于 2022-5-8 05:39:16 |只看作者 |坛友微信交流群
正如BCBS[7]所指出的,银行选择自己最佳且适当的方法来汇总并验证模型预测的整体质量。这可以通过一个综合值来实现,比如统计测试的结果,其目标是检测模型预测的偏差。我们注意到,此类预测计算至最长到期日,并直接影响对交易对手的敞口。因此,回溯测试是风险管理部门评估交易对手风险敞口预测的工具之一,实际上是银行的风险加权资产价值。该测试的失败会导致模型改变,比如不同的模型参数化,甚至是模型假设的改变(如对数正态分布或t分布)。拥有CCR内部模型的银行,计算回测:(i)在风险因素层面,目的是验证用于模拟利率、信用利差、外汇和股票的随机过程的性质;(ii)在交易层面,例如旨在验证单笔交易风险敞口的普通普通期权或异国期权;(iii)在交易对手层面验证估计风险敞口的可靠性。我们注意到,风险经理有兴趣对给定风险因素的所有预测分布形状进行回溯测试,以检测可能导致监管资本措施(RWA)或管理措施(预期正面风险敞口、潜在未来风险敞口)低估的风险(即方差)。在本文中,我们从实证和理论的角度研究了安德森-达林(AD)检验([1],[2])的统计特性,该检验用于在样本量有限的特殊情况下对风险因素进行回溯测试。

使用道具

板凳
kedemingshi 在职认证  发表于 2022-5-8 05:39:20 |只看作者 |坛友微信交流群
事实上,由于AD测试因其广为人知的大样本统计特性(见[10]和[11])而被广泛应用于从生物学到社会学的经验文献中,因此就我们所知,在CCR建模的情况下,它在样本有限时的稳健性从未被研究过。另一方面,监管要求银行通过回溯测试计划(CRR第293-b条)验证建模选择,使用至少三年的历史数据进行模型估计(CRR第292-2条),并制定程序,识别和控制风险敞口超过一年期限的交易对手的风险(CRR第289-6条)。在这方面,我们观察到,从纯统计的角度来看,使用重叠时间窗来验证模型性能,不能被视为是减少预测变量统计不确定性的显著改进。事实上,在我们的上下文中可以看出,如果随机变量是i.i.d.,那么基于重叠时间窗口的统计估值器中包含的附加信息,与非重叠估值器相关的信息相比,不足以显著降低相关的统计确定性。因此,基于重叠时间窗口的回溯测试方法将面临与小样本量相关的统计问题,就像与非重叠方法相关的问题一样。此外,有限的样本量也是一个不可避免的条件,与可用市场数据历史的有限长度有关(例如美元/欧元始于1999年)。

使用道具

报纸
能者818 在职认证  发表于 2022-5-8 05:39:23 |只看作者 |坛友微信交流群
基于这些原因,当回溯测试数据集由5-10个观测值组成时,我们主要关注AD的统计特性。值得注意的是,出于风险管理目的,尤其是对于CCRbacktesting验证,测试应该能够检测到从风险管理角度来看比波动性高估更危险的波动性低估。这意味着,当预测分布比经验分布具有较小的方差时,测试拒绝能力应该更高。此外,在样本量有限的情况下,该属性也应保持不变,以便处理数据集通常较小的实际情况。基于这些原因,我们提出了一种改进版的AD测试,可以帮助风险管理者轻松检测对波动性的低估。我们强调,一致性测试,如AD、Kolmogorov-Smirnov(KS)[17]、Jarque Brera[13]或Cramer von Mises(CM)[5],有助于统计验证模型预测值,因为在每个回溯测试日期,我们可以将实现值映射到预测分布的相应p值。具体而言,对于给定的风险因素(例如利率、外汇、商品)r、回溯测试日期t和时间范围s,根据以下算法计算与实现r(t+s)相对应的P值F(r):F(r)=N+2对于r(t+s)<^r(1)F(r)=i+1N+2对于^r(i)<r(t+s)<^r(i+1)F(r)=N+1N+2对于r(t+s)>^r(N),其中^r(i)代表-预测值,N是预测值的总数。因此,如果模型与实际值完全匹配,则有序映射值的集合应均匀分布。该测试在交易对手信用风险回溯测试框架中的应用示例见[3]。本文的结构如下。

使用道具

地板
kedemingshi 在职认证  发表于 2022-5-8 05:39:26 |只看作者 |坛友微信交流群
在第1节中,我们简要总结了AD测试及其在样本量有限时降低的效率。第2节提出了一种修正版的AD测试,以更快地检测对波动性的低估。然后在第3节中,我们计算一个数值练习,使用真实数据生成“有效”的时间序列,以比较AD测试和我们的修改版本与KS测试。最后,在第4节中,我们将以Black Karasinski模型为例,对6个月欧元银行同业拆借利率进行回溯测试。第5节总结了我们的结果。Anderson Darling TestAnderson和Darling[1]设计了一个统计测试,以确定给定的随机变量序列X={X,…,xn}是否来自理论累积分布函数(CDF)F(X)。无效假设表明数据遵循F(x),因此该测试应用于证明数据不遵循F(x),给定置信水平。AD测试基于以下随机变量的估计:W=Z+∞-∞[Fn(x)- F(x)]F(x)(1)-F(x))ndF(x)(1),其中F(x)是目标CDF,Fn(x)是根据数据得出的经验分布。式(1)的分子表示理论分布与经验分布的距离,而分母表示当中心极限定理成立时,即当n足够大时,经验估计ofF(x)的方差。换句话说,公式(1)表示两个分布(理论和经验)之间的平方误差的平均值,这两个分布由经验LCDF(顺序统计)估计方法产生的隐式不确定性加权。因为随机变量的CDF总是均匀分布在0和1之间(即F(x)∈ U(0,1)),当中心极限定理成立时,它是均匀分布随机变量的函数。

使用道具

7
kedemingshi 在职认证  发表于 2022-5-8 05:39:29 |只看作者 |坛友微信交流群
特别是,它不依赖于分布F(x)。在这种情况下,我们观察到当均匀分布的方差(F(x)(1-F(x))/n)接近于零,即对于罕见事件,F(x)~ 0或F(x)~ 1,平方误差由小分母放大;从这个意义上说,我们认为AD测试对分布的尾部更敏感。另一方面,我们指出,如果用于进行AD测试的观测数较低,则积分inEq的分母。1是大的,即大的方差与理论分布和经验分布之间的差异有关;因此,如果测量不确定度太大,无法得出任何结论,分布之间的巨大差异将落在方差幅度内,AD测试将无法拒绝。因此,为了预测H,理论CDF和经验CDF之间的差异必须大于它们的统计不确定性。式(1)也可以表示为:W=-N-nXk=12k- 1nln(F(xk))+ln(1)- F(xn+1)-k) )(2)其中xi∈ X是从最小值到最大值排序的经验数据,nis是样本大小(即回溯测试日期的数量)。通过AD([1])估算了Wd的经验分布,我们在表中报告了Wd分布的百分位数。(1) 第一行表示上尾概率,第二行表示相应的百分位数。概率0.250 0.150 0.100 0.050 0.010 0.005 0.001百分位数1.248 1.610 1.933 2.492 3.880 4.500 6.000表1:安德森-达林试验的上尾百分位数。1.1分析结果:AD测试的效率AD测试可用于CCR回溯测试,作为一种工具,用于验证给定密度水平下的模型预测分布是否与经验分布具有可比性。

使用道具

8
何人来此 在职认证  发表于 2022-5-8 05:39:34 |只看作者 |坛友微信交流群
在这种情况下,无效假设应为两种分布相等。因此,当无效假设没有被拒绝时,检验给出了积极的结果,这意味着模型分布与经验分布没有足够的区别,可以认为模型是错误的。鉴于我们的回溯测试方法,经验CDF估计中的一个很大的不确定性是由少量观察结果造成的。由于样本量有限,这对我们接受测试的分布的拒绝率产生了负面影响。因此,我们质疑在此类测试中引入有效的测量方法,以便在样本量较小时提高其准确性。一般来说,如果一个度量的不确定性比其预期值小得多,那么它就被认为是有效和可靠的;在我们的例子中,统计不确定性与CDF的经验估计有关,而期望值是经验分布中每个点的理论CDF。不幸的是,对于分布的每个点,简单的方差估计是不够的,因为AD度量要求对{i=1,…,n}的所有概率Fn(xi)求和,并且还必须考虑有序统计的整个协方差矩阵。所以在每一个点上,我们经验估计的期望值由f(xi)=pi给出,协方差结构由pmin(i,j)给出- 皮普[16]。我们可以确定每个分布点的变异系数(CoV)或相对标准偏差:c=σu(3)=√nqR1/nmin(p,q)- pqdpdqR1/npdp(4)=qN- 1.n+√N-2n(5) =n+1rn+(6)(7),其中σ和u表示1/n和1之间范围内高估概率总和的标准偏差和预期值,即R1/nFn(x)dF(x)。无花果。

使用道具

9
可人4 在职认证  发表于 2022-5-8 05:39:37 |只看作者 |坛友微信交流群
1.我们展示了变异系数随观测次数的衰减。为了获得低于10%的CoV,需要进行n=50次观察。当样本量较小时,CoV指标提供有关AD测试性能的重要信息,并且在应用AD测试时,CoV指标可用作警告级别。另一方面,我们注意到CoV是在假设中心极限定理(CLT)成立的情况下推导出来的,而这个假设对于非常小的样本量并不成立。因此,我们应该考虑对等式3的额外修正,我们在这项工作中没有考虑到这些修正。2 AD测试的非对称扩展为了在观察次数较少时检测实际波动率的低估,我们推导了AD测试的扩展,可用于风险管理目的。AD检验扩展的主要思想是观察到,当样本量较小时,当分布的经验方差大于预测方差时,更容易拒绝无效假设;相反,当经验方差小于预测方差时,许多观测值落在理论分布内,因此,更重要的是,如果期望值等于零,则该方法不一致。图1:变异系数随观测次数的衰减,很难拒绝Hhypothesis(这一事实将在下一节中通过数值示例进一步讨论)。从这一观察结果开始,我们可以放大这种不对称效应,定义一个不对称函数,当理论CDF和经验CDF之间的差异较大时,该函数会引入更明显的非线性行为,如方差低估的情况。

使用道具

10
nandehutu2022 在职认证  发表于 2022-5-8 05:39:40 |只看作者 |坛友微信交流群
我们强调,术语不对称是指当预测分布的方差过高/过低时,AD测试的不同行为,而不是W的分析形式。我们将等式(1)推广为:WAsym=Z+∞-∞[Fn(x)- F(x)]2βF(x)(1)-F(x))nβdF(x)(8)其中β≥ 1是控制不对称效应幅度的参数;显然,当β=1时,我们恢复等式(1)。在本文中,我们将注意力集中在特殊情况β=2上。这样,由小n引起的小方差振幅由β指数补偿。为了在实际情况中应用AD测试的这种新的不对称公式,我们必须:o估计等式(8)中的积分假设Wrandom变量的分布为真将W的经验值与在上一点获得的理论分布进行比较,并决定在给定的置信水平下是否应拒绝H。一旦获得了公式(8)的良好估计,第二步和第三步可以通过对Wr的数值模拟来克服。v、 考虑得到的CDF。相反,考虑到小样本量,需要注意积分估计。特别是,按照[1]中的行,我们考虑样本{x,…,xn}观测,并确定x=0和u=F(x)soWAsym=nXk=1Zukuk-1.U-K-1n(1 - u) 联合国du(9)=nXk=1-K- 1nu+2K- 1n- 2.K- 1n日志(u)-K-1n- 1.U- 1.- 2.K- 1n+11.-K- 1n日志(1)- u) +uukuk-1(10)=γ+n-1Xk=1α(k)uk+α(k)log(uk)+α(k)uk- 1+α(k)对数(1- uk)(11),其中uk=Fn(xk)和γ、α(k)、α(k)、α(k)、α(k)是附录中报告的函数。公式(11)给出了一个新的不对称指标,该指标衡量了经验CDF和理论CDF之间的差异,强调了异常值差异。在下面的章节中,我们提到了Eq。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-15 15:38