楼主: mingdashike22
917 37

[量化金融] 多项式VaR回测:一种简单的隐式回测方法 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-25 00:14:04 |只看作者 |坛友微信交流群
结论在第6.2节多项式测试2.1测试集中发现,我们有一系列事前预测模型{Ft,t=1,…,n}和一系列事后损失{Lt,t=1,…,n}。在每次t时,模型Ftis用于产生风险价值VaRα的估计(或预测)和预期短缺ESα,tat各种概率水平α。VaR估计值与LTS进行比较,以评估描述损失的模型的充分性,特别强调最极端的损失。鉴于上述表述(1.1),我们考虑了Emmer等人(2015)提出的想法,即通过在不同水平α,…,同时对多个VaRestimates进行回溯测试,间接对ES估计进行回溯测试,αN。我们在第3节的模拟研究中研究了N级数量的不同选择。我们通过考虑VaR概率水平α,…,推广了(1.1)的思想,αn定义为αj=α+j- 1N(1- α) ,j=1,N、 N个∈ N、 (2.1)对于某些起始水平α。在本文中,我们通常将α=0.975设置为与《巴塞尔银行规则》(Basel Committee on Banking Supervision,2016)中用于预期缺口计算的水平和用于回溯测试的两个水平中的较低者相对应的水平(Basel Committee on Banking Supervision,2016);在N=1的情况下,我们还将考虑α=0.99,因为这是VaR例外二项式测试的常见水平。

使用道具

12
大多数88 在职认证  发表于 2022-6-25 00:14:07 |只看作者 |坛友微信交流群
为了完成水平描述,我们将α=0和αN+1设置为1。我们定义了αjat时间t水平的违规或例外指标,j:=I{Lt>VaRαj,t}(2.2),其中,IAdenotes是事件A的事件指标。众所周知(Christo Offersen,1998),如果损失l具有条件分布函数ftn,则对于固定j,序列(It,j)t=1,。。。,n应满足:o无条件覆盖假设,E(It,j)=1- αjfor all t,ando独立性假设,It,jis独立于Is,jfor s 6=t。如果两者都满足αjare水平的VaR预测,则表示满足正确条件覆盖率假设和例外数pnt=1It,则j为二项分布,成功(例外)概率为1- αj.在N个水平上同时检验VaR估计会导致多项式分布。如果我们定义Xt=PNj=1It,则当序列(Xt)t=1,。。。,n计算违反的VaR级别数。序列(Xt)应满足两个条件:o无条件覆盖假设,P(Xt≤ j) =αj+1,j=0,N对于所有t,独立性假设,对于s 6=t,Xtis独立于xs。无条件覆盖属性也可以写入xt~ MN(1,(α- α, . . . , αN+1- αN)),对于所有t。这里MN(N,(p,…,pN))表示具有N个试验的多项式分布,根据概率p,…,每个试验可能导致N+1结果{0,1,…,N}中的一个,pn那总和等于一。如果我们现在确定观察到的细胞计数byOj=nXt=1I{Xt=j},j=0,1,N、 那么随机向量(O,…,ON)应该遵循多项式分布(O,…,ON)~ MN(n,(α- α, . . . , αN+1- αN))。更正式地说,假设0=θ<θ<····<θN<θN+1=1是一个任意的参数序列,并考虑模型,其中(O,…,ON)~ MN(n,(θ-θ, . . . , θN+1-θN))。我们测试了由H0:θj=αj对于j=1。

使用道具

13
能者818 在职认证  发表于 2022-6-25 00:14:10 |只看作者 |坛友微信交流群
,NH1:θj6=αjf,至少一个j∈ {1,…,N}。(2.3)2.2测试的选择各种测试统计数据可用于评估这些假设。Cai和Krishnamoorthy(2006)对五种可能的多项式比例测试的性质进行了相关的数值研究。在这里,我们建议使用三种方法:标准皮尔逊卡方检验;Nass测试,在小细胞计数时表现更好;似然比检验(LRT)。详情如下。皮尔逊卡方检验(Pearson,1900)。这种情况下的检验统计量isSN=NXj=0(Oj+1- n(αj+1- αj))n(αj+1- αj)d~H0χN(2.4),当SN>χN(1)时,通过拒绝无效假设获得大小κ检验- κ) ,其中χN(1- κ) 是(1- κ) -χN分布的分位数。众所周知,该测试的准确度随着最小0≤j≤Nn(αj+1-αj)随N.2的增大而增大,随N.2的增大而减小。Nass试验(Nass,1959年)。Nass对(2.4)中定义的统计数据的分布引入了改进的近似值,即namelyc SNd~H0χν,其中c=2 E(SN)var(SN),ν=c E(SN),其中E(SN)=N,var(SN)=2N-N+4N+1n+nNXj=0αj+1- αj.当c SN>χν(1)时,零假设被拒绝- κ) ,使用与之前相同的符号。当细胞概率较小时,Nass检验比卡方检验有明显改善。轻轨(例如,见Casella&Berger(2002))。在LRT中,我们计算替代假设H1下参数θjunder的最大似然估计值θjo,并形成统计数据▄SN=2NXj=0Ojlnθj+1-^θjαj+1- αj!。在无限制多项式模型下(O,…,ON)~ MN(n,(θ-θ, . . . , θN+1-θN))估计的多项式信元概率由^θj+1给出-^θj=Oj/n,因此当Oj为零时为零,这导致未定义的测试统计。因此,每当N≥ 2、我们使用了与Cai&Krishnamoorthy(2006)中描述的不同版本的LRT。

使用道具

14
何人来此 在职认证  发表于 2022-6-25 00:14:13 |只看作者 |坛友微信交流群
我们考虑一个一般模型,其中参数由θj=Φ给出Φ-1(αj)- uσ, j=1,N、 (2.5)其中u∈ R、 σ>0,Φ表示标准正态分布函数。在受限模型中,我们根据备选H1:u6=0或σ6=1检验零假设H0:u=0和σ=1。在这种情况下,我们有^θj+1-^θj=ΦΦ-1(αj+1)- ^u^σ- ΦΦ-1(αj)- ^u^σ,式中,^u和^σ是H1下的最大似然估计,因此不会出现估计的细胞概率为零的问题。检验统计量GNI渐近卡方分布,具有两个自由度,如果GN>χ(1),则拒绝零- κ).2.3情况N=1在N=1的情况下,我们进行一组增广的二项测试。对于N=1的LRTin,只有一个自由参数可确定(θ),我们对无限制交替模型进行了标准的双边渐近似然比检验;在这种情况下,将统计数据与χ分布进行比较。很容易验证,对于N=1,皮尔逊多项式检验统计量Sin(2.4)是二项得分检验统计量z=N的平方-1Pnt=1It,1- (1 - α) pn编号-1α(1 - α) =O- n(1- α) pnα(1- α) ,(2.6),与标准正态分布进行比较;因此,在这种情况下,双边得分测试将给出与Pearson卡方检验相同的结果。除了分数检验外,我们还考虑了Wald检验,其中(2.6)分母中的α参数由估计量^θ=n代替-1Pnt=1(1- It,1)=1- 不适用。除了双侧测试外,我们还进行了LRT的单侧变体、score和Waldtests测试H0:θ≥ α相对于备选方案H1:θ<α(VaR低估)。基于Z的渐近正态性,单侧得分和Wald检验很容易实现。

使用道具

15
nandehutu2022 在职认证  发表于 2022-6-25 00:14:16 |只看作者 |坛友微信交流群
要推导单侧LRT,可能需要注意的是,用于测试简单零假设θ=α与简单替代θ=α的相似性比率统计*带α*< α取决于变量异常数B=Pnt=1It,1的数据。在单侧LRT中,我们根据二项分布测试B;这种99%水平的测试是巴塞尔回溯测试制度和交易制度的基础。2.4限制性多项式LRT随着N级数量的增加,多项式LRT有一个自然的连续极限,这与Berkowitz(2001)提出的基于已实现Pvalue的测试一致。我们的LRT对X(N)t使用多项式模型:=Xt=PNj=1I{Lt>VaRαj,t},其中我们假设X(N)t≤ j= θj+1=Φ-1(α+jN(1- α)) - uσ!, j=0,N、 (2.7),其中我们测试u=0和σ=1。自然极限模型为N→ ∞ 基于随机变量Wαt=(1-α)-1ZαI{Lt>VaRu,t}du。为简单起见,我们假设FTI是一个连续且严格递增的分布函数,并且VaRu,t=F-1t(u),使得事件{Lt>VaRu,t}与事件{Ut>u}相同,其中Ut=Ft(Lt)被称为已实现的p值或aPIT(概率积分变换)值。如果损失L具有条件分布函数Ft,则通过Rosenblatt(1952)的变换,UT值应为iid均匀。很容易验证wαt=ZαI{Lt>VaRu,t}du=ZαI{Ut>u}du=max(Ut,α)- α1 - α.Berkowitz(2001)提出了一个测试,其中Zαt=Φ-1(max(Ut,α))由截断法线建模,即p(Zαt≤ z) =Φz- uσ, z≥ Φ-1(α),(2.8),其中我们测试u=0和σ=1,以评估实现的Pv值的一致性,重点放在尾部(即α以上)。

使用道具

16
能者818 在职认证  发表于 2022-6-25 00:14:19 |只看作者 |坛友微信交流群
因为Wαt=(Φ(Zαt)- α)/(1 - α) ,Berkowitz模型(2.8)等价于p(Wαt≤ w) =ΦΦ-1(α+w(1- α)) - uσ, w∈ [0,1),这是(2.7)中离散模型的自然连续对应物.3模拟研究我们记得,我们感兴趣的主要问题是:在模型验证方面,多项式测试的大小和功率特性是否比二项式测试更好?在哪种情况下,三个多项式测试中的哪一个应该得到青睐?为了获得良好的性能,应该使用的最佳分位数是多少?为了回答这些问题,我们根据模拟数据进行了一系列实验。在第3.1节中,我们对测试的大小和能力进行了比较。powerexperiments使用可能是交易账簿的典型分布形式来考虑损失分布的错误规定;我们特别感兴趣的是,在具有不同尾部的分布之间,多项式检验是否比二项式检验更能有效地区分。在第3.2节和第3.3节中,我们进行了回溯测试实验,其中我们考察了测试的能力,以区分不同建模者的表现,这些建模者使用不同的方法估计分位数,并且存在统计误差。第3.2节的背景测试采用静态分布观点;换句话说,真正的数据生成过程只是一个分布,如第3.1节中的大小-功率比较。在第3.3节中,我们从动态的角度考虑了一个数据生成过程,该过程以具有重尾创新的随机波动率GARCH模型为特征。

使用道具

17
nandehutu2022 在职认证  发表于 2022-6-25 00:14:22 |只看作者 |坛友微信交流群
我们考虑了多项式检验区分好预报员和坏预报员的能力,后者可能会错误说明动态形式和/或损失的条件分布。3.1尺寸和功率3.1.1理论为了判断三个多项式测试(以及其他二项测试)的有效性,我们计算它们的尺寸γ=P(拒绝H0 | H0真)(I类错误)和功率1- β =1 - P(接受H0 | H0 false)(1-II类错误)。对于给定的规模,监管机构显然应该有兴趣进行最强大的测试,以暴露银行使用非科学模型的风险。检查多项式检验的大小需要我们在零假设(H0)下模拟来自多项式分布的数据。这可以通过模拟任何连续分布(如正态分布)的数据并计算αj分位数真值之间的观测值间接实现。为了计算功率,我们必须在交替假设(H1)下模拟多项式模型的数据。我们选择从模型中进行模拟,其中参数由θj=G(F)给出←(αj)),其中F和G是分布函数,F←(u) =inf{x:F(x)≥ u} 表示F的广义逆,F和G的选择应确保j的一个或多个值的θj6=αjg。G可视为真实分布,F可视为模型。如果预报员使用SF确定αj分位数,那么与分位数估计值相关的真实概率是θjrather,而不是αj。我们考虑的情况是,F和G是两个不同的分布,平均值为零,方差为一,但形状不同。在时间序列背景下,我们可以考虑以下情况。

使用道具

18
kedemingshi 在职认证  发表于 2022-6-25 00:14:25 |只看作者 |坛友微信交流群
假设损失(Lt)形成一个与过滤(Ft)相适应的时间序列,并且对于所有t,LTF的真实条件分布给定Ft-1由Gt(x)=G(x)给出- ut)/σt),其中utandσtareFt-1-表示LT条件平均值和标准偏差的可测量变量。然而,建模者使用模型Ft(x)=F(x- ut)/σt),其中分布形式错误,但条件平均值和标准偏差正确。因此,他给出了由VaRα给出的VaR估计,t=ut+σtF←(αj)。与这些VaR估计相关的真实概率为θj=Gt(VaRαj,t)=G(F←(αj))6=αj。我们感兴趣的是,测试是否有能力检测预报员使用了模型{Ft,t=1,…,n},而不是真实分布{Gt,t=1,…,n}。例如,假设G是学生t分布(按比例调整为单位方差),f是正态分布,因此预报员低估了更极端的分位数。在这种情况下,我们将倾向于观察到太多高分位数的超越。尺寸计算对应于F=G的情况;我们使用真实模型计算数量,没有误判。在功率计算中,我们将重点放在G的分布形式上,这些分布形式是交易账簿的典型形式,具有重尾和可能的偏斜。我们考虑了具有5个和3个自由度(t5和t3)的学生分布,这两个自由度分别具有中等程度的重尾和重尾,以及Fern'andez&Steel(1998)具有3个自由度和歪斜参数γ=1.2(表示为skt3)的歪斜学生分布。在实践中,我们模拟G的观测值,并计算F的N个分位数之间的数;在所有情况下,我们都将基准模型F视为标准正态。表1显示了模拟研究中使用的四种分布的VaR0.975、VaR0.99和ES0.975值。

使用道具

19
可人4 在职认证  发表于 2022-6-25 00:14:28 |只看作者 |坛友微信交流群
这些分布都已校准为均值为零,方差为1。请注意,当我们向下移动表格时,ES0.975get的值是如何逐渐增大的;标记的最后一列显示了与正态分布相比,ES0.975值增加的百分比。由于资本应该基于这一风险度量,因此银行能够可靠地估计这一度量尤其重要。从监管角度来看,重要的是,回溯测试程序可以区分重尾模型和轻尾正态分布,因为如果其他三个分布中的任何一个是“真实分布”,使用正态分布的建模者将严重低估ES0.975。这三个分布给出了VaR0.975的可比值;t3模型实际上给出了该风险度量的最小值。VaR0.99的值与ES0.975的值顺序相同。, 这表明,与正态分布相比,VaR0.99的值增加的百分比,并没有显著增加,因为, 这已经表明可能需要两个以上的分位数来隐式地测试ES。为了确定VaR水平值,我们将k=0,1,····,6设置为N=2k。在具有N的所有多项式实验中≥ 2我们设定α=α=0.975,进一步的水平由(2.1)确定。我们选择样本量n=250、500、1000、2000,并使用10000次重复估计零假设的拒绝概率。在N=1的情况下,我们考虑一系列额外的二项检验,检验水平α=α的异常数量,并将其列在单独的表格中;在这种情况下,除了α=0.975外,我们还考虑了α=0.99。

使用道具

20
可人4 在职认证  发表于 2022-6-25 00:14:31 |只看作者 |坛友微信交流群
这使我们能够在两个水平上比较多项式测试与所有二项式测试变量,从而评估多项式测试是否真的优于当前实践。VaR0.975VaR0.99ES0.975正态1.96 2.33 0.00 2.34 0.00t5 1.99 2.61 12.04 2.73 16.68t3 1.84 2.62 12.69 2.91 24.46st3(γ=1.2)2.04 2.99 28.68 3.35 43.11表1:模拟研究中使用的四种分布的VaR0.975、VaR0.99和ES0.975值(正态、学生t5、学生t3、偏态学生t3,偏态参数γ=1.2)。列显示VaR0.99相对于正态分布的百分比增加;列显示与正态分布相比,ES0.975的百分比增加。3.1.2二项测试结果表2显示了在97.5%和99%水平下,VarException数量的单侧和双侧二项测试结果。在本表和表3中,使用了以下颜色编码:绿色表示效果良好(≤ 尺寸为6%;≥ 功率为70%);重新显示不良结果(≥ 尺寸为9%;≤ 功率为30%);深红色表示非常糟糕的结果(≥ 尺寸为12%;≤ 功率10%)。97.5%水平。测试的规模通常是合理的。在单面和双面测试中,分数测试似乎对所有不同样本量都有很好的规模。所有测试的能力都非常弱,这反映了所有分布中97.5%的VarValue非常相似的事实。请注意,单侧测试在检测t5和倾斜t3模型方面稍有优势,而双侧测试在检测t3模型方面稍有优势;后一个观察结果是由于(标度)t3的97.5%分位数实际上小于正态分布的分位数;见表1.99%水平。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-28 04:08