楼主: kedemingshi
1684 42

[量化金融] 在估计 [推广有奖]

21
何人来此 在职认证  发表于 2022-6-10 20:09:23
因此,我们查看一些重要生成器条目中的错误,如图4所示。从图4可以清楚地看出,错误的主要原因是(不出所料)Ba到Cath2月,2020年量化金融PdRS2019 QF ARXIV考虑年数10 20 30 40 50 Q0.060.080.10.120.140.160.18Ba至BQ ErrorQ EstimateQ TrueNumber of years考虑年数10 20 30 40 50 Q-0.0100.020.03Ba至CAA考虑年数10 20 30 40 50 Q×10-3-2-10123Ba至CaEM误差发电机考虑年数10 20 30 40 50Q-0.01-0.00500.0050.010.015B至图4。随着数据量的增加,生成器中的估计值和95%置信区间。进入最初,我们需要等待从Ba到Ca的转换,这会增加可能性,从而增加估计的不确定性。此外,在估计变得更加稳定之前,还需要几年的数据。生成器中的这种不确定性随后传播到TPM条目中的不确定性,可以观察到TPM条目与相应生成器条目之间存在极强的相关性。因此,即使经过50年的观察,Ba toCa转移概率的误差也远大于其他估计值。CTMC建模中的这种行为并不理想(IFRS 9法规加剧了这种影响),但它表明了在获得小概率(罕见事件)的良好估计和误差方面存在一些挑战,即该模型仍然对个别观察结果敏感。人们可以使用它来评估模型中的敏感性,例如,添加一个公司违约观察值,然后重新计算概率及其相关错误,将提供敏感性的anidea。4.

22
kedemingshi 在职认证  发表于 2022-6-10 20:09:26
扩展马尔可夫过程以捕获评级动量在本节中,我们处理连续观测的数据案例,因此可以扩大模型的范围(我们不再局限于马尔可夫模型)。在上一节中,我们重点介绍了EM算法的许多好特性,特别是可以为错误推导出closedform表达式。然而,当使用具有更复杂可能性的模型时,EM算法并没有像quicklyruns一样很好地推广到各种困难中。这就是我们推广到点过程的情况。在详细说明我们提出的模型之前,让我们先说明数据(见第3节)包含非马尔可夫特征。4.1. 测试非马尔可夫现象Lando和Skodeberg(2002)对标准普尔评级数据集的分析,作者测试了评级动量的存在。为了一致性和完整性,我们证明了穆迪数据集中也存在评级动量行为。该测试遵循Andersen等人(1991)开发的标准半参数危险模型方法(另见Andersen等人(2012))。基本思路是测试强度(从离开该州开始)是否受到之前过渡的影响,也就是说,我们对任何给定的强度进行建模,2020年2月,量化金融PdRS2019 QF ArXiV FIRM,n在状态i中为,λin(t)=qi(t)exp(cZn(t)),其中q是一个未指定的“基线”强度,Z包含与该公司相关的信息,c是我们估计的系数。这里一个重要的观点是,我们经常处理审查观察(许多公司在一段时间后停止评级),因此使用风险模型是有用的,因为我们可以使用部分可能性理论来处理审查观察,见Cox和Oakes(1984)。

23
kedemingshi 在职认证  发表于 2022-6-10 20:09:29
例如,我们可以将协变量Z设置为,Zn(t)=(1,如果固定n降级到当前状态,则为0,否则为0)。因此,在此设置中,马尔可夫假设等同于无效假设c=0。Andersen等人(1991)和(Lando和Skodeberg 2002,附录A)介绍了一般统计框架,包括通过最大化部分可能性来拟合c,但我们在这里不进一步讨论这些问题。该分析的结果如表2所示–我们可以看到统计上显著的向下动量效应(即,在标准显著水平α为10%、5%或1%时,无效假设被拒绝),但穆迪数据中没有显著的向上动量行为。这些发现与Lando和Skodeberg(2002)的发现一致。系数p-值向下动量0.33010<0.0001向上动量-0.01487 0.68153表2。向下和向上动量的似然比检验。4.2. 我们的新模型可以捕捉评级动量。从表2中可以看出,有非常有力的证据表明,数据中存在向下的动量。现在,让我们描述一种可处理的方法,使用标记点过程来捕捉尿道炎效应。不熟悉point流程的读者可以参考附录C了解更多详细信息。(Daley和Vere-Jones2003,第251页)中给出了标记点过程单次实现的可能性,即L=Ng(T)Yi=1λg(ti)f(ki | ti)e-RTλg(u)du,(4.1),其中我们使用以下符号,ngi是事件发生的时间集,λgis是强度,k是标记,f是所谓的标记分布。下标g是一种常用的符号,用于暗示这是地面过程的强度,即我们只考虑感兴趣的事件。

24
大多数88 在职认证  发表于 2022-6-10 20:09:32
设置λ=qind f=qij/qi我们恢复了CTMC的可能性,因此可以看到这些过程是马尔可夫过程的推广。为了将评级动量纳入此类模型,我们从霍克斯过程中汲取灵感,并改变模型的强度,以进行适当的评级更改。基本思想是从一个CTMC(具有生成器矩阵Q)开始,该矩阵用作基线强度,然后添加一个非马尔可夫矩阵。注意,我们并没有假设基线在测试中是时间均匀的。2020年2月4日量化金融PdRS2019 QF ARXIV组件,其自激强度呈指数衰减。也就是说,观察到的任何降级都会在一定时间内增加未来降级的强度。我们还介绍了两种动量类型,一种是公司从投资等级(Baa和更好)降级,另一种是公司从投机等级降级(该建模选择在第4.4节和第4.5节中进一步讨论)。使用与之前相同的表示法,假设状态空间{1,…,h}使得状态h(默认值)是吸收的,我们对时间t的随机过程x的强度建模如下,λg(t)=h-1Xj=1Xj{X(t)=j}+Xm=1Xτ∈τm(t)βmαme-βm(t-τ) ,其中m表示投资或投机性降级,τm(t)是时间t之前的降级时间集(类型m),α和βm对应于每种情况下“动量”的强度和记忆。可以注意到,自上次降级以来,随着时间的推移,随机过程的强度下降(恢复到基线强度),且该速率由β控制。

25
mingdashike22 在职认证  发表于 2022-6-10 20:09:36
特别是,这允许我们将经验观察到的效应包括在内,例如动量的影响随时间而减少(见Couderc(2008))。在此设置中,我们只向≈ (h)- 1) CTMC案例的参数;下文证实了这种节约的有效性(见第4.4节)。据我们所知,我们所知的任何其他模型都无法如此简单地捕捉动量效应。可以引入更多的参数和扩展,但我们只关注此模型。其分析见第4.3.1和4.5节。我们在以下建模假设下工作,我们认为这些假设充分合理,并保持模型的节俭性(其中大部分可以轻松取消,模型可以扩展)。(i) 我们只考虑下行势头。由于上升势头在统计上并不显著(表2),因此我们不予以考虑。(ii)动量有两种类型,投资和投机。被从投资级别降级的公司(数字为从1到(h-1) /2)感觉投资势头和剩余的降级受到投机势头的影响。(iii)最后(不容易移除)在时间0之前没有出现点,即所谓的边缘效应。这本质上意味着,公司在最初成立时没有动力。备注4.1(谨慎估计)由于我们仅将动量视为纯粹的负面影响,如果我们假设一家公司最初没有动量,那么我们将获得更保守的降级数字。因此,在校准过程中,如果不使用公司评级变更的完整历史记录,则模型将更加谨慎。通过这些假设,我们可以确定标记的分布。我们采用以下标记分布(对于X(ti))∈ {1, . . .

26
nandehutu2022 在职认证  发表于 2022-6-10 20:09:39
,h- 1} ,Ti是第i次跳跃的时间),f(X(t-i) | ti)=Phj,k=1qjk{X(t-i) =j,X(ti)=k}λg(ti){X(ti)<X(t-i) }+{X(ti)>X(t-i) }NjXm=1Xτ∈τm(ti)βmαme-βm(ti-τ),这是霍克斯过程中使用的一种常见且易于理解的形式,见Bacry et al.(2015)。2020年2月日量化金融PdRS2019 QF ARXIV,其中我们用t表示-i在第i次跳转之前的时间,Nj是一个人可以降级到的状态数,即Nj=Pk>j{qjk>0}。将强度和标记分布代入(4.1),得到以下表达式来表示可能性,L=Ng(T)Yi=1(hXj,k=1qjk{X(t-i) =j,X(ti)=k}+NjXm=1Xτ∈τm(ti)βmαme-βm(ti-τ){X(ti)>X(t-i) }+hXj,k=1qjk{X(t-i) =j,X(ti)=k}{X(ti)<X(t-i) })×exp-ZTh公司-1Xj=1Xj{X(u)=j}+Xm=1Xτ∈τm(u)βmαme-βm(u-τ) 杜邦. (4.2)注意,可能性是关于一家公司的信息。我们可以通过获取产品来构建多个公司的可能性,但值得注意的是,这假设了公司之间的依赖性。由于商业周期等原因,这不太可能是真的,但是,可以使用McNeil和Wendin(2007)的方法将这些相关的系统性影响引入风险建模中。因此,我们只关注评级动量的特质效应。涉及动量的积分(4.2中的最后一个积分)可以简化为ztxτ∈τm(u)βmαme-βm(u-τ) du=Xτ∈τm(T)αm1.- e-βm(T-τ).与CTMC的情况不同,这种可能性很复杂,似乎没有真正的简化,其主要原因是跳跃之间的时间和历史依赖性,不再可能简化qKijijare形式。我们继续依靠马尔可夫链蒙特卡罗(MCMC)技术来估计参数。4.3.

27
mingdashike22 在职认证  发表于 2022-6-10 20:09:42
模型的MCMC校准算法如Bladt和Sorensen(2005)、Bladt和Sorensen(2009)以及dos Reis和Smith(2018)所述,在CTMC设置中,CTMC的数据扩充步骤成本高昂,与其他算法相比,该算法速度非常慢。在我们的环境中,我们可以访问完整的数据集,避免了这一昂贵的步骤。此外,我们处理iscomplex和MCMC的可能性(见Gilks et al.(1996))是少数能够提供合理估计的方法之一。MCMC的基本设置是通过一些数据D的后验分布估计参数(s)θ,通常表示为π(θ| D)。一般来说,人们无法获得这种后验分布,直接蒙特卡罗模拟是不可能的,因为人们不知道归一化常数。MCMC通过观察Bayes公式来绕过这个问题,π(θ| D)∝ L(D;θ)π(θ),其中L是似然,π(θ)是θ的先验分布。然后可以使用Metropolis Hastings算法和一些建议分布从该分布中进行采样。让X表示所有公司过渡的集合。我们有兴趣获得联合分布π(Q,α,β| X),其中Q是具有基线强度和跳跃概率的矩阵(与CTMC的生成矩阵具有相同的形式),α:=(α,α),β:=(β,β)是2020年2月定量金融PdRS2019 QF ARXIV动量参数。由于我们假设Q、α和β的先验分布是独立的,因此Bayes定理暗示,π(Q、α、β| X)∝ π(X | Q,α,β)π(Q)π(α)π(β)=Lπ(Q)π(α)π(β),其中L是(4.2)中定义的可能性。

28
能者818 在职认证  发表于 2022-6-10 20:09:46
通过对所有其他参数的知识进行条件化处理,可以得到每个参数的完整条件分布。对于先验,首先是Q,我们假设初始跃迁没有动量,因此我们可以将先验设置为基于初始跃迁的CTMC最大似然估计(MLE)。因此,我们将先验值设置为指数,平均值为MLE。对于α和β,我们使用具有合理方差的aGamma随机变量作为先验变量。这反映了我们对这些参数知之甚少,但并不期望它们为零或太大。我们要解决的下一个问题是如何从完整的条件分布进行模拟。首先处理模型参数时,它们的完全条件分布显然不是标准分布,因此我们使用单成分Metropolis-Hastings算法。与Metropolis Hastings一样,我们需要定义一个好的提案功能。为了避免大量的拒绝,我们将我们的建议视为伽马随机变量,平均值为当前步长,方差很小。实际上,这会创建一个始终为非负的随机游走型采样方案。因此,如果我们用γ表示参数集,用ψ表示建议分布(可能取决于当前参数),则建议点γ的第n步接受概率由π(X |γs,γn,-s) π(γs)ψ(γs |γs)π(X |γs,γn,-s) π(γs)ψ(γs |γs),其中γn,-SDE注意到第n次更新时的参数集,不包括s参数。4.3.1. 模型校准。现在我们有了必要的工具,我们可以使用穆迪的数据集校准我们的模型。运行11000次MCMC迭代(进行1000次磨合),我们得到以下结果。

29
nandehutu2022 在职认证  发表于 2022-6-10 20:09:54
对于马尔可夫风格的“基本”组件,Q=Aaa Aa A Baa Ba B Caa Ca C-0.0869 0.0836 0.0031 0 0.0002 0 0 0 00.0117 -0.1088 0.0942 0.0025 0.0003 0.0001 0 0 00.0006 0.0240 -0.0938 0.0666 0.0017 0.0007 0.0002 0 00.0002 0.0016 0.0387 -0.0947 0.0496 0.0040 0.0006 0.0000 00.0001 0.0006 0.0033 0.0636 -0.1774 0.1060 0.0037 0.0001 00.0000 0.0003 0.0012 0.0035 0.0503 -0.1610 0.1012 0.0040 0.00040 0.0002 0.0001 0.0013 0.0048 0.1028 -0.1976 0.0622 0.02610 0 0.0018 0.0029 0.0050 0.0447 0.1346 -0.2838 0.09480 0 0 0 0 0 0 0 0,对于动量参数,α=(0.031,0.1291)和β=(3.5234,1.7095)。校准过程中产生的一个有趣的观察结果是,动量参数在投资和投机降级过程中的差异。投机性降级的动量明显大于投资降级,即投机性降级的动量强度更大,持续时间更长。用MATLAB编写的MCMC算法≈ 在Intel Xeon E7-4660 v4 2.2GHz处理器上运行8.5小时。请注意,两者(0.1≈) αβ< αβ(≈ 0.2)和β>β。2020年2月日量化金融PdRS2019 QF ARXIV这似乎有悖常理,然而,设定信用评级最终需要综合各种来源的信息,并对该公司(主权)面临的不同风险作出判断。如(Couderc 2008,第5章和第6章)所述,在影响投资级和投机级债务人降级/违约的信息方面,似乎存在着明显的差异。这表明这些评级类别之间存在内在差异,因此,我们的动量模型也显示出差异也就不足为奇了。

30
mingdashike22 在职认证  发表于 2022-6-10 20:09:58
从实际角度来看,该模型表明,投机性评级公司的降级对未来业绩的影响更大,影响投机性评级变化的信息意味着公司内部存在更深层次的问题,因此进一步降级/违约的可能性更高。4.4. 贝叶斯信息准则让我们为该模型的使用提供了一些依据。我们认为,点过程样式模型是一个很好的选择,为了使模型尽可能健壮和简单,我们添加了四个额外的“动量参数”(与CTMC模型相关)。我们认为四是最佳选择,因为仅添加两个参数不会产生与观测数据一样好的fit,而向每个评级添加参数似乎并不合适,因为我们没有足够的转换来获得可靠的fit。因此,我们没有考虑比投资级和非投资级更多的动量组。由于我们可以访问完整的数据集,因此可以直接计算马尔可夫模型设置的Q generatormatrix的最大似然估计。因此,我们可以用纯马尔可夫模型来检验动量模型。马尔可夫模型是动量模型的一个特例,设定αi=0,βia常数为i∈ 1, 2. 因此,先验的非马尔可夫模型能够更好地拟合数据(在实现至少同样大的可能性的意义上)。我们想要回答的问题是,我们是在更好地获取数据,还是只是过度拟合?为此,我们计算了贝叶斯信息准则(BIC),它是模型选择统计中使用的一种常见测试,已知比其他统计测试(如Akaike信息准则)更能惩罚模型复杂性(见(Claeskens and Hjort 2008,第3章))。我们相信,这个特性使BIC成为一个很好的测试,可以证明我们更复杂的模型是正确的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:15