楼主: kedemingshi
1683 42

[量化金融] 在估计 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-10 20:08:50
φ的常见选择是所谓的指数衰减,即φ(t-s) =αβexp(-β(t-s) )α,β>0。这种形式的功能很有用,因为随着时间的推移,事件对强度的影响会减弱,因此我们可以解释动量随时间的减少(与Couderc(2008)的2020年2月量化金融PdRS2019 QF ArXiV结果一致)。使用霍克斯过程,我们可以在跳跃时间中嵌入过去的依赖性,然而,这种过于简单的形式并不适合我们的目的,因为我们需要根据是升级还是降级对强度进行不同的更改。此外,我们要求基线强度u取决于当前状态。这种扩展的霍克斯过程被称为标记点过程,因为每个观察到的事件都有一个标记来指示事件的类型,请参见(Daleyand Vere-Jones 2003,第6.4章)。我们将在第4节中进一步讨论这一点。这项工作的组织如下。在第2节中,我们概述了数据范例,并描述了我们使用的数据。在第3节中,我们建立了马尔可夫环境下基本转移概率矩阵(TPM)的瓦尔德密度区间的闭式表达式。最后,在第4节中,我们分析了穆迪公司的信用评级数据集,检验了非马尔可夫性,并校准了所提出的非马尔可夫模型。我们也给予了应有的关注,并讨论了在违约概率估计中添加动量的影响。为了帮助保持这项工作的独立性,我们在附录中进一步讨论了核心思想。2、数据描述为了说明我们在本手稿中开发的统计方法,我们使用了穆迪公司专有的信用评级数据集,其中包括1987年1月1日至2017年12月31日期间对17097家实体(公司)的连续时间观察。

12
大多数88 在职认证  发表于 2022-6-10 20:08:53
在本文的其余部分中,我们将此集合称为“穆迪数据集”。一些离散数据是公开的,但完整的数据集是专有的,必须购买。Christensen等人(2004)等其他研究也使用了完整的穆迪数据集。穆迪数据集中的评级类别按评级质量的降序排列为“Aaa”、“Aa1”、“Aa2”、“Aa3”、“A1”、“A2”、“A3”、“Baa1”、“Baa2”、“Baa3”、“Ba1”、“Ba2”、“Ba3”、“B1”、“B2”、“B3”、“Caa1”、“Caa2”、“Caa3”、“Ca”、“C”。我们将“C”定义为默认类别。下文中,“1”、“2”和“3”应称为修改人。评级“Aaa”至“Baa3”为所谓的“投资级”区块,而评级“Ba1”至“Ca”为“投机级”区块。我们采用了一种标准的数据聚合安排,在该安排中,我们聚合了评级级别为InTheir的所有修改者。例如,我们将“Aa1”、“Aa2”、“Aa3”分组为“Aa”等,以获得以下降低信用质量的类别:“Aaa”、“Aa”、“A”、“Baa”、“Ba”、“B”、“Caa”、“Ca”和“C”(默认类别)。除非另有说明,否则我们将使用标准聚合。对于澄清,在穆迪评级系统中,“C”表示违约,与标准和差评等不同,标准和差评等将“C”视为高于违约的评级,将“D”视为违约。我们在整个手稿中使用后一种符号。如引言所述,有两种数据范式,一种是离散的(缺失的),另一种是连续的(完整的)。在本文的第3节中,我们从这些数据中构造了年度离散化的评级转换矩阵,其中一个是使用(CTMC)马尔可夫模型。在第4节中,我们使用完整的数据集,其丰富性允许我们将范围扩展到非马尔可夫模型。3.

13
可人4 在职认证  发表于 2022-6-10 20:08:56
计算离散观测马尔可夫过程的Wald置信区间本节的工作范式是离散时间数据,我们致力于估计基础CTMC模型的生成矩阵Q。对于该设置,dosReis和Smith(2018)表明,期望最大化(EM)算法是估计Q的最强算法(附录a中提供了该上下文中EM算法的描述)。EM是使用基于可能性的推理构建的,这种推理的优点是,通过采用导数,即所谓的Wald置信区间,可以获得估计误差。2020年2月日量化金融PdRS2019 QF ARXIV本节的目标是找到这些衍生工具的表达式,然后使用它们获得相应的转移概率区间。我们的CTMC设置与dos Reis和Smith(2018)类似。我们理解公司的评级是在有限状态空间{1,…,h}上定义的,其中每个状态对应一个评级。我们将Aaa表示为等级1,将C(默认值)表示为等级h。设P是一个h×h随机矩阵,它将是相应的TPM(例如,时间t=1),Q是一个h×h生成器矩阵;我们表示pij:=(P)ij,qij:=(Q)ij,状态i的强度为qi=Pj6=iqij,其中i,j∈{1,…,h}。信用风险建模中使用的标准假设是,默认状态为吸收状态,因此phh=1。在数据中,观察到公司撤回评级(例如通过合并或提前付款),我们将此类撤回评级视为审查结果。关于CTMC的生成器,我们使用稳定的生成器矩阵,即满足以下定义的矩阵Q。定义3.1(CTMC的稳定保守最小生成矩阵)如果所有i,j满足以下性质,我们称矩阵xq为生成矩阵∈ {1, . . .

14
kedemingshi 在职认证  发表于 2022-6-10 20:08:59
,h}:i)0≤ qij<∞ 对于i 6=j;ii)qii≤ 0; 和iii)Phj=1qij=0。我们感兴趣的是时变转移概率矩阵P(t),它与生成器矩阵Q via,P(t)=eQt,t相关≥ 0。(3.1)我们始终假设Q是一个有效的生成器矩阵(在定义3.1的意义上),henceP定义良好。考虑到在时间t<t<···<t时观察到CTMC的情况,并表示tu:=tu- tu公司-1适用于u∈ {1,…,M}和该区间上的转移矩阵byN(u)。离散观测马尔可夫过程的可能性由下式给出,L(Q | N)=MYu=1hYs=1hYr=1exp(Qtu)Nsr(u)sr.(3.2)虽然这不是CTMC的全部可能性,但它是基于可观察数据的可能性,因此实际上,EM算法希望找到Q以最大化(3.2)。因此,Q的瓦尔德密度区间基于这种可能性。可以通过自举为其他算法构造置信区间,如生成器的准优化(见Kreinin和Sidelnikova(2001)),但这些算法的计算成本更高。3.1. 概率梯度和Hessian的直接微分推导置信区间的标准程序是使用估计量的方差(在我们的例子中,是(3.2)中似然L的Hessian H的负逆)。由于EMalgorithm处理缺失数据的可能性,这些导数的计算很复杂,但是,(Oakes 1999,第2节)推导出了一个更简单的Hessian公式。Bladtand Sorensen(2009)和dos Reis and Smith(2018)使用该公式来获得该设置中的误差估计。获得Hessian的公式是有用的,然而,虽然二阶导数可以提供生成器矩阵级别错误的信息,但它并没有阐明这些错误是如何传播到转移概率的(见(3.1))。

15
nandehutu2022 在职认证  发表于 2022-6-10 20:09:03
为此,我们需要能够进一步衍生。根据第一个原理,对于这个问题,我们可以在没有Oakes(1999)中所述公式的情况下提取导数,并通过直接微分得到一个新的闭式解,其中包含梯度和Hessian的矩阵指数。2020年2月4日量化金融PdRS2019 QF ARXIV类似于dos Reis和Smith(2018)中的情况,Q的参数空间闭合为零,我们只能在空间内部进行区分,因此我们引入了allowedpairs的概念。这一概念允许我们在分析中加入吸收态。定义3.2(允许的对)让i,j∈ {1,…,h},然后我们说,在EM算法下,配对(i,j)允许ifi 6=j(不在对角线上),并且qijis不收敛到零。本质上,如果qij>0,则允许i,j,因此在Q的参数空间内部。为了便于表示,我们用vqt表示Q的允许对矩阵,即:对于Q估计中的允许对数,我们将矩阵vqa定义为记录Q的允许对的Na-by-2维矩阵。设A为h-by-h矩阵,α,β,s,r∈ {1,…,h}和erbe是一个h维列向量,在r处为1,在其他地方为零。让我们进一步表示aαβ:=(a)αβ为矩阵a的条目,假设aαβ>0,然后使用矩阵指数的导数和积分的标准性质(见Wilcox(1967)和Van Loan(1978)),如下所示:, exp(At)sraαβ=e | sZtexp(Av)A.aαβexpA(t- 五)dver=e | sexp哈A.aij0 Ait1: h,h+1:2她。(3.3)使用(3.3),我们可以直接计算离散观测马尔可夫过程的似然函数的一阶和二阶导数。

16
kedemingshi 在职认证  发表于 2022-6-10 20:09:06
让(α,β)和(u,ν)对生成器Q是允许的,那么(3.2)的对数的梯度和Hessian的表达式如下:对于梯度,我们有 对数L(Q | N)qαβ=MXu=1hXs=1hXr=1Nsr(u)exp(C(αβ)η)tu)s,h+rexp(Qtu)s,rw,带C(αβ)η=Q eαe |β- eαe |α0 Q,而对于Hessian,我们有h(Q)αβ,μν=对数L(Q | N)qαβquν=MXu=1hXs=1hXr=1Nsr(u)exp(qtu)sr“exp(C(αβ)ηtu)s,h+rexp(C(uν)ηtu)s,h+rexp(Qtu)sr- exp(C(αβ,uν)ξtu)s,3h+r#,而Cαβ,uνξ=“C(αβ)ηC(αβ)ηquν0 C(αβ)η#。这些估计是上述理论的直接应用,因此我们省略了这些步骤。公式(dos Reis and Smith 2018,第7页)和新公式都是Hessia的精确表达式,因此也是Fisher信息矩阵的精确表达式。然而,新公式的复杂性明显降低,因此计算时间明显缩短。由于Hessian仅为允许的对定义,矩阵的维数小于(h- 1) -通过-(h)- 1).我们计算Wald置信区间如下所示,o回想一下,VQI是记录允许的Q对的Na×2维矩阵(估计Q中的允许对数)。黑森函数的第ijth分量是微分qVQ(i,1)VQ(i,2)qVQ(j,1)VQ(j,2)。2020年2月日量化金融PdRS2019 QF ArXiVoFisher信息矩阵由下式给出-H(·)。允许参数qabis的估计方差-H(·)-1,其中VQ(i,1)=a,VQ(i,2)=b。oMLE^qabis^qab±1.96pV ar(^qab)的Wald 95%置信区间。表1给出了基于穆迪离散观察公司评级数据的发电机矩阵估计值的95%置信区间。

17
可人4 在职认证  发表于 2022-6-10 20:09:09
为了获得Wald置信区间,计算时间为≈ 1s与新表达式相比≈ 2s代表dos Reisand Smith(2018)的公式。Aaa Aa A Baa Ba B Caa Ca C[0.074,0.091]0[0,0.001]0 0 0[0.009,0.012][0.088,0.098][0.001,0.004][0,0.001]0 0 0[0,0.001][0.023,0.027][0.061,0.067][0.003,0.005][0.001,0.002][0,0.001]0[0,0.001][0.001,0.002][0.039,0.044][0.042,0.047][0.005,0.007][0.001,0.003][0,0.001]00[0,0.001][0.002,0.004][0.064,0.072][0.092,0.102][0.007,0.011][0.001,0.002]00[0,0.001][0,0.001][0.001,0.003][0.049,0.055][0.091,0.099][0.008,0.011]00 0[0,0.001][0.001,0.005][0.107,0.122][0.052,0.064][0.028,0.036]0 0 0 0[-0.001,0.006][0.003,0.018][0.047,0.083][0.127,0.181 0.123,0.170]0 0 0。穆迪公司化离散时间转移矩阵生成器矩阵条目的置信区间(95%置信度)。3.2. Delta方法-概率的置信区间我们估计的对象是生成器矩阵Q,因此置信区间基于该矩阵的条目。尽管获得这些置信区间是有用的,但从从业者的角度来看,更有用的是了解这种不确定性如何传播到底层TPM和估计的违约概率。这是统计学中的一个经典问题,人们希望考虑在变换下置信区间是如何变化的(在本例中为(3.1)),实现这一点的标准方法称为Delta方法,有关更多信息,请参见Lehmann和Casella(1998)。我们使用允许对集(定义3.2)为P中的每个元素构建置信区间。我们认为转移概率pijat时间t的置信区间为,pij(VQ;t):=eQtij。也就是说,对于固定t,pij(VQ;t)是允许对VQ,in Q的多元函数。

18
大多数88 在职认证  发表于 2022-6-10 20:09:12
这将导致以下结果。定理3.3假设所有允许对的渐近正态性都成立,让V^Qdenote表示允许对的^Q(我们的MLE估计)和fix t。然后,对于状态空间中i 6=h的每个i,j,由Varpij(V^Q;t)≈pij(V^Q;t)V^Q-H(^Q)-1.pij(V^Q;t)V^Q!|,(3.4)提供pij(V^Q;t)/V^Q6=0,其中V^Qdenotes通过微分w构造的向量。r、 t.V^Q中的每个元素在^Q和H(^Q)下进行评估-1是theMLE的逆Hessian矩阵。此外,对于每个(α,β)∈ V^Q,pij(V^Q;t)qαβ=exp(C(αβ)ηt)i、 h+jc(αβ)η=“^Q eαe |β- eαe |α^Q#。2020年2月日量化金融PdRS2019 QF ARXIV附录B中给出了该结果的证明。假设pij(V^Q;t)/V^Q6=0非常轻微,一旦发现MLE估计值,就可以很容易地进行检查。此时,我们利用了一个事实,即我们已经为Hessian导出了一个封闭形式的表达式。因此,我们可以很容易地计算(3.4),此外,现在可以直接计算转移概率的置信区间。这是一个非常有用的结果,它可以量化过渡概率估计水平上的不确定性(而不是生成器矩阵),以及关键的违约概率不确定性。图1和图2显示了穆迪2016年公司化数据中违约概率估计的时间间隔,最长为10年。可以看出,该程序很容易量化任意时间范围内默认预测的概率误差。

19
nandehutu2022 在职认证  发表于 2022-6-10 20:09:15
这一点特别有趣,因为该参数是IFRS 9监管框架中计算预期寿命损失的重要组成部分。0 2 4 6 8 100.000000.00010 0.00020 Aaa过渡到CTime期限[年]违约概率MLE90%95%99%0 2 4 6 8 100.00 0.05 0.10 0.15 Ba过渡到CTime期限[年]违约概率MLE90%95%99%0 2 4 6 8 100.0000 0.0005 0.0010 0 0.0015 Aa过渡到CTime期限[年]违约概率MLE90%95%99%0 2 4 6 8 100.00 0.10 0.20 0.30 B过渡到CTime期限[年]违约概率MLE90%95%99%图1。作为10年内离散时间过渡到默认C类的时间映射的置信区间美国联邦公司评级离散时间过渡20163.3。置信区间w.r.t.信息我们以我们的分析为基准(dos Reis和Smith 2018,第4节)。我们考虑truegenerator矩阵(即第4.5节中描述的MLE马尔可夫发生器),并从中模拟多年价值的数据,将其视为经验数据。然后,我们引入theEM算法来增加数据量,并评估估计和误差是如何变化的。通过使用已知的生成器,我们还可以评估估计和误差的准确性。从计算的角度来看,矩阵指数在Q和P的元素中嵌入了高度非线性的依赖关系。因此,为了理解误差,我们考虑了Q和P的误差是如何随着信息量的变化而变化的。我们考虑了每个评级250名债务人的情景,并模拟了50年的过渡期(即每次过渡的公司数量)。然后,我们使用1年的数据应用EM算法,然后是2年,等等,最多50年。

20
何人来此 在职认证  发表于 2022-6-10 20:09:20
如果公司违约,我们将于2月更换,2020年量化金融PdRS2019-QF-ArXiV0 2 4 6 8 100.000 0.002 0.004 0.006 0.008过渡A到CTime期限[年]违约概率MLE90%95%99%0 2 4 6 8 100.0 0 0.1 0.2 0.3 0.4 0.5 0.6过渡Caa到CTime期限[年]违约概率MLE90%95%99%0 2 4 6 8 100.00 0.01 0.02 0.03 0.04过渡Baa到CTime期限[年]违约概率MLE90%95%99%0 2 4 6 8 100.0.0 20.4 0.6 0.8 1.0过渡期Ca到CTime期限【年】违约概率MLE90%95%99%图2。信心区间作为10年内离散时间过渡到违约C类的时间图。2016年,Body公司对离散时间过渡的评级与违约前的评级一致。这意味着每年获得的“信息”量是相似的。我们将结果绘制在图3中。考虑年数0 10 20 30 40 50 TPM 0.040.060.080.10.12Aaa到AaTPM错误TPM估计TPM真实年数0 10 20 30 40 50 TPM×10-3-5051015A到B考虑年数0 10 20 30 40 50 TPM×10-3-10123Ba到CaEM考虑年数0 0.010.020.030.040.050.060.07Caa到图3。随着数据量的增加,某些TPM条目的估计值和95%置信区间。人们注意到,在大多数情况下,TPM中的错误表现出预期的行为。令人惊讶的结果是Ba到Ca条目的错误增加。如上所述,只有了解发电机估计的基础误差,才能理解TPM中的误差。虽然理论上,Ba到Ca的转换取决于生成器中的所有条目,但我们知道某些条目的影响更大。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 05:20