楼主: mingdashike22
1703 40

[量化金融] 死亡率建模中的队列效应:贝叶斯状态空间方法 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-31 06:48:56
本文的目标之一是证明模型(5)可以通过将其视为状态空间模型来成功估计。模型动力学Lee和Carter(1992)ln mx,t=αx+βxκtRenshaw和Ha berman(2003)ln mx,t=αx+Pki=1β(i)xκ(i)tRenshaw和Ha berman(2006)ln mx,t=αx+β(1)xκt+β(2)xγt-xCurrie(2009)ln mx,t=αx+κt+γt-xCairns等人(2006)logit(qx,t)=κ(1)t+κ(2)t(x- (R)x)Cairns等人(2009)logit(qx,t)=κ(1)t+κ(2)t(x- \'\'x)+γt-xPlat(2009)ln mx,t=αx+κ(1)t+κ(2)t((R)x- x) +κ(3)t((R)x- x) ++γt-表1:动态死亡率模型示例;这里模拟了真实的死亡/死亡率。表1提供了流行死亡率模型的示例。Renshaw和Haberman(2003)考虑了LC模型的多周期(Pki=1β(i)xκ(i)t)扩展。Renshaw和Haberman(2006)引入了队列因子(γt-x) 至LC型号。Currie(2009)研究了Renshaw和Haberman(2006)模型的简化版本。凯恩斯等人(2006年2月)提出了所谓的CBD模型,以建模logit(qx,t):=ln(qx,t/(1- qx,t)),其中'x是样本范围的平均值,即'x=pPpi=1xi,旨在捕捉成熟年龄死亡率动力学。凯恩斯等人(2009年)通过纳入队列因素扩展了CBD模型。Plat(200 9)介绍了一种模型,该模型结合了先前模型的理想特性,并包含一个术语((R)x- x) +:=最大((R)x- x、 0)旨在捕捉年轻的管理动态。备注2.1队列死亡率建模的一种替代方法是考虑死亡率强度(死亡力)ux+t,t的连续时间建模,x和t取连续值。这对于财务和精算应用具有特别的价值,因为定价公式可以通过死亡率强度来推导和表达。Cairns等人讨论了连续时间方法。

12
mingdashike22 在职认证  发表于 2022-5-31 06:48:59
(2008),并在文献中对其进行了广泛的研究,参见f for example Bi ff(2005)、Dahl and Moller(2006)、Luciano and Vigna(20 0 8)和Fung et al.(2014)。2.2广义线性建模框架可基于称为广义线性建模(GLM)框架的灵活方法对随机死亡率模型(如表1所示)进行估计(Villega s et al.(2015),Currie(2016))。鉴于分次风险敞口Ext,通常将初始风险敞口近似为^Ext≈外部+Dxt。在GLM fr amework下,一个是建立死亡数量Dxtas r andom变量的模型。常见示例包括泊松误差结构DXT~ 泊松(Extmx,t)(6)和二项式误差结构dxt~ 二项式(^Ext,qx,t)。(7) 注意,对于Poisson模型和二项式模型,我们分别有期望值E[Dxt/Ext]=mx,tand E[Dxt/Ext]=qx,tf。通过所谓的链接函数g,可以将平均值E[Dxt/Ext]或E[Dxt/Ext]与预测值ρx,tasg联系起来EDxt外景= ρx,t(8),其中“ext”可以是初始风险或分风险。泊松和二项模型的典型链接函数分别是对数函数和logit函数。从GLM框架的角度来看,表1中的模型为预测值提供了具体说明。特别是,表1中的最后四个模型假设线性预测值,而前三个模型描述非线性预测值,因为预测值中涉及到参数的乘法项,如sβxκ皮重。后一种模型可以称为广义非线性模型(Currie(2 016))。我们注意到,GLM框架的一个明显优势是,与SVDAP方法相比,它允许复杂的误差结构,如泊松分布和二项式分布。

13
kedemingshi 在职认证  发表于 2022-5-31 06:49:04
然而,尽管该框架具有灵活性,但它涉及一个两步程序的预测,这与以下章节中提出的状态空间方法不同,后者对模型参数和潜在因素进行联合估计。2.3状态空间建模框架在本文中,我们扩展了之前的工作,例如Pedroza(2006)、k ogure和Kurachi(2010)和Fung et al.(2017),使用状态空间技术建模死亡率动态,并考虑队列特征。我们首先简要回顾了通过状态空间表示的重要性建模。状态空间模型由两个方程组成:观测方程和状态方程,分别由byzt=A(φt,ut),(9a)φt=b(φt)给出-1,vt),(9b),其中zt表示观测到的多维时间序列,状态φt表示多维隐马尔可夫过程。这里,U和V是独立的随机噪声,函数a和b通常是非线性的。很明显,表1中所示的每个mort-ality模型都指定了状态空间模型的观测方程,其中周期和coho r t因子代表隐藏状态。周期效应的时间序列模型将形成状态方程,从而完成状态空间系统的描述。例如,Lee-Carter模型可以重新表示为asyt=α+βκt+εt,εtiid~ N(0,1pσε),(10a)κt=κt-1+θ+ωt,ωtiid~ N(0,σω),(10b),其中yx,t=ln emx,t,1p是一个p维单位矩阵,N(a,b)表示均值a和协方差b的正态分布。Fung et al.(2017)研究了统计空间Lee-Carter系统(10)的两个推广,以分析丹麦人口的长期死亡率时间序列。第一个推广是将异方差纳入模型,即。

14
nandehutu2022 在职认证  发表于 2022-5-31 06:49:07
(10)中观察方程中的同质协方差结构1pσε被异质协方差矩阵1pσε,x所取代。这一特征证明是对丹麦死亡率数据模型的重大改进。第二个推广是考虑潜在过程的随机波动性,即(10)中状态方程中的周期效应κ,以捕捉长期时间序列数据的观察特征。具体而言,提出了以下具有随机波动特征的扩展LC模型:yt=α+βκt+εt,εtiid~ N(0,σεp),(11a)κt=κt-1+θ+ωt,ωt |ξt~ N(0,exp{ξt}),(11b)ξt=λξt-1+λ+ηt,ηtiid~ N(0,σξ)(11c),其中ξt表示周期效应的随机波动率。该模型的贝叶斯推理基于粒子MCMC方法(Andrieu et al.(2 010))。尽管如表1所示,队列模型在死亡率建模中至关重要,但在文献的状态空间背景下,纳入队列因素的死亡率模型的计算仍有待研究和分析。在下文中,我们将介绍并演示我们通过状态空间方法学处理队列模型的方法。3队列效应:状态空间公式本节介绍状态空间框架中队列模型的公式。我们首先描述了队列f因子如何影响特定年龄死亡大鼠的进化。该图将为我们提供一种推导队列效应状态空间表示的方法。队列模型的贝叶斯推断将在第4.3.1节背景中发展Renshaw和Haberman(2006)介绍了队列fa cto rγt-xto Lee-Carter模型和年龄调节系数βγxas如下:ln mx,t=αx+βxκt+βγxγt-x(12),其中x∈ {x,…,xp}和t∈ {t。

15
nandehutu2022 在职认证  发表于 2022-5-31 06:49:10
,tn}分别表示年龄和日历年。这里是t-x代表出生年份,因此γt-xis是一个用来捕捉共同效应的因素。然而,Hunt和Villegas(2015)报告了队列模型(12)的数值估计,以产生基于回归设置的混合收敛结果。基于回归的队列模型的稳健性也受到质疑,因为据报道,模型的优度对所使用的数据和拟合算法很敏感。Currie(2016)也注意到了这些稳健性和收敛性问题,其中pa提出了基于广义线性和非线性模型的死亡率建模综合方法,有关简要讨论,请参见lso第2.2节。因此,这些问题为在状态空间框架中考虑队列模型提供了另一个动机,因为状态空间方法可能会消除其他方法中所需的两步估计程序所导致的效率低下,此外,上述文献中确定的灵敏度和收敛性差的结果似乎也无法支持这些问题。我们在第5.3.2节状态空间公式中报告了我们在估计和预测状态空间队列模型方面的经验发现。在本文中,我们重点关注全队列模型n emx,t=αx+βxκt+βγxγt-x+εx,t,(13),其中正在对粗死亡率的动力学进行建模,并包括噪声项εx,t。为了帮助解释我们如何推导队列模型的状态空间表示,我们考虑一个单元格矩阵,其中行和列分别对应于年龄(x)和年份(t),见表2。这里我们假设x=1,3且t=1,4用于说明。队列因子γt-xis按出生年份t索引- 表2中显示了x及其在每个单元格上的值。

16
何人来此 在职认证  发表于 2022-5-31 06:49:13
我们首先注意到γt的值-xis常数在“coortdirection”上,即在细胞(x,t),(x+1,t+1)等上。现在考虑队列模型(13),让γxt:=γt-x、 模型可以矩阵形式表示为ln em1、tln em2、tln em3、t=αα+ββκt+βγ0 00βγ0 0βγγtγtγt+ε1,tε2,tε3,t. (14) 年龄/年t=1 t=2 t=3 t=4x=1γγx=2γ-1γγx=3γ-2γ-1γγ表2:队列因子γt的值-xon细胞基质(x,t)。随着时间从t=1到t=4,队列向量(γt,γt,γt), 以矩阵形式表示系数,如下所示γ(=γ)γ(=γ-1) γ(=γ-(2)→γ(=γ)γ(=γ)γ(=γ-(1)→γ(=γ)γ(=γ)γ(=γ)→γ(=γ)γ(=γ)γ(=γ). (15) (15)中的关键观察结果是,队列向量的前两个元素- 在时间t,1将显示为队列向量的底部两个元素。模式也可以从表2中观察到。因此,队列向量的演化必须满足γtγtγt=* * *1 0 00 1 0γt-1γt-1γt-1.+ . . . , (16) 这实际上是“队列”定义属性的结果:γt-x=γ(t-(一)-(十)-i) 。此外,从(16)中可以明显看出,只需要对γtbut的动力学进行建模,而不需要对γtandγt进行建模。我们将利用这一观察结果推导队列模型的状态空间公式,接下来将介绍该公式。设yx=ln emx,t,在矩阵符号中,我们有(回忆一下γxt:=γt-x)yx,tyx,t。。。yxp,t=αxαx。。。αxp+βxβγx0··0βx0βγx··0。。。。。。。。。。。。。。。βxp0 0··βγxpκtγxtγxt。。。γxpt+εx,tεx,t。。。εxp,t. (17) 很明显,从(17)中,我们有yxi,t=αxi+βxiκt+βγxiγxit+εxi,t对应于(13)中的i∈ {1,…,p}。这里(κt,γxt。

17
mingdashike22 在职认证  发表于 2022-5-31 06:49:17
,γxpt)是p+1维状态向量。从(15)-(16),我们可以用矩阵表示法写出状态方程,如下所示:κtγxtγxt。。。γxp-1tγxpt=1 0 0··0 0 0 0λ0··0 0 0 0 0··0 0 0 0··0 0 0 0 0。。。。。。。。。。。。。。。。。。0 0 0··1 0κt-1γxt-1γxt-1.γxp-1吨-1γxpt-1.+θη。。。+ωκtωγt。。。. (18) 这里我们假设κt是一个随机漂移过程(ARIMA(0,1,0))κt=κt-1+θ+ωκt,ωκtiid~ N(0,σω),(19)和γxts的动力学由平稳AR(1)过程(ARIMA(1,0,0))γxt=λγxt描述-1+η+ωγt,ωγtiid~ N(0,σγ),(20),其中|λ|<1。通过在(18)中指定p+1矩阵的p+1的第二行,可以考虑γx的其他动力学。例如,一般可以将状态方程视为κtγxtγxt。。。γxp-1tγxpt=1 0 0··0 0 0λλ··λp-1λp0 1 0··0 0 0 0 1··0 0 0。。。。。。。。。。。。。。。。。。0 0 0··1 0κt-1γxt-1γxt-1.γxp-1吨-1γxpt-1.+θη。。。+ωκtωγt。。。, (21)式中,γxt=λγxt-1+λγxt-1+···+λp-1γxp-1吨-1+λpγxpt-1+η+ωγt自γxit以来是一个n ARIMA(p,0,0)过程-1=γxt-i、 i=2,p、 我们可以简洁地表示(17)-(18)的矩阵形式asyt=α+BДt+εt,εtiid~ N(0,σεp),(22a)Дt=∧Дt-1+Θ+ωt,ωtiid~ N(0,Υ),(22b),其中b=βxβγx0··0βx0βγx··0。。。。。。。。。。。。。。。βxp0 0··βγxp, ∧=1 0 0··0 0 0 0λ0··0 0 0 0 0··0 0 0 0··0 0 0 0 0。。。。。。。。。。。。。。。。。。0 0 0··1 0, Θ=θη。。。, (23)和Дt=(κt,γxt,…,γxpt), p维恒等式ma t rix和Υ是由p+1对角矩阵(σκ,σγ,0,…,0)构成的p+1。为简单起见,我们假设观测方程为齐次齐性;异方差可以被认为是由inFung等人开发的。

18
能者818 在职认证  发表于 2022-5-31 06:49:20
(2017年)。由于全队列模型(13)对以下转换(αx、βx、κt、βγx、γt)不变性,因此该模型不存在识别问题-x)→αx+cβx+cβγx,cβx,c(κt- c) ,cβγx,c(γt-x个- c),(24)其中c6=0和c6=0。识别问题可以通过施加以下参数约束来解决:xpXx=xβx=1,xpXx=xβγx=1,tnXt=tκt=0,tn-xXc=t-xpγc=0,(25)以确保识别独特的模型结构。Hunt和Villegas(2015)以及Currie(2016)进一步讨论了队列模型的可识别性问题。备注3.1观察和状态方程(17)-(18)表明,我们在这里建立的队列模型属于线性高斯类状态空间模型。因此,可以对模型与数据的匹配进行有效的最大似然估计或B ayesian估计,见Fung et al.(2017)。在本文中,我们关注的是贝叶斯证据,即预测的死亡率可以考虑参数的不确定性。3.3简化队列模型队列模型(12)假设队列因素对年龄特异性死亡的影响由系数βγx调节。凯恩斯等人(2009)报告了基于迭代的队列模型估计,以避免收敛问题。因此,Haberman a and R enshaw(2011)考虑将模型结构简化为mx,t=αx+βxκt+γt-x、 (26)也就是说,队列fa cto r的调节系数βγxf对于所有agex设定为1。

19
何人来此 在职认证  发表于 2022-5-31 06:49:23
建议简化模型(26)在将模型与重要数据进行拟合时,表现出更好的估计收敛行为。备注3.2当通过基于迭代的估计将队列模型设置为基于泊松或二值线性回归的数据时,通常会假设迭代方案的起始值来自其他类似模型的估计,例如LC模型或APC模型(Hunt和Villegas(2015),Currie(2016),Villegas等人(2015))。即使这样做,也不能保证收敛。我们将在第5节中报告,我们基于贝叶斯状态空间框架的方法不需要这样的假设,并且当数据中存在队列模式时,可以成功地对不同国家进行贝叶斯估计。在下文中,我们还将考虑模型yt=α+BsДt+εt,εtiid~ N(0,σεp),(27a)Дt=∧Дt-1+Θ+ωt,ωtiid~ N(0,Υ),(27b),其中=βx1 0··0βx0 1··0。。。。。。。。。。。。。。。βxp0 0···1. (28)它将被称为模拟队列模型。此外,以下参数约束集xpxx=xβx=1,tnXt=tκt=0,tn-xXc=t-xpγc=0,(29)用于确保简化队列模型的可识别性。4 coho r t模型的贝叶斯参考在本节中,我们首先详细介绍了状态空间公式中完整队列模型的贝叶斯估计(22)。第4.2节将讨论嵌套模型,包括简化队列模型(27)和LC模型(10)。我们首先注意到,科尔特模型和LC模型属于线性和高斯状态空间模型。因此,我们可以应用一种高效的MCMC估计算法,该算法基于G ibbssampling和共轭先验以及前向-后向滤波,如inFung等人所述。

20
可人4 在职认证  发表于 2022-5-31 06:49:26
(20 17),这形成了van Dyk和Park(2008)所谓的坍塌Gibbs取样器框架的特例。4.1全队列模型的贝叶斯推断对于全队列模型(22),目标密度由π(ψ0:n,ψ| y1:n)给出∝ π(y1:n |Д0:n,ψ)π(Д0:n |ψ)π(ψ)(30)=nYk=1π(yk |Д0:k,ψ)π(Дk |νk-1,ψ)π(Д)π(ψ)(31),其中,Д0:n:=(κ0:n,γx0:n,…,γxp0:n)是p+1维(对于每个t)潜态向量,ψ:=(β,βγ,α,θ,η,λ,σε,σκ,σγ)是3p+6维静态参数向量。为了简化符号,我们写t=1,n而不是t=t,tn.我们通过所谓的前向过滤后向采样(FFBS)算法(Carter和Kohn(1994))对潜在状态进行块采样,静态参数的后向样本通过共轭先验获得。算法1中描述了采样过程,其中N是执行的MCMC迭代次数。还请注意,符号ψ(i)-ν=(ψ(i),ψ(i)ν-1,ψ(i-1) ν+1,ψ(i)-1) 算法1中使用3p+6)。在算法1中,从第3行获得κ(i)1:nf后,可以通过设置κ(i)t=κ(i)t来施加约束tptκ(i)t=0- (1/n)Pnj=1?κ(i)j,其中t=1,n、 类似地,一旦从第3行的Д(i)0中获得▄γ(i)cis,设置γ(i)c=▄γ(i)c- (1/(n+p)- 1) )Pn-x个l=1.-xpγ(i)l, 其中C=1- xp,n- x、 将确保满足约束tpcγ(i)c=0。为了施加约束tpxβ(i)x=1,我们设置β(i)x=~β(i)x/Pxpj=x~β(i)j,其中x=x,xp,从5-7号线获得一次¢β(i)。(βγ)(i)的约束可以类似地施加。算法1π(ψ0:n,ψ| y1:n)的MCMC采样1:初始化:ψ=ψ(0)。2: 对于i=1,N do3:样品Д(i)0:nfromπ(Д0:N |ψ(i-1) ,y1:n)通过FFBS(第4.1.1节)。4: 施加约束Tptκ(i)t=0和Pcγ(i)c=0.5:对于h=1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 04:27