楼主: mingdashike22
1695 40

[量化金融] 死亡率建模中的队列效应:贝叶斯状态空间方法 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-5-31 06:49:29
,p do6:样品β(i)xh从其后π(βxh |Д(i)0:n,ψ(i)-βxh,y1:n)7:结束8:施加约束pxβ(i)x=1.9:对于h=1,p do10:从其后π(βγxh |Д(i)0:n,ψ(i)取样品(βγxh)(i)-βγxh,y1:n)11:结束12:施加约束tpx(βγx)(i)=1.13:对于h=2p+1,3p+6 do14:样品ψ(i)hfromπ(ψh |Д(i)0:n,ψ(i)-h、 y1:n)15:结束16:结束4.1.1潜在状态动态的前向-后向滤波FFBS程序要求及时进行多元卡尔曼滤波,然后使用获得的滤波分布进行后向采样。对于全同态模型(1 7)-(18),多元Kalma n filteringrecursions中涉及的条件分布由νt给出-1 | y1:t-1.~ N(公吨-1,Ct-1) ,(32a)Дt | y1:t-1.~ N(at,Rt),(32b)yt | y1:t-1.~ N(ft,Qt),(32c)Дt | y1:t~ N(mt,Ct),(32d),其中t=∧mt-1+Θ,Rt=∧Ct-1∧+ Υ,(33a)ft=α+Bat,Qt=BRtB+ σεp,(33b)mt=at+RtBQ-1t(yt- ft),Ct=Rt- RtB公司Q-1 BRT。(33c)对于t=1,n、 由于π(Д0:n |ψ,y1:n)=nYt=0π(Дt |Дt+1:n,ψ,y1:n)=nYt=0π(Дt |Дt+1,ψ,y1:t),(34)我们可以看到,对于后一种状态的块采样,可以首先从n(mn,Cn)中提取νnf,然后从t=n中提取-1.1,0(时间上向后的t),抽取一个样本,ψ,y1:t粗略地给出一个样本,νt+1。

22
能者818 在职认证  发表于 2022-5-31 06:49:33
结果是:φt |φt+1,ψ,y1:t~ N(ht,ht),其中ht=mt+Ct∧R-1t+1(Иt+1- 在+1时,(35a)Ht=Ct- Ct∧R-1t+1∧Ct,(35b)基于Ka-lma n平滑(Carter和Kohn(1994))。4.1.2静态参数的后验概率为了对算法1中静态参数的后验分布进行采样,我们假设以下独立的联合先验:αx~ N(△uα,△σα),βx~ N(||Μβ,|∑β),βγx~ N(△μβγ,△σβγ),(36a)θ~ N(¢uθ,¢σθ),η~ N(¢uη,¢ση),λ~ N个[-1,1](¢uλ,¢σλ),(36b)σε~ IG(▄aε,▄bε),σκ~ IG(▄aκ,▄bκ),σγ~ IG(~aγ,~bγ),(36c),其中N[-1,1]表示带支撑的截断高斯分布[-1,1]a和IG(a,b)表示平均值为b/(a)的反向ga mma分布- 1) 和变量▄b/(▄a- 1) (a- 2) )表示大于2。然后得出静态参数的后验值如下:αx | y,Д,ψ-αx~ NσαPnt=1(yx,t- βxκt- βγxγxt)+▄uασε▄σαn+σε,▄σασε▄σαn+σε, (37)βx | y,Д,ψ-βx~ N∑βPnt=1(yx,t- (αx+βγxγxt))κt+~uβσε~σβPnt=1κt+σε,~σβσε~σβPnt=1κt+σε!,(38)βγx | y,Д,ψ-βγx~ N∑βγPnt=1(yx,t- (αx+βxκt))γxt+~uβγσε~σβγPnt=1(γxt)+σε,~σβγσε~σβγPnt=1(γxt)+σε!,(39)θ| y,Д,ψ-θ~ NσθPnt=1(κt- κt-1) +▄θσω▄σθn+σω,▄σθσω▄σθn+σω, (40)η| y,Д,ψ-θ~ NσηPnt=1(γxt- λγxt-1) +▄uησγ▄σηn+σγ,▄σησγ▄σηn+σγ, (41)λ| y,Д,ψ-λ~ N个[-1,1]σλPnt=1((γxt- η) γxt-1) +¢|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-1) +σγ,▄σλσγ▄σλPnt=1(γxt-1) +σγ, (42)为简单起见,我们表示y=y1:n,Д=Д0:nandψ-h=(ψ,…,ψh-1,ψh+1,ψ3p+6)。σε| y,Д,ψ-σε~ IGaε+np,bε+xpXx=xnXt=1(yx,t- (αx+βxκt+βγxγxt))!,(43)σκ| y,Д,ψ-σκ~ IG▄aκ+n,▄bκ+nXt=1(κt- (κt-1+θ)!,(44)σγ| y,Д,ψ-σγ~ IG▄aγ+n,▄bγ+nXt=1γxt- λγxt-1.!.

23
能者818 在职认证  发表于 2022-5-31 06:49:36
(45)4.2嵌套模型的贝叶斯推断算法1中给出的完整队列模型的MCMC估计可应用于嵌套模型,包括简化队列模型和仅带最小调整的LC模型。简化coho-rt模型的静态参数向量由ψ给出:=(β,α,θ,η,λ,σε,σκ,σγ),(46),其中不需要对coho-r因子的年龄调节系数βγxf进行采样。因此,在这种情况下,可以删除算法1中的第9-12行。此外,对于简化的cohor t模型,我们分别在(37)、(38)和(43)中的αx、βx和σε的后验分布中设置βγx=1。LC模型可被视为具有队列因子γt的简化队列模型的进一步嵌套模型-x=0。因此,状态方程是一维的,其中φ0:n:=κ0:n,静态参数向量由ψ:=(β,α,θ,σε,σκ)组成。(47)LC模型的识别约束由xpxx=xβx=1,tnXt=tκt=0给出。(48)因此,不需要第4行中的约束Pcγ(i)c=0和Algo r it hm1中βγxin第9-12行的采样。我们还将(37)、(38)和(43)中的β、α和σε的后验分布中的γxt分别设置为0。有关LC模型贝叶斯估计的更多详细信息,请参见Fung等人(2017)。5实证研究我们根据状态空间框架下的共同模型公式分析了来自不同国家的几组死亡率数据。我们考虑了完整队列模型和简化队列模型。此外,我们比较了队列模型和LC模型的模型拟合及其预测特性。我们考虑的国家包括英格兰和威尔士(英国)、美国(美国)和意大利(意大利)。我们对男性和女性死亡数据进行分析,以调查一个国家内的队列效应是否对两性都有影响。

24
大多数88 在职认证  发表于 2022-5-31 06:49:39
数据来自人类死亡率数据库。这一年的范围是从1970年到2010年,我们将注意力限制在65-95岁之间。因此,出生年份的范围是1875-1945.5.1模型估计我们运行第4节中描述的马尔可夫链采样器进行30000次迭代,磨合期设置为15000次迭代,以确保链已达到稳定状态;因此,我们剩下15000个后验样本。对于所有高斯先验N(|u,|σ),包括截断高斯N[-1,1](|u,|σ),我们假设|u=0,|σ=10;而对于反伽马优先级s IG(▄a,▄b),我们将▄a=2.01和▄b=0.01。选择并测试超参数,以确保先验信息充分模糊。为了启动卡尔曼滤波器,我们假设m=0,并且是对角线元素均等于10的径向协方差矩阵(参见(32a))。我们将x={x,…,xp}指年龄={65,…,95},将t={t,…,tn}指年份={1970,…,2010}(即p=31,t=41)。如前所述,这种方法不需要部分特殊的初始化,它似乎对起点的选择相对稳健。为了启动全队列模型的链,静态参数的初始值设置如下:α(0)x=(1/n)Ptyx,t,β(0)x=(βγx)(0)=1/p,θ(0)=η(0)=-0.1,(σε)(0)=(σω)(0)=(σγ)(0)=0.01,λ(0)=0.5,其中x∈ {x,…,xp}。

25
能者818 在职认证  发表于 2022-5-31 06:49:42
除了不需要βγxis的抽样外,简化队列模型也使用了相同的一组值。5.1.1全队列模型对于全队列模型,英国、美国和意大利男性人群的κ、γ、α、β和βγ参数的后验平均值和95%可信区间如图1所示。考虑到观察到的线性趋势,假设周期效应遵循随机游走和漂移过程对于英国和意大利男性人口来说似乎是合理的,但对于美国男性人口来说则不太合适,因为在考虑的年龄范围内似乎存在结构变化(另见Li et al.(2011)和van Berkum et al.(2016))。对于英国和意大利的数据,估计的队列因素显示了1920年出生年份的明显转折点。这与1940年左右第二次世界大战在欧洲集中爆发的年轻一代(20岁左右)相对应。对于美国人口来说,1900年出生的那一代人有一种轻微的近况。第5.2节将更详细地讨论队列因素对模型fit的突然变化的影响,其中通过残差对队列模型与LC模型进行了比较。cohortwww最初几年的波动加剧。死亡率rgfactor可归因于用于推断第一个出生年份的队列因素的数据有限,因此产生了更大的不确定性。图2显示了女性群体的相应结果。我们还观察到相似的模式,即女性群体的队列因素中的扭结与男性群体中的扭结几乎完全相同。这表明,至少对于我们在这里介绍的国家来说,队列效应不是性别特异性的,而是属于部分世代的人的常见现象。

26
nandehutu2022 在职认证  发表于 2022-5-31 06:49:45
本案例中的这一发现可能归因于男女共同的死亡率经历,这与第二世界世界平均水平相对应,对欧洲产生了重大的全球影响。其他参数的后验统计数据如表3所示。英国-美国意大利男性θ-0.18[-0.40,0.02]-0.20[-0.35,-0.04]-0.37[-0.63,-0.10]η-0.57[-0.79,-0.36]-0.21[-0.29,-0.14]-0.55[-0.98,-0.12]λ0.993[0.977,0.999]0.990[0.975,0.999]0.98[0.94,0.99]σε0.00028[0.00026],0.00030]0.00020[0.00019,0.00 022]0.00032[0.00030,0.00035]σω0.46[0.29,0.72]0.23[0.14,0.36]0.71[0.44,1.10]σγ0.46[0.28,0.72]0.019[0.008,0.03]1.93[1.22,3.00]雌性θ-0.19[-0.41,0.02]-0.51[-0.70,-0.33]-0.42[-0.73,-0.11]η-0.37[-0.56,-0.19]0.38[0.17,0.61]-0.51[-0.8 8,-0.14]λ0.990[0.966,0.999]0.89[0.81,0.96]0.98[0.94,0.99]ε0.00023[0.00021,0.00025]0.00022[0.00020,0.00 024]0.00029[0.00027,0.00032]σω0.52[0.33,0.81]0.34[0.22,0.54]0.98[0.61,1.54]σγ0.35[0.22,0.56]0.07[0.04,0.13]1.41[0.90,2.19]表3:男性和女性人口数据全队列模型静态参数的估计后验平均值。[,.]其次,估计值代表95%的后验可信区间。5.1.2简化的c-ohort模型图3显示了估计参数κ、γ、α、β的后验平均值和95%后验可信区间,其中UK,美国和意大利男性死亡率数据用于拟合简化队列模型,其中假设所有年龄x的βγx=1。简化队列模型的估计值与英国和意大利数据的完整队列模型的估计值具有非常相似的模式。有趣的是,美国数据可能并非如此,因为估计的κ和γ与从全队列模型中获得的相应值相差很大。

27
何人来此 在职认证  发表于 2022-5-31 06:49:48
由于简化模型和完整队列模型之间的唯一差异是βγxis允许在完整队列模型中自由变化,因此两个模型产生的估计值κ的相当大的差异可能会导致人们质疑加入队列因子是否适合于美国死亡率数据;换句话说,队列效应可能对美国过去的死亡率经验并不重要。我们将进一步检查第5.2节。还请注意,简化模型的γ估计值明显小于完整模型。其原因是,全模型的约束pxβγx=1规定βγx将取1/p的值,其实质上比1大,其中p=31是数据中考虑的年龄数;而简化模型假设βγx=1。可以考虑在简化模型中拟合βγx=1/p,以便简化模型和完整模型中γ的估计值将处于相同或量级的顺序。然而,这不应影响最终模型的拟合和预测。女性人口的相应估计结果如图4所示。

28
何人来此 在职认证  发表于 2022-5-31 06:49:51
Weagain观察到,估计结果显示,这三个国家的男性和女性人口具有相似性,因此表明,男女的死亡经历具有共同的主要特征。表4中报告了男性和女性死亡率数据简化队列模型其他静态参数的后验估计值。英国-美国意大利男性θ-0.22[-0.44,0.007]-0.50[-0.67,-0.33]-0.30[-0.56,-0.03]η-0.022[-0.034,-0.011]-0.003[-0.013,-0.007]-0.019[-0.034,-0.004]λ0.991[0.970,0.999]0.973[0.909,0.999]0.982[0.944,0.999]ε0.00035[0.00032,0.00038]0.00025[0.00023,0.00 027]0.00033[0.00031,0.00036]σω0.46[0.29,0.73]0.23[0.14,0.37]0.68[0.43,1.06]γσ0.0012[0.008,0.0019]0.0007[0.00 04,0.0010]0.0023[0.001 5,0.0036]雌性θ-0.40[-0.64,-0.14]-0.61[-0.81,-0.41]-0.39[-0.70,-0.08]η-0.013[-0.024,-0.002]0.01 8[0.0005,0.043]-0.019[-0.033,-0.005]λ0.98[0.95,0.99]0.89[0.74,0.99]0.99]97[0.93,0.99]σε0.00025[0.00023,0.00028]0.00025[0.00023,0.00 027]0.00032[0.00029,0.00035]σω0.60[0.38,0.94]0.38[0.24,0.60]0.95[0.60,1.50]σγ0.0012[0.0 008,0.0019]0.0006[0.00 04,0.0010]0.002[0.001,0.003]表4:男性和女性人口数据简化队列模型静态参数的估计后验平均值。[,.]代表95%的后验可信区间。5.2模型拟合:与LC模型相比,我们通过残余热图以及偏差信息标准(DIC)来检验cohor t模型的拟合。

29
mingdashike22 在职认证  发表于 2022-5-31 06:49:54
我们强调将队列模型与LC模型进行比较的重要性,因为如果致命数据中存在队列模式,普通LC模型将无法捕捉到这一现象,但设计了队列模型来实现这一点。5.2.1状态空间模型下的残余热图残余量定义为观测数据yt与样本中提前一步模型f预测的平均值之间的差异(见(32c))e【yt |ψ,y1:t-1] =英尺,(49),其中t=1,n、 明确地说,we haveet:=yt- ft(50),其中etis是时间t的残差向量。使用后验平均值作为静态参数的点估计值,我们通过对队列模型和LC模型的卡尔曼滤波,获得样本内领先一步的ft平均值。图5显示了英国、美国和意大利男性人口的LC模型、简化同龄人模型和全同龄人模型产生的残余热图。在英国和意大利人口的LC模型拟合中观察到的独特对角线带,对应于1920年左右出生的几代人,清楚地表明这些国家存在着强烈的群体效应,LC模型无法解释这些模式。相反,所考虑的队列模型能够捕捉这些影响,这得到了从残差图中删除对角线带的观察结果的支持。这些结果与图1和图2所示的估计队列因素一致,其中1920年出生的队列周围出现明显的不规则性。另一方面,美国男性群体LC模型的残余热图显示,在1900年和1920年,只有很小的对角线带痕迹,几乎看不到。coho-rt模型的相应曲线图表明,这些条带甚至进一步减少。

30
何人来此 在职认证  发表于 2022-5-31 06:49:57
美国男性数据中对角线带的出现非常微弱,这与第5.1节中提出的意见一致,即没有明确证据表明美国男性人口表现出某些队列模式。图6显示了女性种群的相应剩余热图。结果与男性群体的讨论非常接近。它进一步证明,在所考虑的国家,包括同居影响在内的主要死亡率特征并没有性别特异性。此处显示的残差图还表明,特定国家存在短期模式的决定因素取决于估计的因素队列中是否观察到任何突然的不规则情况;这种非光滑的不规则性表明,在LC模型无法捕获的数据中存在强队列模式。另一方面,如果估计的队列因素与美国数据相当平稳,则可能不需要死亡率模型中的队列因素。5.2.2偏差信息标准我们使用偏差信息标准(DIC)进行模型排名,该标准是为贝叶斯模型专门设计的,考虑到了模型和复杂性之间的相互影响(Spiegelhalter et al.(20 02))。DIC有多种版本,我们将重点关注所谓的条件DIC,其中在计算条件可能性时,潜伏期被重新视为参数(Celeux et al.(2006),Chan and Grant(2016))。具体而言,条件DIC利用了给定的条件对数似然,即nπ(y1:n |ψ,ν0:n)=-xpXx=xtnXt=tln 2πσε+yx,t- (αx+βxκt+βγxγt-x) σε!, (51)对于全队列模型;简化队列模型和LC模型的条件对数可能性可以得到类似的结果。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 11:10