楼主: mingdashike22
587 6

[量化金融] 死亡率建模的机器学习技术 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

79%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
71.3622
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
25194 点
帖子
4201
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Machine Learning Techniques for Mortality Modeling》
---
作者:
Philippe Deprez, Pavel V. Shevchenko and Mario V. W\\\"uthrich
---
最新提交年份:
2017
---
英文摘要:
  Various stochastic models have been proposed to estimate mortality rates. In this paper we illustrate how machine learning techniques allow us to analyze the quality of such mortality models. In addition, we present how these techniques can be used for differentiating the different causes of death in mortality modeling.
---
中文摘要:
人们提出了各种随机模型来估计死亡率。在本文中,我们将说明机器学习技术如何允许我们分析此类死亡率模型的质量。此外,我们还介绍了如何在死亡率建模中使用这些技术来区分不同的死亡原因。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Machine_Learning_Techniques_for_Mortality_Modeling.pdf (937.79 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 死亡率 Applications Quantitative epidemiology

沙发
大多数88 在职认证  发表于 2022-5-31 12:04:54 |只看作者 |坛友微信交流群
死亡率建模的机器学习技术Philippe Deprez*帕维尔诉舍甫琴科+马里奥诉乌特里希*2017年2月20日摘要人们提出了各种随机模型来估计死亡率。在本文中,我们将说明机器学习技术如何允许我们分析此类死亡率模型的质量。此外,我们还介绍了如何在死亡率建模中使用这些技术来区分不同的死亡原因。关键词:死亡率建模、死亡原因死亡率、机器学习、boosting、回归。1引言死亡率建模在经济、人口统计学以及人寿和社会保险中至关重要,因为死亡率决定了保险负债、保险产品价格和社会福利方案。因此,从Lee-Carter模型开始,人们提出了许多不同的随机死亡率模型来估计和预测这些死亡率。有关现有模型的广泛概述和比较,请参阅[3]。在本文中,我们回顾了其中的两个模型,并研究了它们与瑞士死亡率数据的校准。我们举例说明机器学习技术如何帮助我们研究估计死亡率的充分性。通过应用回归树桩机,我们分析了如何根据个体的特征成分(如年龄或出生队列)改进建模。这种(非参数)回归方法允许我们检测不同死亡率模型的弱点。在这项工作的第二部分中,我们调查了死亡原因。假设一个具有特定特征的个体死亡,我们研究其原因的条件概率。基于WISS死亡率数据,我们说明了如何在泊松模型框架下应用回归树算法来估计这些条件概率。

使用道具

藤椅
mingdashike22 在职认证  发表于 2022-5-31 12:04:57 |只看作者 |坛友微信交流群
所提出的技术提供了一种简单的方法来检测这些概率随时间变化的模式。关于死亡原因的参数建模方法和现有文献,我们参考了[1,4]及其参考文献。*瑞士苏黎世ETH数学系RiskLab+澳大利亚麦格理大学应用金融和精算研究系+瑞士金融学院SFI教授论文组织。在下一节中,我们将介绍符号并说明模型假设。在第3节中,我们分析了两个标准模型,Lee Carter[5]模型和theRenshaw Haberman[7]模型,并解释了如何应用机器学习技术来研究这些模型对于给定数据集的充分性。请注意,这里我们不考虑最复杂的模型,但我们的目标是研究著名的标准模型,并指出如何通过机器学习检测它们的优缺点。在第4节中,我们将这些模型重新定义为死亡原因分析。2模型假设在死亡率建模中,每个人都由其性别、年龄和考虑该人的日历年(也称为期间)来确定。因此,每个人都被分配到特征x=(g,a,t)∈ X=G×A×T,特征分量sg={雌性,雄性},A={0,…,ω},T={tmin,…,tmax}。(2.1)此处,a∈ A代表人的年龄(以年为单位),ω∈ N表示人能达到的最大可能距离。

使用道具

板凳
大多数88 在职认证  发表于 2022-5-31 12:05:00 |只看作者 |坛友微信交流群
组件T n描述所考虑的日历年。这个特征空间X=G×A×T可以通过进一步的特征成分进行扩展,例如一个人的收入或婚姻状况,然而,在我们的研究中,我们没有额外的个人信息。对于给定特征x=(g,a,t)∈ X我们用Ex表示(确定性)暴露≥ 1和Dx对应的(随机)死亡人数≥ 也就是说,对于给定的特征x=(g,a,t)∈ 在这一时期(t,t+1)的开始,我们有一些特征为X的人还活着,而在这一时期,这些人中有四分之一死亡。文献中常见的两个假设是,对于不同的X,X是独立的∈ X,每个dx都有一个泊松分布,其参数与Ex成比例。这还假设死亡率在每个时期(t,t+1)保持不变。本着这种精神,我们考虑以下模型假设。模型假设2.1。假设死亡率由回归函数q:X给出→ [0,1],x 7→ q(x)。死亡人数满足以下属性:o(Dx)x∈x独立于x∈ 十、oDx公司~ 所有x的poi(q(x)Ex)∈ 十、主要困难是正确估计死亡率q:X→ [0,1]来自给定人口的历史数据。特别是,我们想从观察中推断q(·)。文献中已经开发了几个模型来解决这个问题。在下一节中,我们将考虑两个标准模型,并解释如何应用机器学习技术对这两个模型进行回测。3提高死亡率我们研究了两种不同的估计死亡率的经典模型:Lee-Carter模型和Renshaw-Haberman模型。通过应用机器学习技术,我们可以分析这些模型的缺点。请注意,此插图主要具有教学价值。

使用道具

报纸
何人来此 在职认证  发表于 2022-5-31 12:05:03 |只看作者 |坛友微信交流群
首先,Lee-Carter模型是一个相对简单的模型,在各种研究中在许多方向得到了改进。其次,这些改进之一是RenshawHaberman模型,我们将其与Lee-Carter模型进行比较。以下分析基于人类死亡率数据库提供的瑞士历史死亡率数据,见www.detairation。组织。我们考虑的数据包括风险敞口(Ex)x∈x和死亡人数(Dx)x∈xf对于特征空间X=G×A×T,特征分量sg={女性,男性},A={0,1,…,97},T={18761877,…,2014}。在这里,最大年龄a=97对应于至少97岁的年龄,组T由139年的观察组成。这导致2·98·139=27244个数据点,对应于139年观察期内的7867978例死亡。3.1 Lee-Carter模型的回测我们首先考虑经典的Lee-Carter模型,并应用回归树推进来检测其弱点。Lee-Carter模型是一个相对简单的模型,其中假设死亡率为公式qlc(x)=expβ0,ga+β1,gaκgt, 对于x=(g,a,t)∈ X,每个g的可识别性约束为spaβ1、ga=1和ptκgt=0∈ G、 固定性别∈ G我们使用“StMoMo”R包将参数β0、ga、β1、ga和κGT输入瑞士死亡率数据,见【11】,如下>LC<-拟合(LC(link=“log”),Dxt=死亡,Ext=暴露)>q.LC<-拟合(LC,type=“rates”)(3.1)暴露(Ex)x∈x和死亡人数(Dx)x∈Xare输入数据,并将上述命令应用于每个性别g∈ G单独。q、 LC然后提供Lee Cartermortality rates(qLC(x))x∈符合瑞士数据。这些死亡率在图1中用虚线表示,并与图1中点所示的粗(观察到的)死亡率Dx/exill进行比较。

使用道具

地板
能者818 在职认证  发表于 2022-5-31 12:05:08 |只看作者 |坛友微信交流群
我们旨在使用机器学习技术对这些确定的死亡率进行回溯测试。为此,我们使用从Lee Carter fit(3.1)中获得的比率q(x)=qLC(x)初始化模型假设2.1,即我们考虑x∈ X,Dx~ POI(u(x)dx),带u(x)≡ 1和dx=qLC(x)Ex.(3.2)观察到dx描述了根据Lee Carter fit.Toback检验的预期死亡人数。该模型分析了常数因子u(x)≡ 1是考虑到的瑞士数据的适当选择。例如,对于给定的特征x∈ X如果Lee-Carter死亡率qLC(X)低估了粗死亡率Dx/Ex,则应增加该因子u(X)。因此,我们的目标是根据所选特征X校准(3.2)中的因子u(X)∈ 十、为此,我们将泊松回归树推进机的一个步骤应用于工作数据(Dx,x,Dx)x∈十、 参见【2】和【13】中的第6.4节。这种标准化的二进制分割(SBS)Treegrow算法在每个迭代步骤中选择一个特征组件(性别、年龄或日历年),并按照所选特征组件以矩形方式分割特征空间X。每次拆分的明确选择基于对该拆分所产生的给定损失函数的优化改进。然后,该算法提供了一个SBS泊松回归树估计量^u(x),x∈ 在从这些拆分中获得的X的每个矩形子集上进行校准。也就是说,我们使用这种非参数回归方法获得^u(·)作为u(·)的校准;我们参考[13]了解有关此回归树提升的更多详细信息。观察到SBS树生长算法仅通过生成特征空间X的矩形分割来校准u(·)。然而,我们还想针对出生队列校准因子u(·),这需要特征空间的对角线分割。

使用道具

7
能者818 在职认证  发表于 2022-5-31 12:05:11 |只看作者 |坛友微信交流群
因此,我们将特征空间X扩展到特征空间'X={(g,a,t,c=t- a) | g∈ G、 a∈ A、 t型∈ T},其中c=T- a提供特征x=(g,a,t)的队列∈ 十、请注意,X和'X之间存在一对一的对应关系,但此扩展是必要的,以允许SBS中有足够的自由度。由此我们可以看出,智能模型设计包括对特征空间的深思熟虑的选择,允许所需的交互和依赖性。我们应用SBS树生长算法来校准(3.2)中关于(扩展)特征空间“X”的u(·)。这是在R中使用“rpart”包获得的,请参见[10],输入>树<-rpart(cbind(体积,死亡)~ 性别+年龄+年份+队列,数据=数据,方法=“泊松”,cp=2e-3)>mu<-预测(树)(3.3)这里,数据包含每个特征x=(g,a,t)∈ X体积Dx和死亡人数Dx,我们根据性别g、年龄a、年龄t和队列c=t进行优化- a、 成本复杂性参数cp允许我们控制回归树算法执行的迭代步骤的数量,有关此控制参数的更多详细信息,请参阅[13]第5.2节。回归树估计量^u(·)由mu给出。该估计器允许我们定义回归树改进死亡率qtree(x)=μu(x)qLC(x),对于x∈ 十、(3.4)这些死亡率在图1中以直线表示,并与以虚线表示的Lee Carter fitqlc(x)进行比较。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-7-4 17:08