楼主: 可人4
723 14

[量化金融] DeepTriangle:损失准备金的深度学习方法 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

77%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
45.9407
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24788 点
帖子
4166
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-6-10 01:05:39 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《DeepTriangle: A Deep Learning Approach to Loss Reserving》
---
作者:
Kevin Kuo
---
最新提交年份:
2019
---
英文摘要:
  We propose a novel approach for loss reserving based on deep neural networks. The approach allows for joint modeling of paid losses and claims outstanding, and incorporation of heterogeneous inputs. We validate the models on loss reserving data across lines of business, and show that they improve on the predictive accuracy of existing stochastic methods. The models require minimal feature engineering and expert input, and can be automated to produce forecasts more frequently than manual workflows.
---
中文摘要:
我们提出了一种基于深度神经网络的新型损失准备金方法。该方法允许对已支付的损失和未决索赔进行联合建模,并合并不同的输入。我们验证了跨业务线的损失准备金数据模型,并表明它们提高了现有随机方法的预测精度。这些模型需要最少的特征工程和专家输入,并且可以自动化,以比手动工作流更频繁地生成预测。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--

---
PDF下载:
--> DeepTriangle:_A_Deep_Learning_Approach_to_Loss_Reserving.pdf (316.94 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Triangle Angle 学习方法 深度学习 deep

沙发
kedemingshi 在职认证  发表于 2022-6-10 01:05:44 |只看作者 |坛友微信交流群
ArticleDeepTriangle:损失服务的深度学习方法Kevin Kuo1,*卡萨艾;kevin@kasa.ai*通信:kevin@kasa.aiReceived:日期;接受:日期;发布日期:日期 摘要:允许对已支付损失和未决索赔进行联合建模,并合并异质输入。我们在跨业务线的损失准备金数据上验证了模型,并表明它们提高了现有随机方法的预测精度。这些模型需要最少的特征工程和专家输入,并且可以自动化,以比手动工作流更频繁地生成预测。关键词:损失准备金;机器学习;神经网络1。简介在财产保险公司和意外伤害保险公司的损失准备金活动中,精算师关注的是预测未来因索赔而产生的付款。从保险业各利益相关者的角度来看,准确估计这些付款很重要。对于保险公司的管理层来说,未付索赔的估计将为核保、定价和战略决策提供信息。对于投资者而言,损失准备金和与之相关的交易是保险公司资产负债表和损益表的重要组成部分。而且,对于监管机构来说,需要准确的损失准备金来适当了解保险公司的财务状况。索赔报告(保险人在损失发生后才知道损失)和索赔最终发展(在各因素导致损失准备金问题难以解决后,付款仍会持续很长时间)都可能存在时间滞后,对于这两种情况,已有大量文献和正在进行的积极研究。我们建议读者参考英国和维拉尔[9],了解问题和现有技术的调查。领域[],最近已进入损失准备金文献。

使用道具

藤椅
大多数88 在职认证  发表于 2022-6-10 01:05:47 |只看作者 |坛友微信交流群
Wüthrich[33]用神经网络扩充了传统的链梯法,以结合索赔特征,Gabrielli和Wüthrich[13]利用神经网络合成索赔数据,Gabrielli等人[12]和Gabrielli[11]将经典的参数损失准备金模型嵌入到神经网络中。更具体地说,Gabrielli等人【12】和Gabrielli【11】的发展建议初始化一个神经网络,以便在训练之前,它与一个经典模型精确对应,例如过度分散的泊松模型。然后,训练迭代调整神经网络的权重,以最小化预测误差,这可以解释为一个boosting过程。arXiv:1804.09253v4【统计美联社】1992年9月16日,共13页图1。前馈神经网络。在开发我们称之为DeepTriangle的框架时,我们还从现有的随机储备文献中获得了启示。除了已付损失外,建议利用数据的作品还包括[25][22]信息。Avanzi等人[2]超越了单一同质投资组合,考虑了保险公司投资组合中各业务线之间的依赖关系,而Peremans等人[24]在模型部署期间提出了稳健的一般网络权重。我们开发的方法在许多方面不同于现有的工作,并且在单个模型中同时具有以下内容。事实上,该体系结构还可以容纳任意的额外输入,如索赔计数数据和经济指标,如果这些数据可供建模者使用的话。其次,在模型更新或预测过程中,它不需要手动输入,这意味着预测可以比传统流程更频繁地生成,从而使管理层能够更快地对投资组合中的变化作出反应。术语,第3节讨论了使用的数据集,并介绍了拟议的神经网络架构,第5节总结道。2.

使用道具

板凳
mingdashike22 在职认证  发表于 2022-6-10 01:05:50 |只看作者 |坛友微信交流群
神经网络预备课程【14】【5】【34】本节简要概述。深度学习和损失发展三角的门户。图1所示的13层中的3层,其目标是预测inputx的输出。中间值被称为隐藏层,由h[l]j表示,它们试图将输入数据转换为表示形式,从而在预测输出时变得更加有用。计算图中的节点,对于每个层l=1,五十、 ash[L]j=g[L](z[L]j),(1)其中z[L]j=w[L]Tjh[L-1] +b[l]j,(2)j=。n[l][l]ljjn[l]g[l]l=。Lh[l]w[l]jb[l]J,这些是在培训期间学习的。对于l=1,我们将之前的层激活定义为输入,以便第二层的计算变成[1]j=g[1](w[1]Tjx+b[1]j)。(3) 此外,对于输出层l=l,我们计算预测^y=h[l]j=g[l](w[l]Tjh[l-1] +b[L]j)。(4) f=fLo 佛罗里达州-1.o · · · o F参数化asf(x;W[1],b[1],…,W[L],b[L])。这里,应该提到的是,g[l](l=1,…,l)属于神经网络,因为否则我们将有一个简单的线性模型组成。关闭模型预测值与实际值。在模型训练期间,上述参数将迭代更新,以最小化损失函数。参数化数据的每次更新(包括多次更新)称为一个历元。训练一个神经网络常常需要对数据进行多次传递。数据和模型架构3.1。数据来源每个事故年。在附表P数据中,数据汇总到事故年份发展年份记录中。Meyers【20】详细介绍了构建数据集的过程。遵循Meyers[20],我们将自己限制在一个子集的数据中,该数据涵盖四个业务线每个业务线。

使用道具

报纸
kedemingshi 在职认证  发表于 2022-6-10 01:05:53 |只看作者 |坛友微信交流群
这样做是为了便于与现有结果进行比较。我们在研究中使用了数据集中的以下变量:业务线、公司代码、意外事故。在本研究中,意外事故是指已发生的损失减去累计已付损失。公司代码是一个类别变量,表示记录与哪个保险公司相关。3.2. 培训/测试SetupLet指数1≤ 我≤ Idenote事故年份和1≤ j≤ Jdenote开发年份考虑不足。此外,让{Pi,j}和{OSi,j}分别表示已支付的增量损失和总索赔额或案件准备金。然后,在日历年I结束时,我们可以访问观测数据{Pi,j:I=1,…,I;j=1,…,I- i+1}(5)和{OSi,j:i=1,…,i;j=1,…,i- i+1}。(6) 假设我们对整个发展年的发展感兴趣;换句话说,对于未来值{bPi,j:i=2,…,i;j=i+1,…,i}和{cOSi,j:i=2,…,i;j=i+1,…,i}。然后,我们可以确定每个事故年的最终损失(UL),i=1,I通过计算culi=I-i+1∑j=1Pi,j+我∑j=I-i+2bPi,j!。(7) 开发年度10累计已支付损失。3.3. 响应和预测变量在DeepTriangle中,每个训练样本与一个事故年份-发展年份对相关联,理想发展年份j是序列(Yi,j,Yi,j+1,…,Yi,I-i+1),(8)Yi,j=(Pi,j/NPEiOSi,j/NPEi)npeii通过将值标准化为类似的量表,利用损失率使培训更容易进行。截至与单元格相关的日历年末:(Yi,1,Yi,2,…,Yi,j)-1). (9) 换句话说,对于每个事故年和我们有数据的每个评估日期,我们试图根据截至该日期的观察历史,预测事故年已支付损失和未决索赔的未来发展。

使用道具

地板
kedemingshi 在职认证  发表于 2022-6-10 01:05:56 |只看作者 |坛友微信交流群
虽然我们最终对i,j,已支付损失感兴趣,但我们将未决索赔作为模型的辅助输出。我们将在下一节详细阐述这种方法背后的原因。预测因素的第二个组成部分是与经验相关的公司识别者。因为我们在每次培训迭代中都包含了来自多家公司的经验,所以我们需要一种方法来实现图2中的5。DeepTriangle架构。Embed表示嵌入层,GRU表示选通递归单元,FC表示全连接层。详情见下一节。3.4. 模型体系结构如图2所示,DeepTriangle是一个多任务网络[],利用每个业务线的序列进行排序,每个模型都是根据多个公司的数据进行训练的。3.4.1. 多任务学习由于两个目标数量,即已付损失和未决索赔,是相关的,我们希望通过联合培训获得比单独预测每个数量更好的绩效。尽管Caruana[3]解释了为什么它可以改进预测:通过利用未决索赔的响应数据,我们有效地增加了训练数据的大小,因为我们为学习算法提供了更多的信号;通过尝试预测未决索赔,可能会有一些隐藏的特征,这些特征对于预测已付损失很有用;此外,通过尝试预测培训期间的未决索赔,我们施加了偏差,得出了一个超过随机噪声的模型。3.4.2. 顺序输入处理为了处理已支付损失和未决索赔的时间序列,我们使用了选通递归单元(GRU)[],这是一种适用于序列数据的递归神经网络(RNN)构建块。

使用道具

7
可人4 在职认证  发表于 2022-6-10 01:05:59 |只看作者 |坛友微信交流群
GRU的图形表示如图3所示,相关方程如下:△h<t>=tanh(Wh[Γrh<t-1> ,x<t>]+bh)(10)Γ<t>r=σ(Wr[h<t-1> ,x<t>]+br)(11)Γ<t>u=σ(Wu[h<t-1> ,x<t>]+bu)(12)注意使用尖括号来索引序列中的位置,而不是前馈神经网络中的层,如13h<t>=Γ<t>uh<t>+(1)第2.6节所示- Γ<t>u)h<t-1>. (13) h<t>x<t>tσlogistic sigmoid函数定义为σ(x)=1+exp(-x) 。(14) Wh、Wr、Wu、bh、br和BU是要学习的适当大小的权重矩阵和偏差。直观地说,h<t>~h<t>和Γ<t>ude决定了前一个状态和候选状态之间的权重。我们注意到,虽然GRU(和RNN通常)一开始可能看起来不透明,但它们包含更新权重的顺序指令,就像普通的前馈神经网络一样(事实上可以这样解释[14])。我们首先用GRU对序列预测器进行编码,以获得历史值的摘要编码。然后重复输出-1次,然后将其传递给解码器GRU,该解码器GRU输出每个时间步的隐藏状态。保理-这里选择1是因为对于第三个事故年,我们需要-隐藏单位和0.2的退出率。这里,辍学是指在训练期间,在每次迭代中,我们以指定的概率将隐藏单元的输出随机设置为零,可以通过移除一些隐藏单元来构建insub网络。3.4.3. 公司代码嵌入公司代码输入首先传递到嵌入层。在这个过程中,每个公司都映射到一个固定长度的向量inRk,其中KIS是一个超参数。在本例中,我们选择k=级别数-=49,正如Guo和Berkhahn[15]所建议的那样。换句话说,每个公司都由一个向量inR表示。

使用道具

8
何人来此 在职认证  发表于 2022-6-10 01:06:03 |只看作者 |坛友微信交流群
这种映射机制是神经网络的一部分,因此,为预测未来的有偿损失,对isnumerical表示法进行了优化。在索赔预测问题中相似的公司被映射到在欧几里德距离方面彼此接近的向量。直观地说,人们可以将这种表示法视为深度学习技术特性的代理,该技术已成功应用于推荐系统[]和零售销售预测[]。在精算学文献中,Richman和Wuthrich【27】利用嵌入层来捕捉死亡率预测中的区域特征,而Gabrielli等人【12】将其应用于损失准备金中的业务因素线。3.4.4. 完全连接的层和输出然后将来自GRU解码器的解码序列的每个时间步与companyembedding输出串联。然后将串联的值分别传递给两个完全连接层的子网络,每个子网络都有一个64个单元的隐藏层和一个dropoutstep。校正线性单位(ReLU)[23],定义为13图3中的7。门控循环单元。x 7→ max(0,x),(15)用作所有完全连接层(包括两个输出层)的激活函数(我们将其表示为bygin第2节)。我们注意到,这种输出激活的选择意味着我们只能预测非负现金流,即无回收。这一假设对于我们在实验中使用的数据集是合理的,但可能会进行修改以适应其他用例。3.5.

使用道具

9
mingdashike22 在职认证  发表于 2022-6-10 01:06:06 |只看作者 |坛友微信交流群
部署考虑虽然可能无法获得竞争对手的最新经验数据,但公司代码了解公司之间的同质性程度。如果新公司加入投资组合,或者如果公司和相关索赔被重组,则需要修改嵌入输入大小以适应新代码,保持架构的其余部分不变,然后重新调整模型。然后,网络将为新公司分配嵌入向量。将DeepTriangle整合到现有精算工作流程中。保险公司通常可以获得比监管机构更丰富的信息,这是本文实验的基础。例如,除了已支付和已发生的损失外,还可以包括claimcount三角形,以便模型还可以学习和预测频率信息。4、实验讨论结果。4.1. 对于所有事故年份的总和,评估指标8为截至开发年10的13项损失,然后计算投资组合规模大不相同的各行公司的均方根百分比误差(RMSPE)和平均绝对百分比误差(MAPE)。形式上,如果CLI是业务线l中的公司集合,则MAPEl=| Cl|∑C∈氯卡尔克- 尺骨, (16) andRMSPEl=VuT | Cl|∑C∈ClcULC公司- ULC)ULC!(17) 其中,C公司的预测和实际累计最终损失分别为Culcandulcare。评估的另一种方法可能涉及通过相关赚取保费或使用美元金额对公司结果进行加权。然而,由于数据集中公司规模的分布,权重将集中在少数几家公司。因此,为了获得更平衡的贬值,我们选择报告上述基于未加权百分比的度量。我们注意到最近的一项分析。4.2.

使用道具

10
可人4 在职认证  发表于 2022-6-10 01:06:09 |只看作者 |坛友微信交流群
实施和培训损失函数计算为均方误差预测时间步长的平均值。与单元格(i,j)相关的样本,我们可以将每个样本的损失写为- i+1- (j)- 1) 我-i+1∑k=j(cPi,k- Pi,k)+(dOSi,k- OSi,k)。(18) 为了优化,我们使用ADAM的AMSGRAD[]变体,学习率为0.0005。我们对验证集进行训练,但在超过200个历元的时间窗口内,验证集没有得到改善,我们终止训练,并恢复到验证损失最小的历元上的权重。早期停止标准中使用的验证集定义为1995日历年后可用的培训数据子集。对于每个业务线,我们创建了100个模型的集合,每个模型都使用与神经网络相关的相同架构进行训练。我们使用keras R包[]和TensorFlow[]实现了DeepTriangle,这是开源在线。第9页,共13页,表1。和ML。业务线Mack ODP CIT LIT ML DTMAP电子商务汽车0.060 0.217 0.052 0.052 0.068 0.043其他责任0.134 0.223 0.165 0.152 0.142 0.109私人客运汽车0.038 0.039 0.038 0.040 0 0.036 0.025工人赔偿0.053 0.105 0.054 0.054 0.067 0.046RMSpecCommercial汽车0.080 0 0.822 0.076 0.096 0.057其他责任0.202 0.477 0.220 0.209 0.181 0.150私人乘用车0.0610.063 0.057 0.060 0.059 0.039职工薪酬0.079 0.368 0.080 0.080 0 0.099 0.0674.3。结果和讨论链梯模型[]、bootstrap ODP模型[]、AutoML模型和Meyers[20]中的Bayesian马尔可夫链蒙特卡罗(MCMC)模型选择,包括相关增量趋势(CIT)和水平增量趋势(LIT)模型。对于随机模型,我们使用预测分布的平均值作为点估计,并与实际结果进行比较。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-7-7 15:26