楼主: kedemingshi
1120 46

[量化金融] 受观测延迟影响的隐藏事件数建模 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-2 21:45:01
在某个特定日期观察事件的概率是由该日期的持续时间来衡量的,这促使我们将该时间称为观察暴露时间(observationexposure)。对于发生日期为t且观测延迟为d天的事件,我们将其时间变化延迟φt(d)定义为φt(0)=0,且φt(d)=dXi=1αt,t+i-1,d∈ N \\{0}。(6) 这是发生日期t和日期t+d之间的所有观察暴露αt的总和-1、通过应用观测延迟随机变量μt,我们获得了一个随时间变化的随机变量|U:=μt(Ut),它与事件的发生日期t无关。使用关系pt,s=P(Ut),可以很容易地从该分布中提取离散观测概率∈ [s]-t、 s-t+1))(7)=FUs-t+1Xi=1αt,t+i-1.- FUs-tXi=1αt,t+i-1.在时变变换下,约束(5)变成αt,s>0,t、 s和xs>tαt,s=∞, t、 我们为每日观察暴露量指定了一个回归模型,作为协变量的函数。Wesetlog(αt,s)=xt,s·γ,2延迟事件发生的粒度模型8(A)离散αthu,0s- tThu Fri-Sat-Sun-Mon-Tue-Wedpt,s(b)continuousuαthu,0Thu-Fri-Sat-Sun-Mon-Tue-WedfUt(c)时间变化Дt(u)αThuThuFriSatSunMonTueWedfuαSat图2:周四发生事件的观测延迟分布。我们说明了(a)离散观测延迟概率pt,s,(b)连续观测延迟分布的密度Utan和(c)时变观测延迟分布的密度U。对于向量xt,与观测日期s上发生的事件相关的sof协变量和相应的参数向量γ。

12
可人4 在职认证  发表于 2022-6-2 21:45:04
与经典回归方法相比,报告概率pt,sno不仅仅取决于观测日期的特征,而是通过时间变化策略考虑事件发生和观测日期之间的完整历史。图2c说明了这种时间变化。由于周末报告的索赔较少,我们将观察风险作为一周报告日的函数进行建模。然后,时间变化将较低的观测风险分配给周六和周日,从而将图2b中的连续分布转化为可使用标准损失分布建模的时间变化分布。2.2校准我们的方法将观测延迟模型分为两个部分。(6)中定义的时变变换(time changetransformation)捕获了观察过程中的异质性。这种转换由每日观察暴露量表示,需要校准回归参数γ。时间变换后的观测延迟U采用简单的参数概率分布建模,其中数据将帮助我们选择最佳候选。我们优化了(4)中关于γ的对数似然,即最大化`(γ;χ)=τXt=1τXs=tNt,s·log“FUsXv=tαt,v!- FUs-1Xv=tαt,v#-τXt=1NRt(τ)·log“FUτXv=tαt,v!#,2延迟事件发生的粒度模型9,αt,v=expxt,v·γ. 在线附录A描述了该对数可能性的优化策略,该策略适用于任何有效平滑分布FU(·)。所描述的策略是通用的,不会立即考虑所选分布的属性。当▄U遵循标准指数分布时,可以显著减少计算时间。

13
大多数88 在职认证  发表于 2022-6-2 21:45:07
然后对数似然变为`(γ;χ)=-τXt=1τXs=tNt,s·s-1Xv=tαt,v- 日志(1- 经验值(-αt,s))!(8)-τXt=1NRt(τ)·log1- 经验值-τXv=tαt,v!!。(8)中的第一行是一个总和,其中每个项取决于单个观测暴露αt,s。由于这有助于计算与报告暴露相关的一阶和二阶导数,因此计算时间较短。2.3预测隐藏事件的数量在评估日期τ,我们预测过去发生日期t的事件数量,这些事件将在未来日期s观察到。因此,我们的重点是nt,s,对于t 6τ和s>τ。我们汇总这些未来的每日观察计数,以确定隐藏事件的总数n隐藏(τ)=τXt=1n隐藏(τ)=τXt=1∞Xs=τ+1Nt,s。根据(1)中的泊松假设,每个随机变量Nt,sis独立泊松分布,平均值(Nt,s)=λt·pt,s。第2.1节中建立的观测延迟模型提供了观测概率pt,s的估计,见(7)^pt,s=P(~U∈ [^1t(s- t) ,^1t(s- t+1))|γ)。在(3)中,我们为索赔发生强度ondate t提出了一个实用的非参数估计量,即^λt=NObst(τ)^pObst(τ)。(9) 该估计器仅依赖于观测事件和估计的观测延迟分布。当事件生成过程不稳定时,这是一个优势。对于有3个案例研究的日期:报告保险中的延迟动态10意外发生的许多事件,观察的数量将更高,因此我们可以正确预测更多的事件发生。不利的一面是,(9)对于最近的日期,当Denominator接近于零或日常事件数量较低时,可靠性较低。当数据集很小时,按照Bonetti et al.(2016)和Verbelen et al.(2017)中概述的策略,非参数估值器可以由参数估值器代替。

14
可人4 在职认证  发表于 2022-6-2 21:45:10
在参数框架中,发生强度的估计值可能包括每日风险敞口,表示为每天影响的保单数量。包括风险敞口增加了参数模型对投资组合规模演变的稳健性,并可能提高模型的预测性能。3案例研究:报告保险中的延迟动态3.1数据特征我们通过分析荷兰的责任保险数据集来说明我们的方法。鸽子等人(2013)、鸽子等人(2014)和戈德·查伦·安东尼奥(2015)研究了相同的数据,重点是计算离散时间的储量、安东尼奥和普拉特(2014)连续时间的模型储量和韦伯伦等人(2017),他们提出了每日隐藏索赔计数的数量模型。数据登记了506235件与1996年7月至2009年8月期间发生和报告的保险事件有关的索赔。从这些索赔中,我们删除了75项报告日期早于事故日期的观察结果,以及559项因报告系统过渡而产生的索赔。我们关注事故发生日期和相应的报告延迟天数,即事故发生与向保险公司报告或索赔之间的时间(天数)。为了避免由于聚合而失去有价值的见解,我们每天都在研究数据。这是可用数据的最大粒度尺度。发生的事故图3显示了1996年朱利至2009年8月期间发生的每日事故数量,并在2009年8月31日之前向保险公司报告了索赔。由于只观察到2009年8月31日之前报告的索赔,我们看到最近日期的观察事件计数有所增加,其中有大量未报告的索赔。

15
能者818 在职认证  发表于 2022-6-2 21:45:13
图中未显示两个异常值,即2002年10月27日的456起事故和2007年1月18日的818起事故。这两个异常值都对应于造成许多保险事件的荷兰风暴。图中的红线显示了最近30天内发生次数的移动平均值。这一趋势揭示了发生过程中的季节模式,夏季发生的事件更多。荷兰皇家国家气象研究所(KNMI)关于风暴的详情(荷兰语):https://knmi.nl/over-het-knmi/nieuws/storm-van-27-oktober-2002-was-zwaarste-in-twaalf-jaar andhttps://knmi.nl/over-het-knmi/nieuws/de-zware-storm-kyrill-van-18-januari-20073案例研究:由于投资组合规模的增加,保险11trend中的报告延迟动态随时间略有增加。图3中的一些outlyingobservations对应于1月1日的事件,如每年年初的垂直灰色条所示。010020003004001996 1997 1998 1999 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010年事故发生日统计图3:1996年7月至2009年8月期间发生并于2009年8月之前报告的每日事故数。实线显示最近30个日期内发生事故的移动平均数。图中未显示两个异常值:2002年10月27日(456起事故)和2007年1月18日(818起事故)。报告的索赔图4显示了1996年7月至2009年8月期间每天报告的索赔数量。红线再次显示了最近30天内报告索赔数量的移动平均值。图3中观察到的事件计数的季节性导致报告的索赔计数具有类似的季节性模式,但由于索赔报告的延迟,略有滞后。

16
kedemingshi 在职认证  发表于 2022-6-2 21:45:16
图4显示了两种报告制度。大多数日期都有许多索赔报告,但有相当多的日期很少或几乎没有索赔报告。这些报告很少的日期与周末(周六、周日)和国定假日相对应。由于事故在周末和节假日期间继续发生,因此在发生过程中,这两种制度的分离并非如此。在图5中,我们进一步说明了这些日历日效应,其中在特定日期的报告大幅减少。左图列出了1996年7月至2009年8月期间,所有企业停业的十个国家法定节假日的平均索赔报告数量。将这些平均数与观察期内报告的索赔总数的总日平均数进行比较。这表明,在国定假日,报告数量大幅减少。我们包括两个非官方假日,除夕夜和耶稣受难日。这些日期显示报告数量略有减少,因为许多人都会休息一天。工作日的报告行为如图5b所示。周末,尤其是周日,报告数量减少。这些日历日效应推动了IBNR每日索赔计数模型的建立,能够将我们在实证分析中观察到的工作日和假日效应结合起来。荷兰国定假日列表:http://www.officeholidays.com/countries/netherlands/3案例研究:保险中的报告延迟动态1201002003001001996 1997 1999 2001 2002 2003 2004 2005 2006 2007 2008 2010报告日报告索赔计数图4:1996年7月至2009年8月期间每个日期报告的索赔日数。

17
kedemingshi 在职认证  发表于 2022-6-2 21:45:19
实线显示报告索赔的移动平均数,计算时间为最近30个日期。(a) 国家假日0 25 50 75 100解放日Easterchristmasday后圣诞节五旬节新年国王节复活节周一五旬节周一阿森松日新年EveGood FridayDaily平均报告数(b)工作日0 50 100 150周一周二周三周四周五周六周日平均报告数图5:国家节假日和(b)的平均报告索赔数工作日,计算1996年7月至2009年8月期间发生和报告的所有索赔。报告延误图6显示了保险事故发生后前三周内的经验报告延误天数分布。报告的经验概率在索赔发生后的第二天达到峰值,之后大幅下降。14天后报告量的增加很可能是数据质量问题造成的,因为不再记得确切发生日期的投保人报告事故发生在两周前。在整整一周后,同样的影响在较小程度上也可以看到。图6b和图6c分别显示了仅使用周一和周四发生的事故构建的经验报告延迟分布。这揭示了一周中发生的每一天对报告延迟分布的影响。

18
mingdashike22 在职认证  发表于 2022-6-2 21:45:23
周一发生的事故案例研究3:报告保险中的延误动态13(a)所有索赔0.00.10.20 7 14发生后的延误概率(b)周一0.00.10.20 7 14发生后的延误概率(c)周四0.00.10.20 7 14发生后的延误概率图6:第一天的经验报告延误分布索赔发生三周后,使用(a)所有索赔,(b)周一发生的索赔和(c)周四发生的索赔。在六天或七天之后报告的可能性降低,因为这些延迟分别对应于周六和周日。周四发生的事故显示出相同的报告延迟模式,但周末则对应不同的延迟。周末的影响在使用所有索赔的经验分布中不再可见(图6a),因为周末不再对应特定的报告延迟。评估日期所指的隐藏事件数量指的是保险人提取准备金的日期。实际上,该日期通常是一个季度或财政年度的最后一天。图7使用滚动评估日期来说明IBNR索赔的每日数量。对于每个评估日期,我们显示了与该日期之前发生但之后报告的保险事件相对应的索赔数量(以及2009年8月31日之前,即我们观察期的最后一天)。图7的顶部面板显示了2003年9月1日至2004年8月31日期间每个评估日的IBNR索赔日数。全年未报告的索赔数量各不相同,夏季发生的事故较多,未报告的索赔也较多。

19
何人来此 在职认证  发表于 2022-6-2 21:45:26
由于许多事故发生在1月1日,IBNR的统计在新年开始时达到峰值,由于节假日的聚集,报告速度较慢。图7的底部面板放大了2003年10月1日至2003年11月30日期间未报告的索赔。当我们每天评估IBNR时,未报告的索赔中出现了较大的波动。这些变动遵循七天的模式,即五天的IBNR下降,然后是两天的强劲上升。这些上升趋势相当于周末发生了许多新的保险事件,但几乎没有任何事件得到报告。3.2模型规格我们选择计算效率,并用指数分布对时变报告延迟U进行建模。报告风险包括六个影响,结构为αt,s=αocc。domt·αocc。月·α代表假日·α代表月·α代表道指,前几周,s-t·α延迟-t(10)=经验(xocc.domt)·γocc。dom+(xocc.月)·γocc。3个月案例研究:报告保险延误动态1416001800200022002003年10月2004年1月2004年4月2004年7月评估日期未报告索赔1601700180019002000 10月1日10月15日11月1日11月15日12月1日评估日期未报告索赔图7:2003年9月至2004年8月期间每个评估日期的未报告索赔数量。这些是在此日期之前发生但在之后报告的索赔数量(但在观察期结束之前,即2009年8月31日)。底部面板放大了2003年10月和11月的评估日期经验(+(X代表节假日)·γ代表节假日+(X代表月份)·γ代表月份=经验(+(X代表道指,前几周,s-t) ·γ代表道琼斯指数,第一周+(xdelays-t) ·γ延迟.我们通过纳入occ每月某日的影响,对发生日期对报告延迟的影响进行建模。domtand月αocc。事故发生的月份。图5a中的假日效应由αrep建模。

20
何人来此 在职认证  发表于 2022-6-2 21:45:29
节假日,区分国家节假日和非官方节假日。报告中的季节变化由αrep.months(αrep.months)捕获,它根据报告索赔的月份来衡量报告风险。互动效应α代表道,前几周,s-测试第一周报告延迟组合的报告风险- t=0,1,6) 以及报告索赔的一周中的哪一天。对于超过一周的延迟,估计单独的工作日参数,s- t>7。因此,我们从图5a中捕获了工作日影响,并在索赔发生后的第一周获得了额外的灵活性。最后,α延迟-t部分根据在线附录C中规定的策略,事故发生后经过的时间为23个箱子。这些箱子调整了分布的尾部,并增加了14、30和365天后报告的概率。3.3结果3.3.1参数估计我们使用8年的数据,即1996年7月1日至2004年9月5日期间发生和报告的所有事故,通过最大化(8)中的对数似然来估计模型参数。生成的训练数据集包含274 187个报告的索赔,我们使用125个参数对报告过程进行建模。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 19:37