楼主: kedemingshi
1116 46

[量化金融] 受观测延迟影响的隐藏事件数建模 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-6-2 21:44:28 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Modeling the number of hidden events subject to observation delay》
---
作者:
Jonas Crevecoeur, Katrien Antonio and Roel Verbelen
---
最新提交年份:
2019
---
英文摘要:
  This paper considers the problem of predicting the number of events that have occurred in the past, but which are not yet observed due to a delay. Such delayed events are relevant in predicting the future cost of warranties, pricing maintenance contracts, determining the number of unreported claims in insurance and in modeling the outbreak of diseases. Disregarding these unobserved events results in a systematic underestimation of the event occurrence process. Our approach puts emphasis on modeling the time between the occurrence and observation of the event, the so-called observation delay. We propose a granular model for the heterogeneity in this observation delay based on the occurrence day of the event and on calendar day effects in the observation process, such as weekday and holiday effects. We illustrate this approach on a European general liability insurance data set where the occurrence of an accident is reported to the insurer with delay.
---
中文摘要:
本文考虑了预测过去发生但由于延迟尚未观测到的事件数量的问题。此类延迟事件与预测未来保修成本、维护合同定价、确定保险中未报告索赔的数量以及疾病爆发的建模相关。忽视这些未观察到的事件会导致对事件发生过程的系统性低估。我们的方法强调对事件发生和观察之间的时间进行建模,即所谓的观察延迟。我们提出了一个基于事件发生日期和观察过程中日历日效应(如工作日和假日效应)的观察延迟异质性的粒度模型。我们在欧洲一般责任保险数据集上说明了这种方法,其中事故的发生会延迟报告给保险人。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--

---
PDF下载:
--> Modeling_the_number_of_hidden_events_subject_to_observation_delay.pdf (1.67 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Applications Quantitative observation Maintenance Determining

沙发
可人4 在职认证  发表于 2022-6-2 21:44:33
对隐藏事件的数量进行建模,以观察延迟Jonas Crevecoeur1,3,*、Katrien Antonio1,2,3,4和Roel Verbele1,3,4比利时库鲁汶经济与商业学院。荷兰阿姆斯特丹大学经济与商业学院。LRisk,比利时库鲁汶鲁汶保险和金融风险分析研究中心。比利时库鲁汶鲁汶统计研究中心LStat*通讯作者。电子邮件:jonas。crevecoeur@kuleuven.beMarch2019年12月27日摘要版权所有(c)2019《欧洲运筹学杂志》。本文考虑了预测过去发生但由于延迟尚未观测到的事件数量的问题。此类延迟事件与预测未来保修成本、维护合同定价、确定保险中未报告索赔的数量以及疾病爆发的建模相关。忽视这些不可观察的事件会导致对事件发生过程的系统性低估。我们的方法强调对事件发生和观察之间的时间进行建模,即所谓的观察延迟。我们提出了一个基于事件发生日期和观察过程中的日历日影响(如工作日和节假日影响)的观察延迟异质性粒度模型。我们在欧洲一般责任保险数据集上说明了这种方法,其中事故的发生会延迟报告给保险人。关键词:风险管理;事件的发生;观测延迟;日历日影响;数据分析。1简介运筹学的许多领域中,分析员都有兴趣建立事件发生的随机模型。然而,通常会观察或报告相关事件1引言2,但会有所延迟。

藤椅
kedemingshi 在职认证  发表于 2022-6-2 21:44:36
分析师应该考虑这些未观察到的事件,因为忽视它们会使基于所考虑的随机模型的决策产生偏差。图1显示了此设置。我们指定了一个定义良好的观察窗口(在x轴上),在该窗口中我们观察新对象(如产品或合同)的创建。在其生命周期中,一些对象可能会在给定的评估日期之前经历感兴趣的事件(图1中的对象1和2),而其他对象则不会(图1中的对象3和4)。事件发生后,决策者会对其进行初步隐藏。从对象生命周期开始到事件发生之间经过的时间称为事件延迟。只有在所谓的观察或报告延迟之后,决策者才意识到事件的存在。本文概述了一种数据驱动的策略,用于预测过去(评估日期之前)发生的事件数量,但这些事件在评估时是隐藏的,只能在将来观察或报告。图1中的主题2就是此类事件的一个示例。自startObservation window FutureStartHiddenEventObservedEvent delay观察延迟2评估日期图1:事件的发生和观察事件发生时间的建模(“事件延迟”),在特定时间窗口内发生的(隐藏)事件的数量以及发生和观察之间的延迟(“观察延迟”)一直是运筹学、精算学和流行病学文献中的活跃研究领域。这种预测性问题的典型应用示例包括:维护、保修或保险合同组合,以及在此框架内爆发的特定疾病。

板凳
nandehutu2022 在职认证  发表于 2022-6-2 21:44:39
我们强调了一些相关的贡献,并解释了本文是如何扩展现有文献的。保修合同要求制造商赔偿买方在保修期内发生的所有故障。制造商持有与过去生产的木材有关的未来补偿资金。所需资本的数量取决于已售出的缺陷产品的数量。由于数据的不完整性,准确估计这一数字很复杂。图1中的对角线时间线从生产有缺陷的产品时开始。但是,保修期仅在产品出售给客户时开始。制造商通常不知道这些销售情况,我们将其视为隐藏事件。一旦缺陷出现,客户致电其保修合同,制造商就会收到销售通知(“观察到的事件”)。Akbarov和Wu(2012)以及Ye和Ng(2014)同时使用参数方法对产品的销售时间和销售与失败之间的延迟进行建模。由于这两个过程在可能性上相互作用,因此很难进行估计。Akbarov和Wu(2012)致力于数值最大化,而Ye和Ng(2014)则使用了一种惊人的期望最大化策略。虽然这些作者使用简单的参数分布(无协变量)对销售时间进行建模,但我们的框架考虑了销售数据中通常存在的季节性影响、促销假期和天气影响。流行病学家在建模疾病演变时面临类似的统计问题(Harris,1990;Salmon等人,2015)。在这种情况下,受试者会随着时间的推移进行跟踪,由于医生延迟疾病诊断或潜伏期,最近的疾病感染可能无法观察到。

报纸
kedemingshi 在职认证  发表于 2022-6-2 21:44:42
通过对这些延迟进行建模,可以将尚未观察到的感染(“隐藏事件”)考虑在内,从而能够更快、更准确地确定疾病暴发和流行病(Noufaily等人,2016)。维护合同通常与大型工业设备一起出售。根据这些合同,制造商或第三方保证继续使用设备。机器故障(“观察到的事件”)通常是以前未观察到的缺陷(“隐藏事件”)的结果。这些缺陷可以通过现场检查来检测,及时修复将防止机器出现昂贵的故障或故障。然而,这些检查的稳定性在很大程度上取决于隐藏缺陷的数量。Christer(1973)首次在维护合同的背景下对观测延迟进行建模,称为延迟时间。自那以后,有几篇论文集中讨论了延迟时间的概念。Baller和Wang(1993)使用最大似然估计从观察到的故障数据建立延迟时间模型。在这种方法中,缺陷时间和机器故障观察时间都是用参数分布来处理的。本文献通常假设缺陷发生的强度恒定,并忽略延迟时间分布的不均匀性。Wang(1997)和Apeland and Scarf(2003)依靠专家意见制定了一个完全主观的延迟时间模型。Wang(2010)和Berrade et al.(2018)关注延迟时间分布已知时的经济决策。符合当前大数据分析的时代(见Mortenson et al。

地板
kedemingshi 在职认证  发表于 2022-6-2 21:44:45
(2015)),我们的方法超越了这些假设,提出了一种数据驱动的策略,以捕获缺陷发生以及缺陷与其观察之间的延迟中的异质性。本文中的案例研究用保险数据集说明了我们的数据驱动方法,其中合同出售给投保人。一些投保人会卷入意外事故或其他类型的保险事故,而其他人不会。在保险术语中,事故发生(“隐藏事件”)与向保险公司报告或报告索赔(“观察到的事件”)之间的延迟被称为报告延迟。这些延误严重依赖于投资组合,并且在被保险人未立即通知损失时可能会很严重。在本文的其余部分中,我们只考虑最终会报告的事故。从未报告的事故不会得到赔偿,也与保险公司的资产负债表无关。一旦保险人报告并接受索赔,保险人将通过一次或一系列付款来赔偿损失。保险公司预定准备金,以便能够解决已发生但尚未报告的索赔(IBNR),并将其作为IBNR准备金转入该资本。估计评估日期之后将报告的过去暴露的索赔数量(所谓的IBNR索赔计数)是设定该准备金的关键。受过去计算限制的影响,保险结构中的许多估算方法将图1中的数据放在二维表格中,该表格按事故发生年份和报告年份汇总事故数量。我们将读者称为Taylor(2000);Wüthrich和Merz(2008);Wüthrich和Merz(2015年),了解有关骨料法储量的更多详细信息。

7
能者818 在职认证  发表于 2022-6-2 21:44:48
相对而言,很少有论文讨论在粒度级别为图1所示现象指定amodel的问题。Badescu et al.(2016)andAvanzi et al.(2016)专注于使用CoxProcess在每周水平上对事故到达过程进行建模。这些模型允许捕获过度分散和串行依赖,这在此类事件数据中经常遇到。Badescu et al.(2016)和Avanzi et al.(2016)提出的模型的缺点是,假设发生日期和报告延迟之间存在独立性。Verrall和Wüthrich(2016)是第一个提出每日IBNRcounts模型的人,包括基于索赔发生日期的报告延迟的异质性,以及导致周末报告索赔较少的强工作日模式。这种工作日模式与报告过程中的日历日影响有关,而使用为聚合数据设计的经典技术很难建模(见Kuang et al.(2008))。Verrall和Wüthrich(2016)提供了一种方法,将这种工作日模式纳入报告延迟不到一周的情况。Verbelen等人(2017年)通过单独估计每周和周内报告概率,将这一工作日模式扩展到报告第一周之后的延迟。此外,Verbelen等人(2017年)提出了期望最大化算法,作为联合估计发生和报告过程的框架。本文对隐藏事件的发生进行了非参数建模。这允许捕获事件计数中的波动(例如,由于季节性或天气条件),而无需对这些事件进行明确建模。此外,扩展了Verrall和Wüthrich(2016)以及Verbelen等人(2017)的工作,我们对存在多个协变量的观察延迟进行了建模,包括日历日效应。

8
何人来此 在职认证  发表于 2022-6-2 21:44:51
此类日历日影响的例子包括:周末期间未观察到的事件减少、国定假日的影响以及观察延迟的季节性。我们的策略引入了观察曝光的概念,作为通过回归合并(多个)日历日影响的直观且灵活的框架。该方法通过缩放延迟事件发生的粒度模型的概率,优雅地转换了观察延迟分布。5基于协变量,在特定日期观察事件。因此,转换后的observationdelay分布独立于这些协变量,然后用简单的参数分布建模。这使得我们的方法适用于广泛的问题。本文的组织结构如下。第2节描述了一个统计框架,用于建模受观测延迟影响的隐藏事件的数量。在第3节中,我们通过一个涉及保险数据集的案例研究来说明这种方法。我们还研究了我们的模型在四个模拟场景中的性能。在线附录提供了实现模型的详细表达式,并将我们的方法与非参数Kaplan-Meier估计量联系起来(Kaplan和Meier,1958)。2延迟事件发生的粒度模型,用Nt表示t日发生的事件数量,其中t=1是首次事件的日期。这些事件在延迟s后的日期s观察之前一直处于隐藏状态-t、 设Nt,sbe为在t日发生且在s日观察到的事件数。由于所有事件都将在未来某个时间观察到,我们发现Nt=Xs>tNt,s。考虑评估日期τ,我们必须在该日期预测隐藏事件的数量。

9
可人4 在职认证  发表于 2022-6-2 21:44:54
在τ处,我们将过去发生日期t中的事件分为观察到的(s 6τ)和尚未观察到的隐藏事件(s>τ),分别用nobst(τ)=τXs=tNt,sand NHiddent(τ)表示=∞Xs=τ+1Nt,sfor t 6τ。我们通过将过去所有发生日期中未观察到的事件进行聚合,即NHidden(τ)=τXt=1NHiddent(τ)=τXt=1,从而获得隐藏事件的总数∞Xs=τ+1Nt,s。这个总数是我们想要预测的数字。继Jewell(1990)和Norberg(1993)之后,我们制定了两个分布假设,从中可以预测隐藏事件的数量:(A1)事件发生过程(Nt)t>1遵循强度(λt)t>1的非均匀泊松分布。(A2)对于同一日期发生的事件,观测延迟是独立的,且分布相同。2延迟事件发生的粒度模型6用pt表示,从发生日期t到日期s观察事件的概率。我们使用符号pObst(τ)表示评估日期τ观察到从日期t开始的事件的概率。该概率ispObst(τ)=τXs=tpt,s。通过假设(A1)和(A2),泊松变薄特性的条件得到满足(Kingman,1993)。变薄特性意味着所有Nt,都是独立的,并且Nt,s~ 泊松(λt·pt,s)。(1) 这允许我们构造时间τ处观测数据的可能性。χ表示可用数据,包括在评估日期观察到的所有事件τχ={Nt,s | t 6 s 6τ}。观测数据的对数似然为`(λ,p;χ)=τXt=1τXs=thNt,s·log(λt)+Nt,s·log(pt,s)- λt·pt,s- 日志(Nt,s!)i(2)式中,λ是一个向量,其分量λt为观测到的发生日期t,p={pt,s | t 6 s 6τ}。本文重点研究了在不对λt施加任何结构的情况下的观测过程。

10
kedemingshi 在职认证  发表于 2022-6-2 21:44:58
AsRightforward计算表明,λt=Pτs=tNt,sPτs=tpt,s=NObst(τ)pObst(τ)时,(2)中的对数似然最大。(3) 用该表达式替换λtb,(2)中的对数似然变成`(p;χ)=τXt=1τXs=tNt,s·log(pt,s)-τXt=1NObst(τ)·log(pObst(τ))+常数。(4) 对于常数,这是右截断观测延迟随机变量的对数似然。截断点为τ- t、 这是发生在日期t的事件的最大观测延迟。2.1建立观测延迟模型的时间变化策略我们感兴趣的是,根据与事件发生日期t和报告日期s对应的协变量,构建观测概率pt,sb。概率2受延迟影响的事件发生的粒度模型7数据的性质强制了约束pt,s>0,t、 s和XS>tpt,s=1,t、 (5)拟议的时间变化策略转换报告概率,以便在保留这些约束的同时,将其与协变量联系起来。图2描述了这种转变,其中我们考虑了一个发生在周四的事件,周末不太可能观察到。首先,我们将离散观测延迟视为区间截尾下连续随机变量的一种实现。图2a(离散设置)和2b(连续设置)以图形方式说明了这一点。其次,我们定义了一个时间变化操作符Дt,该操作符为发生日期t和观察日期s的每个组合分配一个正长度αt,s,称为观察曝光。该时间变化操作符类似于操作时间的概念,这是连续金融数学中的一种常见技术,见Swishchuk(2016)。我们认为日期的长度是可变的,而在这一时间变化之前,每个日期都有一个相同长度的时间单位。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 20:18