楼主: 大多数88
1725 51

[量化金融] 用EVT和微观模拟方法模拟灾难性死亡 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-5 03:49:20
事实上,可以证明(对于某些正函数β(u))如果H(x)=0,极限等于∞.利木→xFsup0≤x<xF-U傅(x)- Gξ,β(u)(x)= 0当且仅当F∈ MDA(Hξ),ξ∈ R这就是所谓的皮肯兹·巴尔克马·德哈恩·提奥·雷姆([19,2])。这意味着,当阈值u增大时,无归一化最大值c接近于GEV分布的分布是多余分布收敛于GP分布的分布。此外,对于极限GE V和GP分布,形状参数ξ是相同的。基于上述结果,广义帕累托分布可被视为观测值分布超过高阈值的基本极限模型。考虑到统计应用,我们对大u:Fu(x)=P(x)的超额分布Fu得出以下近似值- U≤x | x>u)≈ Gξ,β(u)(x),x>u,其中β(u)=β+ξu和ξ将从数据中估计。长期以来,帕累托分布一直被视为(非寿险)保险中的索赔严重度分布,这是因为许多保险数据集提供了良好的经验拟合;参见,例如[17,5]。广义帕累托在超价值环境中的应用,虽然到目前为止是一种相对标准的技术,但在实际领域是一个较新的发展。对于具有良好讨论的早期保险应用,参见[23,13]。2.2点过程方法上一节的讨论只考虑了阈值超出的大小。然而,通常通过明确地包含时间维度来扩展视图是很自然的,并且要同时考虑超出的大小和时间。

12
能者818 在职认证  发表于 2022-5-5 03:49:22
这自然而然地导致了一种高水平超越事件(最初由Pickands[18]和Smith[24]引入)的观点,即在空间和时间上的事件。设(Xi)ni=1b是一个iid rvs序列,df F在状态空间e中取值,并假设(1)对一些规范化序列cn,dn成立。考虑一些固定x的阈值序列un(x)=cnx+dn,并让Yi,n=in{Xi>un(x)}如[14]所示。变量Yi,n表示超出的标准化时间I/n,如果没有超出,则为零。超越点过程Nn(A)=Pni=1{Yi,n∈A} n=1,2。,在s状态空间E=(0,1)的情况下,统计集合A中阈值不连续发生时间的超出情况 E.或者,超标点过程可以写成Nn(A)=Pni=1{(in,Xi)∈A} 二维状态空间E=(0,1]×(un,∞).在极端情况下,我们再次对n的点过程的渐近行为感兴趣→ ∞. 但在分布上收敛于泊松过程;弱c-onverge-nc-eis是在一个to-pology下建立的,这个to-pology有意识地排除了下边界y上的集合(参见[22]和[7,第5章])。极限点过程N(·)的强度测度是E上强度测度为∧的泊松点过程,如果下列条件成立:(i)对于 E和n≥ 0,P(N(A)=N)=exp{-∧(A)}∧(A)nn!如果∧(A)<∞, 如果∧(A)=∞.(ii)对于任何m≥ 1.i f A,E(Ai)的Amare互不相交子集∩ Aj=, i 6=j),然后随机变量N(A),N(Am)是独立的。点过程可以从(1)和(2)中导出,并由∧(A)=ZAλ(s)ds=ZttZ给出∞xλ(y)dy dt=-(t)- t) lnhξ,u,σ(x)=(t- (t)1+ξx- uσ-1/ξ,(5)对于形式为A=(t,t)×(x)的集合,∞)  E.除其他外,上述表示在单独的矩形A,A。

13
可人4 在职认证  发表于 2022-5-5 03:49:25
期望值为∧(A),∧(A),….的独立泊松分布rvs。。前面小节中的方法可以被视为点过程方法的特例,因为到目前为止提到的所有结果都可以从点过程表示中导出。与给定阈值u相关的超额分布的尾部是给定Xi>u+x的Xi>u:\'Fu(x)=∧(0,1)×u+x,∞))∧((0,1)×u,∞))=1+ξxσ+ξ(u)- u)-1/ξ,其中β=σ+ξ(u- u) > 0. 这只是第2.1小节的广义帕累托分布模型。类似地,点过程模型可以被视为是最大值的GEV分布模型。考虑一下事件{Mn≤ x} 为了一些x≥ u:这只是一个在A=(0,1)×(x)中没有点的事件,∞). 该事件的极限概率由P(Mn)给出≤ 十)→ P(N(A)=0)=exp(- ∧(A))=Hξ,u,σ(x)。此外,对于任何x,我们都不会这样做≥ u、 由(5)所暗示的x级超越的一维过程是一个均匀泊松过程,其速率τ(x):=- lnhξ,u,σ(x)。所获得的极限模型表明,对于高阈值u,iiddata中的阈值超越可以近似为泊松点过程。总结而言,极限点过程模型具有以下特性:(i)超越在时间上以均匀泊松过程出现;(ii)超越的大小为iid,与超越次数无关;(iii)超额分配是广义帕累托分布。该模型通常被称为“峰值翻转阈值”或“POT模型”(例如[14])。到目前为止,我们已经在iidrandom变量的上下文中讨论了点过程方法。iid序列的结果在某些条件下(参见[11]、评论文章[12]或教科书处理的[7])对于具有小修改的平稳序列仍然适用。

14
能者818 在职认证  发表于 2022-5-5 03:49:28
在非平稳序列的情况下,一般理论在实践中并不充分;正如Smith在[24]中指出的,极限分布的类别太广,无法用于识别参数统计模型。实际上,可以通过适当的统计建模来处理数据的非平稳性:推广上述点过程模型的最直接方法是允许模型参数(ξ、u、σ)依赖于时间或其他解释变量。3意外死亡建模在下面,我们将考虑与保险业务生命类型相关的灾难风险。更准确地说,我们将集中关注灾难性事件导致大量死亡的风险。我们的目标是利用前面章节的理论,为这些事件的发生和规模建立一个概率模型。

15
大多数88 在职认证  发表于 2022-5-5 03:49:31
3.1数据描述我们的数据包括1910年至2009年期间芬兰和瑞典人口发生的事故,并已造成三人以上死亡。虽然我们的目标是对芬兰的意外死亡进行建模,但在单独分析芬兰数据并将极值模型与之匹配时,我们发现这些模型没有很好地捕捉隐含严重程度(死亡计数)分布的右尾。因此,我们的目标是通过基于扩展数据集(包括瑞典acc ide ntal死亡)的统计模型估计来改进尾部建模。我们认为将瑞典的经验与芬兰的经验相结合是合理的,因为瑞典是与芬兰最相似的国家(地区、人口),而且两国的地理和经济条件相似。三条生命的限制是基于对意外死亡人数的检查,并尽可能完整地获得一个数据集,因为对重大事故的记录要好得多。这种对数据中最小观测值的审查,对实际中极端死亡人数的建模没有影响。对于每一次事故,都会选择发生日期和死亡人数。显然与战争有关的意外死亡被从数据中删除,以避免混淆结果。由于各国之间的事故死亡人数通常是独立的,我们可以直接使用组合数据集预测损失严重程度分布。然而,这两个原始数据集都有两个常见的意外事件:1994年邮轮号的爱沙尼亚号沉没(10名芬兰人和552名瑞典人死亡),以及2004年的印度洋海啸(179名芬兰人和543名瑞典人死亡)。

16
nandehutu2022 在职认证  发表于 2022-5-5 03:49:34
我们从瑞典的数据中获取了这两起事故的数值,但根据人口比例(2011年底)对海啸死亡人数进行了缩放,得出死亡人数为316人:这两起事故(类型和规模)都可能发生在芬兰人口中,这是可以使用的,但海啸袭击的数量会缩小,以反映不同的人口规模,从而反映游客的数量。图1显示了由此产生的综合意外死亡数据,包括139起导致4人或更多人死亡的事故,以及最大死亡人数。该数据基于Mr.提供的数据集。Tapani Tuominen(卡列娃互助保险公司),并从公共来源收集;具体请参见芬兰维基百科(fi.wikipedia.org)、Onnettomuudet Suomessa类和瑞典维基百科(sv.wikipedia.org)、Olyckor类和文章“Lista–over katastrofer ef ter antalet d–odasvenskar”。为了节省空间,这里不显示分析,而是按照下面和扩展数据集附录中的内容进行分析。瑞典的数据并不完整,但包括了所有最大的事故,因此对我们的目的有帮助。552.对于一系列的历史观察,我们必须考虑不同时期的观察是否是平等的。例如,当考虑长期的货币数量时,考虑到通货膨胀的影响是至关重要的。

17
mingdashike22 在职认证  发表于 2022-5-5 03:49:38
在意外死亡的情况下,数据由绝对死亡计数组成,我们的结论是,对数据进行调整是不合适的——数据中可能的(类似趋势的)特征应该通过统计建模加以考虑。1910年1920年1930年1940年1950年1960年1970年1980年1990年2000年20100100200300400500600日期死亡计数图1:芬兰和瑞典1.1.1910年至2009年12月31日期间的合并数据中的事故。3.2阈值选择极值建模(使用阈值超越或点过程方法)的主要挑战之一是选择合适的阈值来拟合模型。偏差和方差之间不可避免地存在一种权衡,因为将阈值设置得太低将导致过量分布的(限制性)GPD近似无效——以及估计参数中的偏差——而将阈值设置得太高将只留下很少的观测值用于统计模型估计,从而导致参数估计中的高方差,oreven数值估计无法收敛。在实际应用中,我们通常试图将阈值设置得尽可能低,前提是GPD提供了一个可接受的函数。在实践中,有两个主要工具用于测试广义帕累托分布(由超越和点处理方法暗示)是否是观测值过度分布的有效模型,从某个阈值水平u开始:平均超额图和参数估计的稳定性。根据我们对数据的分析,选择了20%的阈值;有关更多详细信息,请参见附录B.1。组合数据中总共有23个观测值超过阈值u=20。

18
kedemingshi 在职认证  发表于 2022-5-5 03:49:41
由于只剩下少量的观测值用于统计模拟,我们将使用阈值20的结果与使用整个数据集获得的结果进行了比较,对应的阈值为3:当然,基本诊断检查(将在下文中介绍)以及(估计分布的尾部)与经验分布的图形比较,也说明了一旦确定了某个候选阈值,该阈值的优度。[6]中针对瑞典数据集使用的值u=3被发现明显太低,GPD近似值无法工作,此处未显示。图2显示了适用于u=20超标的GP分布。我们发现所选阈值的fit相当好。0 100 200 300 400 50000.20.40.60.81xG(x)经验CDFFIFED GPD图2:经验分布与固定GP分布。3.3意外事件的标记点过程基于我们的分析,意外死亡数据可被视为iid,并通过时间均匀泊松过程进行了良好建模:更多详细信息,请参见附录B.2的测试和附录B.3中点过程模型的比较。在这种情况下,将二维泊松过程解释为阿玛凯德泊松点过程是很方便的,超过点乘以点,超过标记。也就是说,点的数量遵循强度为λ的(一维)泊松过程,并且标记是重新iid广义帕累托分布的。这是[6]中首次提出的模型。给定一个treshold u,一个随机数nus-sample X=(X,…,Xn)将超过它;将这些观察结果重新标记为+X=(yenX,~~XNu)。相应的超额用Y=(Y,…,YNu)表示,w he re Yj=~Xj- U

19
可人4 在职认证  发表于 2022-5-5 03:49:44
由于假设超标的数量和标记大小是独立的,因此过程对数可能性可写为l(θ;Y)=lnP(Nu=k)kYj=1gξ,β(Yj)= k lnλ- λ - ln k!- k-lnβ-1 +ξkXj=1ln1+ξYjβ,(6) 哪里~ Poi(λ),gξ,β是GPD密度,θ=(λ,ξ,β)。我们看到对数似然(6)可以分为两项之和,l(θ;Y)=l(λ;Nu)+l(ξ,β;Y | Nu),其中terms涉及不同的参数s。这意味着我们可以分别估计超标的频率(即泊松参数λ)和超标的大小(即GP参数ξ,β)。在第4节中,这种标记点过程表示法便于我们实现目的,因为它允许单独模拟事件时间和事件大小。泊松过程强度λ的最大似然估计仅为^λ=^Nu,即样本中观察到的超过阈值u的次数,方差等于平均值λ。组合数据中u=20级的超标数量为23;然而,我们的目标是模拟芬兰人口中的意外死亡,而不是芬兰和瑞典的综合经验。为此,我们仅根据芬兰的数据估计强度,超过阈值15次。为了计算年化率,我们将估计强度除以观测年数ny=100,得出年强度o fλ=Nu/ny=0.15。[0.07,0.28]给出了95%的置信区间。标记大小分布的参数s通过数值最大化GP对数概率Ln L(ξ,β;Y)=NuXj=1ln gξ,β(Yj)=-Nulnβ-1 +ξNuXj=1ln1+ξYjβ, (7) 所有j的收缩率β>0和1+ξYj/β>0。

20
大多数88 在职认证  发表于 2022-5-5 03:49:48
最大化是使用MATLAB的fminsearch函数实现的。表1给出了结果参数估计,置信区间约为95%(基于最大似然估计的渐近正态性)。从最大似然参数的辛协方差矩阵中获得的置信区间估计re,在实践中,由于在极值问题中经常遇到小样本,因此通常不是很好。通常情况下,通过使用所谓的专业知识,可以获得更准确的置信区间。表1也显示了这些情况。形状参数^ξ的值超过1/2,因此变量不存在,并且非常接近1,在这种情况下,平均值也不存在。这表明尾分布很重。表1:95%置信区间的GPD参数估计。方法渐近标准误差概率参数MLE 95%CI MLE 95%CIξ0.938[0.189,1.69]0.938[0.457,1.92]β12.9[6.01,27.7]12.9[6.54,25.6]通过绘制芬兰数据中的经验概率与模型给出的概率,我们在图3的左侧绘制概率图。右侧显示了相应的分位数(QQ)图,即经验分位数和ainst模型分位数。我们发现,阈值u=20的模型拟合良好,且不存在仅基于芬兰数据(未显示)时出现的问题。3.4回报水平和尾部风险度量意外死亡的拟合模型可用于分析事故的频率和规模。使用返回的概念可以方便地做到这一点。或者,我们可以使用两个数据集的平均超标强度,即^λ=0.12。对于参数θi的每个值,概率似然为对数似然最大值W。r、 t.所有其他参数。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-2 12:41