楼主: 可人4
1230 24

[量化金融] 基于数值反演的总损失分布计算 [推广有奖]

11
大多数88 在职认证  发表于 2022-5-31 18:36:43
(17) 类似地,与(11)-(12)类似,我们还可以推导(复合)投资组合L的ALD的经验CF,如(3)中所定义的,比如CF^FL(t)。ECDF^FX和已确定的广义帕累托CDF的组合经常用于根据观察数据对重尾(严重性)分布进行建模,参见McNeil(1997)和McNeil and Saladin(1997)。使用方程(13),这种分布的CF,如CfFx(t),可以表示为经验CF和广义Pareto CF的加权混合,CfFx(t)=p CF^FXL(t)+(1- p) cfGPD(t),(18),其中p∈ (0,1)是指定分布尾部的概率水平,通常p=0.9或更大,cf^FXL(t)是基于观察值(xk)的较低p部分的经验cf≤ θ、 其中θ是作为分布的p-分位数选择的阈值),cfGPD(t)是拟合的广义帕累托分布GPD(ξ,σ,θ)的CF,参数ξ和σ是根据观察值xk估计的(例如,通过最大似然估计方法)- θ≥ 0,k=1,K、 最后,请注意CF(10)或(11)-(12)定义的ALD是一个离散分布,如果所有严重成分分布(S或sm,对于所有m=1,…,m)都是离散分布(例如,基于其经验LCF)。否则,ALD分布为连续分布(尽管形状可能非常不稳定)。特别是,经验CF(17)确定的总损失分布原则上是离散的,累积分布函数是阶跃函数(与经验CDF类似)。标准反演定理,包括下面介绍的Gil-Pelaez反演公式,基于PDF存在的假设(即假设绝对连续分布),以及特征函数在(-∞, ∞).

12
大多数88 在职认证  发表于 2022-5-31 18:36:46
在第3节中,我们介绍了基于此理论假设的方法和算法,然而,对于大多数实际目的,它们的数值实现通常也非常适合(作为近似方法)评估经验CFs定义的ALD CDF。在任何情况下,仍然可以通过使用适当的平滑DCF来平滑复合损失经验ALD,L,该平滑DCF是通过将经验分布与适当的连续分布卷积而获得的,ascfFL(t)=cf^FL(t)×cfZ(t),(19),其中cf^FL(t)是经验的或其他损坏的cf,cfZ(t)表示适当的平滑连续分布的cf,例如。,零均值高斯分布,其标准偏差σ与平滑核的选定带宽成比例,cfZ(t)=e-σt/2.3。Gil-Pelaez反演公式3.1。数值计算计算(逆)傅里叶变换是一个众所周知的问题,经常与计算高振荡(复)函数的积分有关。一般而言,对其进行了很长时间的研究,但也侧重于特定应用,参见Asheim和Huybrechs(2013);Levin(1996);米洛瓦诺维奇(1998);Sidi(198219882012),只展示了一些。特别是,建议用于反转特征函数以获得概率分布函数的方法包括Abate和Whitt(1992);Shephard(1991);Waller等人。

13
大多数88 在职认证  发表于 2022-5-31 18:36:49
(1995年);齐利恩斯基(2001);斯特劳德曼(2004),冯和林(2013)。在此,我们假设所考虑的ALD特征函数,如cfL(t)或cfFL(t),与特定总损失的分布相关~ FL是已知的,可以很容易地计算出任意t∈ R、 Gil Pelaez(1951)导出了上绝对可积CFs的反演公式(-∞, ∞), 适用于PDF和/或CDF的数值计算,这只需要实值函数的积分,有关更多详细信息,请参阅Shephard(1991)。特别地,PDFL给出了具有特征函数cfL(t)的绝对连续分布(假设存在)的PDF(l) =πZ∞Re-它lcfL(t)dt,(20)和进一步,如果l 是L的累积分布函数的连续点,由cdfL定义(l) = Pr{L≤ l}, 然后CDF由CDFL给出(l) =-πZ∞Ie-它lcfL(t)t!dt。(21)由R(f(t))和I(f(t))我们分别表示复函数f(t)的实部和虚部。在统计学方面,在Imhof(1961)和Davies(1980)中,基于(20)和(21)的特征函数数值反演在另一种情况下成功实现,用于评估独立二次方RVs线性组合的分布函数。此外,Gil Pelaez的方法用于计算独立学生t随机变量线性组合的分布,以及独立反向伽马随机变量线性组合的分布,参见Witkovsk\'y(2001b)、Witkovsk\'y(2001a)和alsoWitkovsk\'y et al.(2015)。通常,(20)和(21)中的积分可以通过许多数值求积方法计算。

14
可人4 在职认证  发表于 2022-5-31 18:36:52
在某些情况下,积分被细分为被积函数连续零点之间的子区间,使用高斯求积等方法对其进行积分,并通过已知方法加速所得交替级数的求和,参见Cohen et al.(2000)。然而,积分(20)尤其是(21)通常可以通过梯形求积(即pdfL)有效地近似(l) ≈ΔπNXj=0wjRe-itj公司lcfL(tj), (22)和/或DFL(l) ≈-ΔπNXj=0wjIe-itj公司lcfL(tj)tj!,(23)其中N是非常大的整数,例如N=2,wjare是适当的梯形正交权重(即w=wN=,对于j=1,…,N,wj=1- 1) ,对于j=0,…,tj=jδ,N是距离区间[0,T]的等距节点(及其相互距离δ),对于足够大的T(即,被积函数Re-itj公司lcfL(t)和/或Ie-itj公司lcfL(t)/t对于所有t>t)而言都非常小。数值N和T的特殊选择影响总近似误差,即截断误差和积分误差的组合。他们之间的权衡在很大程度上取决于cfL。如果N和T的最佳值未知,作为一个简单的经验法则,我们建议从应用以下六西格玛规则开始。为此,设置δ=2π/(B- A) ,其中间隔(A,B)=E(L)k√k=6(或乘法系数k的其他更合适值)的Var(L)指定了随机变量L的分布支持的实质部分,然后设置N和T=Nδ,以便对于所有T>T,被积函数的绝对值都非常小,例如Ie-itj公司lcfL(t)/t≤ |cfL(t)/t |<ε,例如ε=10-此外,为了计算(23)中的第一项,我们可以使用Witkovsk\'y(2001b)的结果:如果L的平均值(期望值)存在,则→0Ie-它lcfL(t)t=E(L)- l.

15
可人4 在职认证  发表于 2022-5-31 18:36:54
(24)所需的位置和分散参数,即期望值e(L)和方差Var(L),可以从分布的矩(即期望值和方差L,如果存在和已知),或者通过(已知)cfL(t)的数值差异近似地进行评估。特别是,对于任何小h>0,例如,h=10-4,我们得到(L)≈h类IcfL(h)-IcfL(2h)+IcfL(3小时)-IcfL(4h)!, (25)和,Var(L)≈EL-E(L), (26)其中L≈h类-RcfL(h)+RcfL(2h)-RcfL(3小时)+RcfL(4h)!. (27)这种基于特征函数数值差异的近似,在理论矩(期望和方差)形式上不存在的情况下,也可以作为所需位置和尺度参数的合理近似。1980年1981年1982年1983年1984年1986年1988年1989年1990年索赔数量166 170 181 153 163 207 238 226 210 235 218表2:丹麦财产损失数据:1980-1990年期间观察到的索赔数量(经验频率分布)。请注意,所提供的求积对于计算pdfL非常有效(l) 和cdfL(l) 对于任何l ∈ (A,B)因为j=0,…,只需要对cfL(tj)进行一次评估,N、 最后,用于计算VAR的分位数函数(QF)可以通过(23)计算的值进行简单插值,或者(对于高度光滑的连续分布)通过迭代牛顿-拉斐逊格式进行计算。它需要重复评估PDF/CDF(22)-(23)。特别是对于固定概率水平p∈ (0,1),L(连续)分布的p-分位数,例如q=qfL(p),作为以下迭代方案的解(固定点)给出,qf(k+1)L(p)=qf(k)L(p)-cdfL公司qf(k)L(p)- ppdfL公司qf(k)L(p), (28)其中k=0,1,并且起始值qf(0)L(p)被设置为,例如,qf(0)L(p)=e(L),由(25)给出。3.2。

16
可人4 在职认证  发表于 2022-5-31 18:36:57
软件实现我们已经将上述方法和算法实现到MATLAB特征函数工具箱(CF工具箱)中。它是一组算法,用于计算和组合特征函数,并通过相关CF的数值反演进一步计算PDF、CDF和QF。工具箱可从以下网页的作者处获得:https://goo.gl/gBfdwY.TheCF工具箱还包括易于使用的应用程序,即集体风险模型工具(CRM工具)。CRMTool是一个快速且在大多数实际情况下相当精确的计算总索赔/损失分布和相关风险值的计算器,通过对其特征函数进行数值反演来指定和计算。CF工具箱中使用的算法基于梯形规则,用于计算由Gil-Pelaez公式定义的积分,或使用FFT算法计算傅里叶变换积分。如前所述,在更复杂的情况下或如果需要最高的数值精度,通常需要更先进的求积方法,并结合使用交替符号的级数极限的加速计算。有关可能的替代方法和MATLAB实现的更多详细信息,请参见Duby et al.(2017)。4、真实数据示例:丹麦的财产损失数据为了便于说明,我们对常用于方法比较的知名保险数据集进行了分析:丹麦主要财产保险损失数据,见Eling(2012)及其参考文献。该数据集由最初在McNeil(1997)和Resnick(1997)中分析的丹麦火灾损失组成。该数据代表以百万丹麦克朗(DKK)为单位的保险损失,由一家丹麦再保险公司收集。

17
大多数88 在职认证  发表于 2022-5-31 18:37:00
该数据集包含1980年1月3日至1990年12月31日期间超过100万丹麦克朗的个人损失,总计2167个个人损失。对其进行了调整,以反映1985年的值。该数据集可以在R包fEcofin和fExtremes中找到,也包含在MATLAB CF工具箱中。表2给出了经验频率分布,即1980-1990年期间每年的索赔数量(每年197起索赔的平均值)。然而,很明显,1980-1985年期间的索赔数量(平均值166.6)低于1986-1990年期间的索赔数量(平均值222.3)。这表明可能存在不同随机机制的混合,从而产生索赔数量,这很难通过标准离散分布进行建模。基于这一期间观察到的2167件索赔损失超过100万丹麦克朗的经验严重性分布如图1左上角的柱状图(对数标度)所示。描述性统计显示,个人火灾损失的分布明显向右倾斜,丹麦火灾损失的个人损失(百万丹麦克朗)直方图高达1 10 100 1000 1980-19900 500 1000 1500 2000总损失(百万丹麦克朗)0.51.52.5-3PDF总损失分布0 500 1000 1500 2000总损失(百万丹麦克朗)0.20.40.60.8CDF损失分布-20-10 0 10 20t-1-0.50.5严重性分布的经验CF-0.5 0.5t-1-0.50.5频率分布的经验CF-0.05 0.05t-1-0.50.5复合分布的经验CF图1:丹麦火灾损失数据:(i)1980-1990年期间观察到的以百万丹麦克朗为单位的个人损失直方图(严重性分布),以对数刻度表示。

18
大多数88 在职认证  发表于 2022-5-31 18:37:03
(ii)由经验复合CF数值反演得出的总损失分布PDF。(iii)由经验复合CF数值反演得出的总损失分布CPDF。(iv)严重性分布经验特征函数的实部(蓝色)和虚部(红色)。(v) 频率分布的经验特征函数。(vi)总损失分布的复合经验特征函数。峰度,观测平均值为3.39,标准偏差为8.51(百万丹麦克朗),偏度为18.74,峰度为485.65。这建议考虑将重尾分布作为严重性分布的模型。推导ALD的第一种建模方法基于一种纯非参数方法,该方法通过数值线性版本(22)–(23)从复合经验特征函数(15)、(16)和(17)推导总损失分布。使用CF工具箱,评估CF规定的总损失分布(PDF/CDF)以及所需的VAR是一项简单的任务,可以通过几行MATLAB代码来表示:%DanishFireData:荷载(\'DanishFireData.mat\')%经验特征函数:cfN=@(t)cfE\\u经验(t,频率);cfX=@(t)cfE\\u经验(t,严重性);cf=@(t)cfN(-1i*log(cfX(t)));%参数/选项:prob=[0.9 0.99 0.999];损耗=linspace(02000201)\';选项。isCompound=真;%cf2DistGP对CF的数值反演:结果=cf2DistGP(CF,损失,概率,期权);计算结果是一个MATLAB结构数组(结果),包含指定的字段和值,其中包含按要求值(由可变损失指定)评估的PDF和CDF值,以及按要求概率(由可变概率指定)评估的VAR值。

19
kedemingshi 在职认证  发表于 2022-5-31 18:37:07
特别是,概率为0.9、0.99和0.999的计算风险值(VAR)为:872.9、1112.8和1319.6(百万丹麦克朗)。推导ALD的第二种建模方法基于半参数方法,通过合并严重性分布重尾的广义帕累托分布。这里,化合物CF iscfcFS(t)=CF^FN- i日志cfcFX(t), (29)其中cf^fn由(15)给出,Cfffx是经验cf和(18)给出的拟合广义帕累托cf的加权混合。然后,通过对化合物CF(29)进行数值反演(22)–(23),得出ALD。选择最佳阈值θ,将观察到的损失(严重性数据)分为头部(主体)区域和尾部区域,用于拟合广义帕累托尾部分布,是该建模方法的难点,其他地方对此进行了更详细的讨论,参见McNeil(1997),其中考虑了10到20之间的阈值。然而,为了简单起见,我们在这里考虑作为经验真实性分布的p-分位数导出的阈值,由概率值p=0.95指定。

20
可人4 在职认证  发表于 2022-5-31 18:37:09
对于给定的火灾损失数据,我们得到估计值^θ=10.0203(百万丹麦克朗)。然后确定广义帕累托分布GPD^ξ, ^σ,^θ参数(通过最大似然估计法从大于^θ=10.0203的观测损失中估计):^ξ=0.4890和^σ=7.1082。在此基础上,我们可以构建严重度分布特征函数cfcFX,定义为经验CF和已确定的广义帕累托CF的混合物,如(18)所示,经验频率为CF^fn,也可以构建复合特征函数cfcFS。与之前一样,这种化合物CF规定的总损失分布的评估可以通过以下几行MATLAB代码来表示:%设置阈值参数thetap=0.95;θ=分位数(严重程度,p);%拟合GP(广义Pareto)分布Pfit=Paretoails(严重程度,0,p);Pars=GPfit。上部参数;xi=PAR(1);西格玛=PAR(2);%装配尾部总成分布的CF Pdfgp=@(x)gppdf(x,xi,sigma);cfGP=@(t)cfX\\U PDF(t,pdfGP)。*exp(1i*t*theta);%混合严重度分布的CF XL=严重度(严重度<=θ);cfXL=@(t)cfE\\u经验(t,XL);cfX=@(t)p*cfXL(t)+(1-p)*cfGP(t);%频率分布的经验CF fn=@(t)cfE\\u经验(t,频率);%总损失分配的复合CF=@(t)cfN(-1i*log(cfX(t)));%参数sprob=[0.9 0.99 0.999];损耗=linspace(02500201)\';%选项清除选项选项选项。N=2^16;选项。六西格玛律=15;选项。isCompound=真;%通过CF2DISTGPRESS=cf2DistGP(CF,损失,概率,期权)对CF进行数值反演;概率0.9、0.99和0.999的计算VAR(风险值)为:847.96、1156.8和2063.3(百万丹麦克朗)。如果与基于反转经验化合物CF的纯非参数方法估计的VAR相比,这些VAR(尤其是高分位数)是不同的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 11:01