楼主: mingdashike22
1497 34

[量化金融] 两种确定概率密度的最大熵方法 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-5-7 04:08:54
显然,这些结果与表(6)中显示的结果相似,前提是密度0.2 4 6 8 100.0 0.2 0.4 0.6 0.8SMEMEM(a)情况(2):l = 1,u=0,σ=0.25sDensity 0 2 4 6 8 10 12 140.00 0.05 0.10 0.15 0.20 0.25SMEMEM(b)情况(3):l = 4,u=0,σ=0.25SDensity0 2 4 6 8 10 120.00 0.05 0.10 0.15 0.20 0.25 0.30sMemM(c)情况(4):l = 3,u=0.1,σ=0.25SDensity0 5 10 15 200.00 0.05 0.10 0.15 0.20 0.25 0.30SMEMEM(d)情况(5):l = 3,u=0,σ=0.5图6:SME和MEM密度的组合图显示所获得重建的良好性能。在表(8)中,我们展示了应用于测试集的统计测试结果。如第(4.1)条所述,带星号的市场不排除分布之间相等的无效假设。正如我们所了解的,大多数测试似乎以5%的显著性验证了我们的重建。错误案例(1)案例(2)案例(3)案例(4)案例(5)L1范数0.1896 0.2057 0.1580 0 0.1598 0.1751L2-范数0.1370 0.1866 0.0781 0.0763 0.0704MAE 0.0131 0.0186 0.0201 0.0170 0.0161RMSE 0.0150 0.0250.0223 0.0201 0.0198表7:误差MEM方法(测试集)临界值描述案例(1)案例(2)案例(4)案例(5)KS一致性测试(1.23**.53****.1****2.28**1.68**3.71***3.31***2.99***Cram'er-v.Mises检验:0.30**0.31**0.41**0.25**0.39**Berkowitz检验:7.74**5.27**10.04***6.94**1.54**Jarque-Bera检验:10.25 7.78***3.75**2.28**9.20***表8:MEM approach(测试集)5风险度量的临界值在本节中,我们给出了与参数l = 3,u=0和σ=0.25(即情况(1)),在不同的置信水平下。这一结果也有助于测试SME和MEMS方法的潜力。

22
大多数88 在职认证  发表于 2022-5-7 04:08:58
在本例中,我们将重建的分位数与样本分位数进行比较。为了计算SME和MEM重建的置信水平γ下的VaR和Tv aR,我们使用了Rockafellar和Uryasev(2000)的引理中简化的VaR和TVaR的理论定义。引理1。函数→ U(a)=a+1- γ∞Za(t)-a) f*S(t)数据定义于(0,∞) 在a中是凸的,在V aRγ处达到其最小值,其最小值为T V aRγ(S)=E*[S | S>V aRγ]。上图,f*她注意到了马克森特罗的照片。在表(9)和(10)中,我们显示了γ集合的计算结果。最后一列对应于模拟样本(观测数据集)的V aR和T V aR及其95%的置信水平。此外,我们还包括观测数据的VaR和TVaR与重建数据的VaR和TVaR之间的绝对差异。为了计算经验VaR和TVaR,我们考虑了S>0的有序递增规模(S≤ s≤ sn),然后将V aR估算为[V aRγ(S)≈ x([N(γ)],其中[a]表示实数a的整数部分。TVaR的估计值是从与\\t V aRγ=N相同的有序值列表中获得的- [Nγ]+1NXj=[N(γ)]sj。VaR和TVaR的置信区间是在不进行替换的情况下,通过使用总数据量的90%的子样本进行r-esampling来计算的。在表(9)和表(10)中,星号表示计算的风险价值和净现值属于95%水平的经验置信区间,也显示在每个表中。这些表格中显示的结果相当一致,这进一步表明了最大熵方法的质量。6分解并非总能单独观察频率和严重程度。

23
何人来此 在职认证  发表于 2022-5-7 04:09:01
也就是说,即使记录了事件的频率,也只有总损失数据或总损失数据可用。然而,风险分析员可能想知道个人损失的分布情况,因为这是预防或减轻损失的水平。我们在这里开发的maxentro-pic方法也允许我们确定个人损失的分布。在我们的例子中,我们知道如何计算或通过数值估算,LaplaceVar逼近误差置信区间γSME MEM经验SME error MEM error V ARIFV aRsup0。900 5.657* 5.657* 5.672 0.015 0.015 5.587 5.7630.910 5.798* 5.818* 5.809 0.011 0.009 5.725 5.9200.920 5.939* 5.980* 5.968 0.029 0.012 5.872 6.0550.930 6.081* 6.141* 6.118 0.037 0.023 6.021 6.2270.940 6.222* 6.303* 6.299 0.077 0.004 6.202 6.3790.950 6.505* 6.465* 6.474 0.031 0.009 6.377 6.6140.960 6.788* 6.788* 6.759 0.029 0.029 6.617 6.9080.970 7.071* 7.273* 7.122 0.051 0.151 6.955 7.3340.980 7.495*7.919 7.583 0.088 0.336 7.428 7.7670.990 8.485*8.566*8.384 0.101 0.182 8.078 8 8.5930.995 9.051*9.061*9.016 0.035 0.045 8.747 9.2100.999 9.192 10.182*10.34 1.148 0.15 8 9.686 11.43表9:SME和MEM重建的VaR比较,案例(1):l = 3,u=0,σ=0.25总损失S的变换ψ(α),我们还有事件频率N的母函数G(z)的解析表达式。从这些成分中,我们可以得到单个损失的L空间变换φ(α),我们可以用它作为确定单个损失概率分布的起点。

24
大多数88 在职认证  发表于 2022-5-7 04:09:05
各种La-place变换之间的关系包含在方程(3)中,我们从方程(3)中得到φ(αk)=lln(ψ(αk))+1,其中,利用我们上面的发展,我们可以写出ψ(αk)=e-l+ (1 - El)Zyαkf*Y(Y)dy,tva逼近误差置信区间γSME MEM经验SME误差MEM error T V aRinfT V aRsup0。900 6.817* 6.833* 6.839 0.022 0.006 6.721 6.9480.910 6.930* 6.967* 6.961 0.031 0.006 6.846 7.0790.920 7.055* 7.041* 7.095 0.040 0.054 6.974 7.2320.930 7.192* 7.121* 7.245 0.053 0.124 7.109 7.3890.940 7.344* 7.303* 7.417 0.073 0.114 7.276 7.5620.950 7.513* 7.528* 7.622 0.109 0.094 7.459 7.7810.960 7.935* 7.814* 7.874 0.061 0.060 7.700 8.0450.970 8.205* 8.220* 8.188 0.017 0.032 7.989 8.3730.980 8.533*8.516*8.601 0.068 0.085 8.405 8.8170.990 8.959*8.912*9.262 0.303 0.350 8.968 9.5550.995 9.556*9.606*9.843 0.287 0.237 9.465 10.2220.999 10.543*11.215*11.167 0.624 0.048 10.341 11.848表10:SEM和MEM重建的TVaR比较,案例(1):l = 3,u=0,σ=0.25对于总损失的拉普拉斯变换,l 是观测到的泊松频率的参数,在我们的例子中是已知的,f*是总损失的最大熵概率密度,我们已经确定了。为了举例说明我们的程序,我们将使用案例(1),其特征为以下参数:l = 3,u=0和σ=0.25。在数值上确定了f*S、 如前所述,我们可以应用SME和MEM程序计算φ(α),以获得单个损失的概率密度。图(7)显示了最终的个体密度。与用于产生总损失的已知概率密度的比较是该程序的另一个一致性测试。

25
大多数88 在职认证  发表于 2022-5-7 04:09:08
个体损失的真实分布为对数正态密度,参数u=0,σ=0.25,如图(7)所示。SDensity0。5 1.0 1.5 2.0 2.50.0 0 0.5 1.0 1.5SMEMEREAL图7:通过SME和MEM方法获得的个人损失密度(1):l = 3,u=0,σ=0.25在表(11)和(12)中,我们给出了重建质量的几种测量结果。这里,SME和MEM重建与真实对数正态密度和观测(模拟)数据进行了比较。我们将重建密度和真实密度与模拟所得数据进行比较,但请记住,这些数据可能不可用。真实密度将用作测试maxentro pic程序质量的基准。请注意,通过与经验数据的MAE和RMSE距离测量,THEMM重建的误差较小,即分别为0.0087和0.0105,获得了最佳结果。通过bo t h程序重建与柱状图之间的距离与t r分布与柱状图之间的距离相似。请注意,第二个表格左栏中的值相等,因为它们测量的是真实密度和直方图之间的距离。最大熵密度和柱状图之间的距离,由陆地测量,分别为0.16 a和0.18 r。请注意,它们与真实密度和直方图之间的距离相似。这些良好的结果对本文中应用的SME和MEM程序起到了检查测试的作用。接近主义者。和真实的洞穴历史。vs.Maxent真实密度vs.MaxentMAE RMSE MAE RMSE MAE RMSESME 0.0042 0.0047 0.0127 0.0257 0.0143 0.0232MEM 0.0042 0.0047 0.0087 0.0105 0.0096 0.0113表11:SME&Memapproachhist计算的个人损失的MAE和RMSE值。与真实密度历史对比。与。

26
mingdashike22 在职认证  发表于 2022-5-7 04:09:11
Maxent真实密度与MaxentL1范数L2范数L1或m L2范数L1范数L2范数SME 0.1640.1865 0.1886 0.1992 0.0679 0.0574MEM 0.1640.1865 0.1659 0.1818 0.0621 0.0624表12:SME和MEM方法计算的个人损失的情况7最终评论和结论我们检查了两种最大熵方法重建保险和银行业利益标准精算模型中的总损失。这两种方法基于在适当的概率空间上定义的熵函数的最大化。对于这两个过程,输入是总损耗分布的拉普拉斯变换值,在我们的情况下,该值已通过数值确定。使用最大熵方法的一个重要原因是,它们基于非常少量的信息提供良好的重建。在我们的例子中,这意味着了解拉普拉斯变换的参数的8个实值。除了对总损耗密度提供相当合理的表示外,最大熵方法允许扩展,可用于处理测量误差或稀缺数据情况。因为我们从第(4)节开始分析的例子,是一个解析解未知的例子,确定它的标准数值程序很难实现我们在这里开发的那些。为了确定我们的方法的质量,我们进行了各种统计测试,包括一致性测试,其中包括应用分解程序来确定单个损失的概率密度,当只记录了总损失,且事件频率的模型可用时。

27
kedemingshi 在职认证  发表于 2022-5-7 04:09:15
统计一致性测试结果令人满意。使用这些方法的另一个原因是,最大熵过程可以扩展到数据中存在错误的情况。在我们的案例中,此类错误与数据的大小有关,例如,在操作风险损失中,数据的大小是常见的情况。当数据量很小时,力矩s的值在统计上是不确定的。因此,有一种考虑到这一事实的方法肯定是不确定的。除了通用统计分析方法的潜在适用性外,Uriest的重点在于进一步探索最大熵方法在操作风险和保险问题上的适用性,特别是对于可能存在多模态、重尾问题或可能包括极端事件或经济冲击的数据,因此,概率密度的估计可能非常难以计算。8附录拟合优度测试有一些测试可以帮助我们确定重建的密度是否合适。

28
mingdashike22 在职认证  发表于 2022-5-7 04:09:18
在这里,我们简要回顾了上述测试的基本事实。8.1科尔莫戈罗夫-斯米尔诺夫测试科尔莫戈罗夫-斯米尔诺夫测试是一种均匀性测试,使用经验分布函数(EDF)和估计(重建)分布函数之间的最大绝对观测距离,Dn=sups | Fn(sj),验证两者之间的差异- F*S(sj)|其中n是数据点的数量;{sj | j=1,…,n}是总损失S的样本数据点;Fn(·)是(累积)经验分布函数;和F*S(·)是最大熵(累积)分布函数(克鲁兹,2002)。分布之间无差异的零假设必须在0.1、0.05或0.01的显著水平α下予以拒绝√nDn>√ndα,如果p-值<α,其中,当零假设为真时,根据K-S统计量的分布计算临界值dα和p值。这不是一个简单的分布,但可以通过交感或模拟获得。总之,如果统计数据√在90%、95%和99%的置信水平下,NDNI分别大于1.22、1.36、1.63。该测试的一个问题是,KS统计取决于最大差异,而不考虑整个估计分布。当怀疑分布之间的差异仅发生在排列的上下两端时,这一点很重要(克鲁兹,20 02)。这在小样本中可能特别有问题。此外,littleis知道偏离独立性对Dn的影响,也就是说,如果我们不确定样本的独立性,我们就不确定测试结果的含义。还有其他EDF测试,在大多数情况下比简单的KolmogorovSmirnov测试更有效。

29
kedemingshi 在职认证  发表于 2022-5-7 04:09:21
关于K-S测试的更多细节见Stephens(1974)。8.2 Anderson-Darling测试这是KS方法的更复杂版本,它基于Fn(S)和F之间的二次差异*S(S)。这里的AD统计计算如下:An=n∞Z-∞|新界北(s)- F*S(S)|ψ(S)f(S)ds,其中ψ(S)=f*S(S)(1)-F*S(S))是权重函数;n是数据点的数量,a和{sj | j=1,…,n}观察到的(在我们的例子中模拟的)总损失S样本,Fn(·)是经验(累积)分布函数,F*S(·)是(累积)最大熵分布函数。当ψ(s)=1时,Anderson-Darling(AD)统计量减少到今天被称为Cram\'er von Mises统计量的统计量。该测试通过整合样本所有值的垂直距离,最大限度地利用观测数据,通过使用ψ(·)增加其平衡分布之间方差的能力。安德森测试比KS测试更强调分布的尾部(克鲁兹,2002)。可根据临界值评估试验统计数据,以拒绝或不拒绝蹄的均匀性。如果在95%和99%的置信水平下,ANI分别大于临界值2.492和3.857,则无效假设将被拒绝。对于Cram’er-vonMises检验,在95%和99%的置信水平下,当统计量分别大于0.461和0.743时,我们拒绝了无效假设。安德森-达林(Anderson-Darling,AD)统计量的行为类似于克莱姆-冯-米塞斯统计量,但在测试F*S(S)偏离了轨道的真实分布,尤其是当似乎有许多外围值时。对于拟合优度检验,尾部偏离通常是重要的检测指标,而Anis则是推荐的统计数据(Marsaglia et。

30
nandehutu2022 在职认证  发表于 2022-5-7 04:09:24
8.3 Berkowitz back test Berkowitz(2001)提出了ma t离子zn=Φ的转换-1(Rsn)-∞F*S(S)ds)=Φ-1(F(sn)),使数据i.i.d标准在零假设下正常。这样就可以利用可用正常性测试的强大电池,而不是依赖均匀性测试。除此之外,Berkowitz回归测试提供了一个正常性和独立性的联合测试。该程序包括对照一阶自回归备选方案(zt)测试ρ=u=0,σ=1的零形合- u=ρ(zt)-1.- u)+εt),其均值和方差可能不同于(0,1)。LR测试的公式为LR=-2(L(0,1,0)- L(^u,^σ,^ρ))(17)其中L(^u,^σ,^ρ)是仅作为模型未知参数函数的可能性,hats表示估计值。由于方便,这里重现了与Firstorder自回归替代方案相关的确切函数。L(u,σ,ρ)=-对数(2π)-对数[σ/(1)- ρ)] -(z)- u/(1 - ρ))2σ/(1 - ρ)-T- 1log(2π)-T- 1log(σ)-TXt=2(锌)- u - ρzn-1)2σ(18) 式中σ=V AR(εt)。在零形下,检验统计量以χ(3)的形式分布。这意味着当统计量大于7时,我们拒绝了零假设。在95%和99%的置信水平上,分别为815和11.34。通常建议用至少一个额外的正态性t检验来补充Berkowitz检验,例如Jarque Bera检验。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 21:42