楼主: mingdashike22
1497 34

[量化金融] 两种确定概率密度的最大熵方法 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-7 04:08:21
由于F*S(·)和Fn(·)可用于计算样本的所有点。另一种可能性是测试估计的密度函数f*S(·),等于真正的底层密度函数fS(·)。另一种方法是基于Ro senblatt(1952年)提出的积分变换,Diebold等人(1998年)对此进行了广泛的研究,其中包括测试概率积分变换(PIT)是否独立且均匀分布。数据的概率积分变换(PIT)由ZSJ定义-∞F*S(S)ds=F*S(sj)=pj(16),其中sj是j-感兴趣样本的第个元素,在这种情况下,是观察到的(模拟的)总损失。也就是说,我们从一个由n个未知度fS(·)描述的群体中取样。在f的定义中*S(·)是重建的(最大熵)密度,pjis是sj的概率积分变换(PIT),它应该遵循i.i.d统一分布(pj)~ Unif(0,1))如果f*形状等于fS。与一致性的偏差将表明经济结构可能未能捕获底层数据生成过程的某些方面。为了测试凹坑测试中的均匀性和独立性,使用了对凹坑直方图和自相关图的目视检查,以及其他测试,如KS测试、安德森-达林测试和克拉姆-冯-米塞斯测试(Tay等人,2000)。

12
能者818 在职认证  发表于 2022-5-7 04:08:24
此外,我们还考虑了Berkowitz-back测试方法,该方法包括对PIT进行正态逆变换,然后对正态性和独立性进行联合测试,有时还与Jarque Bera的正态性测试相结合。使用SME和MEM密度计算VaR和TVaR度量,可以被视为评估重建质量的额外方法。这是通过将这些值与从观测数据中获得的经验VaR和TVaR进行比较来实现的。我们在本文中进行的许多比较是针对概率密度未知的模拟复合随机变量进行的,但样本足够大,足以为我们提供作为最大熵方法输入的数据的良好近似值。在本文中,我们将把这个样本称为“观测数据”。另一方面,我们还使用我们称之为“测试集”的样本进行比较,这是一个独立的数据集,与观察到的数据来自同一人群,用于审计结果。这样做是为了避免过度拟合的问题,过度拟合被定义为模型对“观察”集给出的结果比来自同一人群的其他数据集给出的结果更好的情况。此外,这有助于我们评估maxent r opic density在未观测到的数据上表现良好的能力。4.数值分析我们考虑的例子包括一个复合过程,其中给定时间段内的事件频率由参数的泊松随机变量N描述l, a和个人损失XJJ≥ 1,根据对数正态分布(X~ logN(u,σ))。在这种情况下,S(N)的拉普拉斯变换不能用解析法计算,但可以用数值方法估计。我们的工作如下:1。

13
nandehutu2022 在职认证  发表于 2022-5-7 04:08:27
我们从复合分布S(N)=NP1生成了一个8.000 f的样本≤jXj,其中{N≥ 0 | N=N,N,nn},是对数正态样本的大小,具有平均值u和标准偏差σ,n是参数的泊松样本总数l. 利用模拟的损耗,我们计算矩u(αi),这是获得最大熵分布所需的输入数据。2.我们采用第(2.1)节和第(2.2)节中描述的SME和MEM方法,使用变量指数的8个分数矩u(αi),其中αi=1.5i,i=1,8.也就是说,K=8是零阶矩的个数。使用Barzilai-Borwein(1988)算法执行最小化程序。3.每种方法都在五种情况下实施。其中一个被详细描述,称为案例(1),以参数为特征l = 3,u=0,σ=0.25,以及其他四种(情况2-5),用于验证最大熵方法对参数变化的鲁棒性。因此,我们考虑两个具有相同对数正态参数u=0,σ=0.25,但泊松参数不同的情况(情况2-3),以及另外两个具有相同泊松参数的情况l = 3和不同的对数正态参数(案例4-5)。

14
mingdashike22 在职认证  发表于 2022-5-7 04:08:30
一旦获得最大熵密度,我们将使用两个独立数据集的各种标准(如第(3)节和附录所述)来评估重建质量,观测数据集大小为8000,测试数据集大小为1500.4.1。使用SME方法进行数值重建。我们从一个复合过程开始,其中频率N是参数的泊松变量l = 3.单个损失由对数正态分布描述,参数为u=0,σ=0.25,由此产生的复合总和称为S,代表可能影响企业的总损失。在图(1)中,我们展示了基于SME的重建的密度、分布函数、边缘校准和可靠性图。这些图允许我们通过使用相同结果的不同视角,观察SME方法在经验直方图和经验(累积)分布函数方面的性能,这让我们直观地了解获得的重建有多好。SDensity0 5 10 150.00 0.05 0.10 0.15 0.20 0.25 0.30SME(a)SME密度0 2 4 6 8 10 120.0 0 0.2 0.4 0.6 0.8 1.0SF经验LSME(b)SME分布函数0 2 4 6 8 10 12-0.10-0.05 0.00 0.05 0.10符号- SME(c)SME边际校准0。0.2 0.4 0.6 0.8 1.00.0 0.2 0.4 0.6 0.8 1.0 SME概率经验概率(d)SME可靠性图1:案例的SME结果(1):l = 3,u=0,σ=0.2注意图(1a)中的SME密度和观察数据的直方图似乎很接近。

15
何人来此 在职认证  发表于 2022-5-7 04:08:33
从图(1b)中可以看出,中小企业的(累积)分布函数和观察到的数据也是如此,它们之间的差异似乎难以察觉。在图(1c)中,我们展示了边缘校准图,该图允许我们观察SME重建的(累积)分布函数与观测数据之间的差异。该图显示,差异不大于0.022。这种零左右的微小波动是重建质量良好的指标。此外,在图(1d)中,我们得到了观测频率与SME密度的可靠性图。该图测量估计概率和观测频率之间的一致性,由绘制的曲线与对角线的接近度表示。在这里我们可以看到,在图表的开头只有一个很小的偏差。尽管图(1)的结果似乎表明重建效果良好,但作为接近度的测量,我们还考虑了重建密度和经验密度之间距离的陆地形状,以及第(3)节详述的MAE和RMSE误差。表(1)显示了计算结果。这些值证实了图(1)所示重建质量良好的合理性。相对于直方图的MAE和RMSE距离相当小,为10级-3,以及最大熵法和历史平均良好方法之间的陆面位置,LLMAE RMSESME 0.1225 0.0598 0.0071 0.0089表1:错误SME方法,案例(1):l = 3,u=0,σ=0.25测试密度重建便于正确校准。这包括检验逆概率变换ms(PIT)是否独立且分布均匀。与均匀性的偏差可能表明重建效果不佳。

16
大多数88 在职认证  发表于 2022-5-7 04:08:37
在图(2)中,我们展示了情况(1)中不同功率的坑变换和相关图。正如我们所见,凹坑直方图似乎是一致的,相关图没有显示任何依赖性的迹象。如上所述,为了测试SME方法的稳健性,我们使用其他参数值的模拟数据进行重建。在每种情况下,我们都经历了相同的程序:我们生成数据,计算力矩,然后执行最大熵过程。在图(3)中,我们展示了不同的SME重建,以及不同的组织图MPFFREQUENCY0。0.2 0.4 0.6 0.8 1.00 500 15000 10 20 300.0 0 0.4 0.8矿坑的LAGACF 0 10 20 300.0 0 0.4 0.8矿坑的LAGACF-1/20 10 20 300.0 0.4 0.8Lagacfafaf(坑)-1/2)^2图2:SME方法的概率积分变换(PIT)直方图和样本自相关函数。案例(1)l = 3, u = 0, σ = 0.25.通过观察数据的直方图。只要看一眼这些图,我们就会确信,不同的重建似乎很好地符合观察到的数据。我们在上面使用的同一个标准来衡量病例(1)的质量,在这些病例中也产生了一致的结果。例如,表(2)中列出了(2)到(5)被认为是缺陷(2)的情况下,陆地形态中估计密度和经验密度之间的距离,以及MAE和RMSE值。他们认为重建是合理的。

17
nandehutu2022 在职认证  发表于 2022-5-7 04:08:40
此外,在表(2)中,我们可以看到,在案例(3)和(4)中,L、L、MAE和RMSE的值小于案例(1)中观察到的值,而案例(2)和(5)中的值更大。错误案例(2)案例(3)案例(4)案例(5)L-norm 0.2649 0.0947 0.1196 0.1105L-norm 0.2099 0.0399 0.0563 0.0516MAE 0.0216 0.0038 0.0074 0.0058RMSE 0.0257 0.0047 0.0094 0.0064表2:错误SME方法,案例(2)-(5)SDensity0 5 10 150.0.2 0.4 0.6 0.8SME(a)案例(2):l = 1,u=0,σ=0.25SDensity0 5 10 150.00 0.05 0.10 0.15 0.20 0.25 0.30SME(b)情况(3):l = 4,u=0,σ=0.25S密度0 5 10 150.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35SME(c)情况(4):l = 3,u=0.1,σ=0.25SDensity0 5 10 150.00 0.05 0.10 0.15 0.20 0.25 0.30SME(d)情况(5):l = 3,u=0,σ=0.5图3:复合和S的SME方法的密度组合图,针对不同的参数为了评估SME方法在未观察到的数据上表现良好的能力,我们使用测试数据集计算SME密度的误差和距离,即来自与观察数据相同的群体的独立且较小的样本。表(3)显示了本文中所有案例的相应L、L、MAE和RMSE结果。它们似乎显示出与表(1)和表(2)中所示的观测数据集得出的结果类似的结果。这些表明,获得的最大熵近似值不支持过度效应,并且在未观测到的数据上表现良好。错误案例(1)案例(2)案例(3)案例(4)案例(5)L1范数0.1223 0.2103 0.0960 0.1206 0.1471L2-范数0.0649 0.1847 0.0408 0.0591 0.0651MAE 0.0109 0.0216 0.0126 0.0095 0.0120RMSE 0.0147 0.0259 0.0140.0140.0121 0.0171表3:错误SME方法(验证集)对于每个参数选择,我们应用了第(3)节和附录中描述的不同统计测试。所得结果如表(4)所示。

18
何人来此 在职认证  发表于 2022-5-7 04:08:44
三星表示在1%的显著性时,我们不拒绝经验密度和最大密度之间无差异的零假设,而三星表示在5%的显著性时,我们不拒绝零假设。附录中给出了所有试验所用的临界值。大多数病例以5%的显著性通过测试,其余病例以1%的显著性通过测试。标准案例(1)案例(2)案例(3)案例(4)案例(5)KS均匀性检验1.51**1.28**0.87**1.17**1.24**Anderson-Darling检验:1.95**2.44**1.46**1.51**1.39**Cram`er-Von Mises检验:0.30**0.44**0.19**0.13**0.29**Berkowitz检验:5.74**2.17**4.43**4.55**1.55**1.19**Jarque-Bera检验:1.34**8**2.93**4**4表格**4**在本节中,我们描述了第(2.2)节中描述的MEM方法的实施结果。我们再次开始考虑单个损失的aPoisson和简单对数正态分布的复合和,以及参数l = 3,u=0和σ=0.25。在这里,我们使用参数η=2的泊松参考度量和[0,1]中大小为M=200的分区,如第(2.2)节所述。在图(4)中,我们显示了MEM重建和观测数据集的密度、分布函数、边缘校准和可靠性图。在图(4a)中,我们展示了SME和MEM重建以及观测数据的直方图,而在图(4b)、(4c)和(4d)中,我们分别展示了分布函数、边缘校准图和可靠性图,这里我们只展示了MEM重建以及经验分布。在面板(4c)中,我们观察到零点附近的微小波动,绝对值不大于0.027。

19
可人4 在职认证  发表于 2022-5-7 04:08:47
如此小的函数表明了一个很好的函数。在表(5)中,我们显示了L、L、SME和MEM距离中重建之间的数值距离,以查看最大熵密度与观测数据集之间的差异。显然,在表(5)中,SME重建似乎比MEM重建好一点,但即便如此,MEM近似为我们提供了一个相当好的重建。方法L1 L2 MAE RMSESME 0.1225 0.0598 0.0071 0.0089MEM 0.1279 0.0609 0.0086 0.0109表5:SME和MEM重建的错误案例(1):l = 3,u=0,σ=0.25在图(5)中,我们显示了不同功率的凹坑变换和相关图密度0.2 4 6 8 10 120.00 0.05 0.10 0.15 0.20 0.25 0.30 SMEMEM(a)MEM密度0 2 4 6 8 10 120.0 0 0.2 0.4 0.6 0.8 1.0 SF经验分布函数0 2 4 6 8 10 12-0.10-0.05 0.00 0.05 0.10符号- MEM(c)MEM边缘校准0。0.2 0.4 0.6 0.8 1.00.0 0.2 0.4 0.6 0.8 1.0MEM概率经验频率(d)MEM可靠性图图4:案例的MEM(η=2,M=200)结果l = 3,对于(1)情况,u=0,σ=0.25。正如我们所见,坑历史图似乎是一致的,相关图没有显示任何依赖性的迹象。在图(6)中,我们展示了MEM和SME方法的结果,以及不同参数值的复合和的经验直方图l, u&σ,以查看重建和观察数据之间的差异。重建似乎符合组织学,很明显,重建之间几乎没有差异。

20
大多数88 在职认证  发表于 2022-5-7 04:08:51
我们指出,MEM方法的结果对用于显示结果的插值方案和比特历史图MPFFFrequency0的大小非常敏感。0.2 0.4 0.6 0.8 1.00 500 15000 10 20 300.0 0 0.4 0.8矿坑的LAGACF 0 10 20 300.0 0 0.4 0.8矿坑的LAGACF-1/20 10 20 300.0 0.4 0.8Lagacfafaf(坑)-1/2)^2图5:MEM方法的概率积分变换(PIT)直方图和样本自相关函数。案例(1)l = 3, u = 0, σ = 0.25.采用分区,这使得分布的尾部更难调整。在表(6)中,我们列出了重建密度和经验密度之间的土地密度,以及MEM分布函数和经验分布函数之间的MAE和RMSE距离。在大多数情况下,这些误差比SME重建获得的误差稍大。在(2)情况下会出现一个例外,即MEM重建比SME获得的密度更好。错误案例(2)案例(3)案例(4)案例(5)SME MEM SME MEM SME MEM SME MEM SME MEML1 norm 0.2649 0.2560 0.0947 0.1952 0.1196 0.1652 0.1105 0.1498L2-norm 0.2099 0.2091 0.0399 0.0857 0.0563 0.0770 0.0516 0.0605MAE 0.0216 0.0182 0.0038 0.0172 0.0074 0.0123 0.0058 0.0114RMSE 0.0257 0.0021 0.0021 0.0047 0.0060.060.060.060.060.060.060.060.060.060.060.060错误和错误方法,案例(2)-(5)使用测试集,我们可以观察MEM重建如何执行数据。在表(7)中,我们显示了L、L、MAE和RMS误差测量值。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 02:53