楼主: 大多数88
1554 43

[量化金融] 基于神经网络的经济仿真模型贝叶斯估计 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-6-24 04:01:43
虽然我们的方法没有做出平稳性假设,但在应用这两种方法时,我们仍然考虑了一系列的第一个差异,以尽可能公平地进行比较。还应注意的是,我们假设结构破裂的位置未知或难以先验确定(与大多数实际问题一样),这意味着我们对完整的时间序列数据应用两种估计方法,以同时估计破裂前后的参数。然而,如果已知结构断裂的位置,则可以使用适当的数据子集单独估计相关参数,这是一项我们在此不考虑的挑战性较小的任务。现在,参考表2,我们发现我们提出的估算方法和Grazzini et al.(2017)的估算方法在试图估算突破前和突破后的波动率时表现相似,都对自由参数做出了合理的估算,并且都能够确定动态中的正确变化。然而,参考表3和表4,我们发现,在试图估计断裂前后的漂移时,出现了更明显的差异。虽然这从我们提出的方法相关的损失函数值在所有情况下都明显较低这一事实中可以明显看出,但更详细的分析揭示了值得一提的进一步区别。表3显示了漂移增加情况下的结果,表明我们提出的方法正确地确定了两种情况下的漂移增加趋势,并且正确地确定了参数集4的漂移增加是参数集3的三倍。与此相反,Grazzini等人(2017年)的方法错误地指出了这两种情况下的下降趋势。

22
kedemingshi 在职认证  发表于 2022-6-24 04:01:46
表4给出了漂移减小情况下的结果,类似地表明,我们提出的方法在试图识别漂移变化时提供了优异的性能。表3:随机游走模型(增加漂移)dd的估计结果汇总D参数集3θtrue0.4 0.5 0.1MDNu后验0.4867 0.5465 0.0598σ后验0.0536 0.1139-σ取样0.0056 0.0038-LS 0.0984KDEu后验0.5204 0.3258-0.1945σ后验0.0578 0.1463-σ取样0.0032 0.0050-LS 0.2117参数集4θtrue0.4 0.7 0.3MDNu后验0.5054 0.6876 0.1823σ后验0.0434 0.1131-σ取样0.0024 0.0036-LS 0.1061KDEu后验0.5308 0.5033-0.0275σ后验值0.0561 0.1457-σ取样0.0025 0.0041-对于两个自由参数集,LS 0.2362σ=1和σ=2。在估计收益率而非波动率时,每种方法的相对性能的这种变化是模型确定性和随机性成分之间关系的直接结果。对于选定的参数范围,随机波动et主导了模型的演变,漂移产生了更微妙的影响,尤其是在结构破裂发生后。因此,正确估计盘前和盘后波动率远没有估计盘前和盘后漂移那么具有挑战性。

23
可人4 在职认证  发表于 2022-6-24 04:01:49
因此,虽然两种方法在估计与波动率等显性效应相关的参数时表现良好,但我们的方法在估计与模型更细微和不太显性方面相关的参数时,纳入对先前观察值的依赖似乎很重要。表4:随机游走模型(减小漂移)dd的估计结果汇总D参数集5θtrue0.5 0.4-0.1MDNu后验0.5691 0.4743-0.0949σ后验值0.0485 0.1348-σ抽样0.0031 0.0039-LS 0.1015KDEu后验0.6015 0.2611-0.3404σ后验值0.0573 0.1396-σ抽样0.0039 0.0032-LS 0.1720参数集6θtrue0.7 0.4-0.3MDNu后验0.7585 0.4400-0.3185σ后验0.0532 0.1526-σ取样0.0033 0.0029-LS 0.0709KDEu后验0.7838 0.2934-0.4904σ后验0.0564 0.1469-σ取样0.0027 0.0030-对于两个自由参数集,LS 0.1356σ=1和σ=2。4.3 Franke和Westerhoff(2012)模型如第3.3节所述,我们所考虑的最终模型有许多备选结构,不同于在每个时期如何确定原教旨主义相对于宪章主义的吸引力。因此,我们考虑了其中的两种配置,即HPM和WP,并重点估计与αn规则相关的参数∈ [0, 2], α∈ [-1,1],αp∈ [0,20],αw∈ [0,15000]和η∈ [0,1],同时估计图表需求方程中出现的噪声项的标准偏差σc∈ [0, 5].参考表5,我们发现,我们提出的HPM参数集估算方法似乎比Grazzini等人(2017)的估算方法更有效,除了一个被考虑的自由参数外,其他所有参数的估算值都更高,损失函数值也更低。然而,在比较这些方法时,估计值没有实质性差异。

24
能者818 在职认证  发表于 2022-6-24 04:01:52
尽管如此,我们发现,与随机游走实验中观察到的趋势类似,WP参数集的性能差异更为明显。特别是,我们看到与每种方法相关的损失函数值有很大差异,这是由η的估计质量的差异造成的。19我们最初试图很好地估计σfas,但发现这与σc表现出一定程度的共线。表5:Franke和Westerhoff(2012)模型αnαpσcParam集HPMθtrue的估计结果摘要-0.327 1.79 18.43 2.087MDNu后-0.1749 1.8987 17.1821 2.3113σ后验0.1297 0.1697 2.2932 0.3548σ后验0.0036 0.0232 0.0410 0.0130LS 0.1210KDEu后验-0.1287 1.7968 16.2177 2.3134σ后验0.1667 0.2880 3.1280 0.5547σ后验0.0139 0.0105 0.2356 0.05105LS 0.15534αwησcParam集WPθtrue2668 0.987 1.726MDNu后验1993.1311 0.9078 1.6991σ后验195.8553 0.0799 0.4335σ后验184.4589 0.0043 0.0364LS 0.0912KDEu后验2437.169 7 0.6263 1.4567σ后验概率2831.5574 0.2846 0.3403σ采样458.0461 0.0257 0.0296LS 0.3650u=0.01,β=1,根据Franke和Westerhoff(2012)的建议,HPM参数集的φ=0.12、χ=1.5和σf=0.758,WP参数集的u=0.01、β=1、φ=1、χ=0.9、α=2.1和σf=0.752。如图2所示,Grazzini等人(2017)的方法产生了η的宽后验值,该后验值分散在整个勘探参数范围内,这导致相对较差的估计。与此相反,我们发现所提出的方法效果更好,产生的后验值更窄,估计更准确。

25
nandehutu2022 在职认证  发表于 2022-6-24 04:01:55
虽然由于异质代理模型的非线性性质,确定观察到的行为的任何决定性原因都是非常重要的,但值得指出的是,在模型的WP版本中包含财富动态会引入对之前回报的依赖性。24-26,这反过来可能会增加日志返回时间序列中当前值和先前观察值之间的关系强度。最后,请注意,对于所考虑的绝大多数自由参数,建议的方法也会导致较低的后验标准差,Brock和Hommes(1998)模型就是这样。4.4总体总结在前面的小节中,我们主要侧重于逐个分析结果。然而,在这里,我们对所有考虑的模型进行了总结性比较。

26
nandehutu2022 在职认证  发表于 2022-6-24 04:01:58
这是通过考虑表6所示的一些关键性能指标来实现的,这些指标在全局和单个参数级别上比较了这些方法。0 2000 4000 6000 8000 10000 12000 14000 16000w0.00000.00010.00020.00030.00040.0005p(w)前密度TruePoster Means后密度0.0 0.2 0.4 0.6 0.8 1.00246810p()前密度TruePoster Means后密度0 1 2 3 4 5c0.00.20.40.60.81.01.21.41.6p(c)前密度TruePoster Means后密度(a)MDN0 2000 4000 6000 8000 1000014000 16000w0.00020.00030.00040.0005p。(w)先验密度TruePostal Meanster Density 0.0 0.2 0.4 0.6 0.8 1.00.00.51.01.52.02.5p()先验密度TruePostal Meanster Density 0 1 2 3 4 5c0.00.51.01.52.02.5p(c)先验密度TruePostal Meanster Density(b)KDEFigure 2:Franke和Westerhoff(2012)模型WP参数集的边际后验分布。上述指标中的第一个,也是最重要的一个,LSmdn<LSkde,表明了所提议的方法产生较低损失函数值的频率,从而衡量其恢复真实参数集的相对能力。我们观察到,在所有考虑的情况下,我们的方法都会产生较低的损失函数值,这可以被视为在全球水平上的优势。表6:所有模型的估计结果摘要SOUTCOME案例百分比SLSMDN<LSkde |uimdn-θitrue |<|uikde-θitrue | 81.48σimdn<σikde77.78第二个度量,|uimdn- θitrue |<|uikde- θitrue |,确定我们提出的方法在自由参数集中为单个参数生成最优估计的频率。在某些情况下,人们可能会发现,通过Grazzini等人(2017)的方法获得的自由参数asubset估计值更高,即使整个自由参数集的总体估计值不太好。

27
nandehutu2022 在职认证  发表于 2022-6-24 04:02:01
然而,我们发现,在80%以上的案例中,我们的方法也在个体参数水平上产生了优势,占大多数。还应注意的是,在几乎所有情况下- θitrue |>uikde- θitrue |,例如Brock和Hommes(1998)模型中的band-bin,以及随机游走模型中的σ和σ,这两种方法产生的估计差异非常小。与此相反,在|uimdn- θitrue |<|uikde- θitrue |,如gand-gin-the-Brock和Hommes(1998)模型,以及Franke和Westerhoff(2012)模型中的η,其特点是通过竞争方法获得的估计值存在较大差异。这表明,我们提出的方法在各个参数水平上也显示出一定程度的优势。最终指标σimdn<σikde表明,我们提出的方法导致单个参数的后验标准差减少的频率,在所考虑的情况中,后验标准差出现的频率略低于80%,这也是一个令人满意的多数。根据上述指标总体提供的证据,我们提出的方法确实优于Grazzini等人(2017),Platt(2019)已经证明,Grazzini等人的方法在文献中主导了许多其他当代方法。这最终验证了我们的方法是对经济模拟模型不断增长的估算方法工具箱的一个有价值的补充。5实际考虑5.1选择之前所述的滞后长度,我们在所有涉及我们提出的方法的估计实验中设定L=3。当然,如果有一种系统的选择L的方法,人们可能会想,这是否是一个任意的选择。同样,人们也可能会想,所获得的结果是否对这种选择具有稳健性,即使只是在某种程度上。

28
何人来此 在职认证  发表于 2022-6-24 04:02:04
我们现在解决这两个问题。9.6 9.8 10.0 10.2 10.4y02468p(y | x)L=0L=19.6 9.8 10.0 10.2 10.4y02468p(y | x)L=1L=29.6 9.8 10.0 10.2 10.4y02468p(y | x)L=2L=39.6 9.8 10.0 10.2 10.4y0246810p(y | x)L=3L=49.6 9.8 10.0 10.2 10.4y0246810p 468p(y | x)L=4L=59.6 9.8 10.0 10.2 10.4y0246810p(y | x)L=5L=6图3:典型示例中条件密度估计值对滞后长度选择的敏感性演示Brock和Hommes(1998)模型。在应用所提出的方法时,我们观察到了一种在整个实验中似乎相对一致的现象。更详细地说,we20在仔细检查时,我们的方法似乎会减少由2个以上自由参数组成的参数集的后验标准差,这可能暗示,随着自由参数数量的增加,我们的方法的估计不确定性增加的速度可能不如Grazziniet al.(2017)的方法快。最终,需要进一步的调查来验证这一假设。观察到,虽然增加L最初对估计的条件密度有显著影响,但存在一些L*≥ 0,因此对于L≥ L*,pxsimt,ixsimt公司-五十、 我,xsimt公司-1,i:θ\' pxsimt,ixsimt公司-L-1,我,xsimt公司-1,i:θ, (27)或者换句话说,MDN基本上忽略了额外的滞后。0 1 2 3 4 5y0.000.250.500.751.001.251.50p(y | x)真实pdfL=10 1 2 3 4 5y0.00.20.40.60.81.01.21.41.6p(y | x)L=1L=20 1 2 3 4 5y0.000.250.500.751.001.251.50p(y | x)L=2L=30 1 2 3 4 5y0.000.250.500.751.001.251.50p(y | x)L=3L=40 1 2 3 4 5y0.00.20.40.60.81.01.21.41.6p(y | x)L=4L=50 1 2 3 4 5y0.000.250.500.751.001.251.50p(y | x)L=5L=6图4:对i.i.d.滞后长度选择的条件密度估计。

29
可人4 在职认证  发表于 2022-6-24 04:02:08
服从对数正态分布的随机样本,LN(0,0.25)。6 4 2 0 2 4 6y0.000.050.100.150.200.250.30p(y | x)L=0L=16 4 2 0 2 4 6y0.000.050.100.150.200.250.300.35p(y | x)L=1 L=26 4 2 0 2 4 6y0.000.050.100.150.250.300.35p(y | x)L=2 L=36 4 2 0 2 0 4 6y0.000.150.250.300.35p(y | x)124; x)L=3L=46 4 2 0 2 4 6y0.000.050.100.150.200.250.300.35p(y | x)L=4L=56 4 2 0 2 4 6y0.000.050.100.150.200.250.300.35p(y | x)L=5L=6图5:演示AR(2)模型的条件密度估计对滞后长度选择的敏感性,xt+1=0.45xt+0.45xt-1+et,其中et~ N(0,1)。我们在图3中以图形方式对此进行了说明。在这里,我们使用Brock和Hommes(1998)模型初始化数据集1生成的100个长度为1000的实现来训练MDN。然后,我们从长度为1000的时间序列中随机抽取一个由6个连续值组成的任意序列,该序列也是由Brock和Hommes(1998)模型生成的。然后,这允许我们使用MDN绘制不同L选择的条件密度函数,以上一步中生成的值为条件,并观察上述趋势。在已知真实滞后Ltrue的模型上重复此练习(见图4和图5),我们可以看到*= 真的。这有许多重要的应用程序。首先,这意味着我们在这里构建的类型的图可以作为一种手段,系统地告知选择任意模型的L。其次,也许更重要的是,它意味着如果≥ 的确,只要MDN有足够的表达能力和训练有素的训练,该程序至少应该对滞后的选择表现出一定的稳健性。

30
何人来此 在职认证  发表于 2022-6-24 04:02:11
这解释了为什么在我们的实验中,简单地设置L=3会导致高水平的估计性能,而不管所考虑的模型是什么,因为所考虑的模型并不具有长期依赖性。5.2计算成本在这一点上,人们可能会问,拟议的估算程序在计算成本方面是否优于其他当代备选方案。Grazzini等人(2017)指出,使用候选模型生成模拟数据的成本通常占主导地位,尤其是对于可能需要运行几分钟才能生成单一实现的大型模型。因此,任何估计方法都必须将模拟的集合大小(我们称之为R)保持在最小。如前所述,我们选择R=100,这导致相对较大的训练集R(Tsim- 五十) =99700个培训示例。这与文献中的大多数备选方案相比,在许多方面都是有利的。首先,大多数试图估算类似复杂度模型的研究都使用了由大量实现组成的插入码,通常超过ofR=1000(Barde 2017;Lamperti 2017;Lux 2018)。其次,相对于我们所采用的网络体系结构的复杂性,与R=100相关的训练集已经很大了。为了说明这一点,我们重复与Brock和Hommes(1998)模型的参数集1相关的实验,只改变模拟的合奏大小,该大小已减半为R=50。我们发现,即使蒙特卡罗复制次数大幅减少,所提出的方法仍表现良好,损失函数值低于Grazzini等人(2017)在原始实验中使用的方法,其比率为SmdN/LSKDE=0.7249。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-6 10:41