楼主: 可人4
1810 34

[经济学] 关于概率评估的集合:正则混合 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-4-26 15:33:21
在两个调查日期,明显存在显著差异。例如,2004年第四季度的简单平均预测将通货膨胀率低于1%的概率定为2.3%,而在2018年第四季度,将相同事件的概率定为10.5%。继续,在图3的顶部面板中,我们展示了simpleaverage预测的完整时间序列。此外,随着时间的推移,无论是在地点还是规模上,都会出现明显的大变动。准确的欧元区通货膨胀预测目标是预测后一年统一消费物价指数(HICP)的百分比变化。例如,当调查在2017年10月(2017年第四季度)进行时,HICP通货膨胀数据可在2017年9月之前获得,因此2017年第四季度调查要求对2017年10月至2018年9月的年份进行预测。我们的实现样本与预测样本相匹配,包含83个季度观察结果,从1999年12月开始,到2020年6月结束。我们将很快使用对数分数目标和几种正则化,包括单纯形、单纯形+岭、单纯形+熵和子集平均,获得混合密度。然而,在进行实证研究之前,我们要解决几个问题。5.1.1调查进入和退出首先,预报员可以进入和退出调查池。在1999年第一季度和2019年第四季度之间,有103个独特的预报员,而且没有预报员连续出现在预报池中。继Gender等人(2013年)之后,我们首先排除了错过四次以上连续调查的预测者,剩下18名预测者。然后,我们根据历史表现对剩余间隙进行插值。看见https://www.ecb.europa.eu/stats/ecb_surveys/survey_of_professional_forecasters/html/index.en.html.Eurostat,统一消费物价指数:欧元区(19个国家)所有项目[CP0000EZ19M086NEST],从圣路易斯联邦储备银行FRED检索。

22
大多数88 在职认证  发表于 2022-4-26 15:33:27
路易斯;https://fred.stlouisfed.org/series/CP0000EZ19M086NEST.More准确地说,我们将第一次调查(t=11999Q1)中的差距与所有其他可用预测者的未遗漏预测的平均值结合起来。然后,我们计算每个预测者的排名分数,并根据分数将他们分成五个相互排斥的组,然后进行第二次调查。在接下来的每一轮(t=2,3,…,t)中,我们将某个预报员的缺失观测值设置为该组未缺失预测的平均值,然后使用全套预测重新计算得分,并更新组结构,以便在下一轮中使用。5.1.2时变仓位定义第二,结果仓位定义随时间而变化。虽然对于中等“标准”膨胀值而言,垃圾箱的定义一直比较稳定,但随着时间的推移,随着尾部实现率的下降,极端的尾部垃圾箱变得越来越多。例如,对于高膨胀,最初的压力大于3.5英寸,但最终被分为3.5-4和>4个料仓。我们继续有效地合并极端垃圾箱,以产生11个垃圾箱定义,为整个样本确定:(-∞, -0.5],(-0.5, 0], (0, 0.5], ..., (3.5, 4], (4, ∞].5.1.3零概率实现最终,对数分数目标可能会出现并发症。例如,考虑调查预测:y∈(-∞, 1.5]w.p.=0(1.5,2.0]w.p.=0.3(2.0,2.5]w.p.=0.5(2.5,3.0]w.p.=0.2(3.0,∞] w、 p.=0。(14) 如果发生概率为零的实现,最左边和最右边箱子的概率为零,则由于使用日志,显然会对日志分数目标造成问题(最终损失)。零概率实现很少,但偶尔出现在我们的数据中。有时它们会出现在边缘垃圾箱中(例如,∞]), 因为预报员有时无法对这些垃圾箱做出肯定的预测。

23
mingdashike22 在职认证  发表于 2022-4-26 15:33:33
除了边缘仓现象外,一些预报员的直方图过于尖锐,有时他们对最终包含实现的内部仓的概率为零。人们可以通过要求实现落入的调查箱被分配至少一些小概率,比如1%,来解决日志分数“零问题”。我们通过将1%的概率分配给包含实现的料仓来实现这一点,如果它最初被分配为0,那么1%将从最初分配为非零概率的料仓中获得相等的份额。在我们的样本期间,垃圾箱的数量从9个开始,在大衰退期间达到14个的峰值,最终下降到12个。当然,人们可以切换到另一个目标,但对数分数目标很简单,值得欢迎,这就是为什么我们在本文中一直使用它作为我们的理论和蒙特卡洛的主要案例。我们将继续在我们的实证工作中使用它,尽管它是零表3:欧元区通货膨胀正则化混合物的对数分数L#Simplex-1.88 3.52 Simplex+Ridge-1.86 4.99 Simplex+熵-1.87 19最佳4-平均值:-1.87 4最佳≤4-平均-1.90 2.24 ECB/SPF比较最佳-2.02 190%-2.04 170%-2.13中等-2.17最差-2.56 1简单平均-1.98 18注:我们显示了使用20个季度滚动估计窗口每季度进行的欧元区未来1年的通货膨胀密度预测的对数分数。磨合样本为1999Q1-2000Q4,预测评估样本为2001Q1-2019Q3(75个季度)。池中有18个ECB-SPF密度预报员,加上第19个预报员,其预测密度恒定且一致,总共有19个预报员。L是对数分数,#是所选预报员的平均数量。单纯形+岭和单纯形+熵的结果基于事后最优惩罚参数。

24
可人4 在职认证  发表于 2022-4-26 15:33:39
有关详细信息,请参阅文本。5.2经验结果池中有18名ECB-SPF密度预测员。我们还包括一个有效的第19个预测者,其预测密度是恒定且一致的,大致平行于包括一个恒定的点内预测组合回归,总共有19个预测者。按照Granger和Ramanathan(1984)的精神,先做肥皂梨。结果见表3。引人注目的是,每一种规则化的混合预测都优于每一位ECB/SPFinDivis个人预测者(甚至是事后最佳预测者)。要了解改进的规模,请注意最好的≤例如,4-平均值比中值个人预测者的预测能力强约15%,比theex post best个人预测能力强7%。每种规则化的混合物也优于simpleaverage,后者反过来又优于ECB/SPF的预测。表3还显示,正则化后选择的预报员的平均数量是个问题。此外,只要统一预测者得到非零的混合权重,它就限制混合密度在每个柱状图单元上放置正概率,在这种情况下,前面讨论的对数分数“零问题”消失。图3:随时间变化的密度预测混合物,欧元区的情况注:我们显示了以频率多边形表示的密度预测混合物。

25
可人4 在职认证  发表于 2022-4-26 15:33:46
预测是按季度进行的,从1999年第一季度到2019年第三季度。无论采用何种正则化方法,都始终很小。同时,表3中的对数计分和图3底部两个面板中的图表都显示,单纯形和最佳平均正则化混合几乎是相同的,这表明单纯形解有效地降低了除少数预测之外的所有预测,并简单地对幸存者进行平均,产生了非常接近最佳4平均值的结果。单纯形和最佳平均值的良好性能尤其值得注意,因为它们不需要调整。也就是说,非常值得注意的是,单纯形正则化和最佳平均正则化的性能与那些需要选择调整参数(单纯形+岭和单纯形+熵)的正则化一样好,尽管我们在表3中对后者进行了评估,单纯形+熵选择了所有19个预报员,但单纯形+熵必须选择所有19个预报员,因为(ωk)→∞ 作为ωk→0.所有能够只选择少数预测者的正则化实际上只选择少数预测者。严格地说,最佳平均程序需要一些轻微的调整——选择N——尽管我们习惯于总是采用N=4。图4:正则化混合物和简单平均混合物之间的差异,欧元区差异注:我们展示了正则化混合物(单一或最佳)之间差异的热图≤4-平均)和简单平均混合物。红色阴影表示在单纯形或最佳模式中,bin概率增加≤4平均正则化混合,蓝色阴影表示bin概率降低。我们还叠加了欧元区的通货膨胀率。使用事后优化的参数,这在实时上是不可行的。图3值得进一步检查。

26
mingdashike22 在职认证  发表于 2022-4-26 15:33:52
如果其中间和底部面板显示,单一和最佳平均正则化混合物几乎相同,则这些面板与顶部面板的比较还显示:(1)尽管如此,单一/最佳平均正则化与简单平均非常不同,(2)在大衰退开始之前和之后,单一/最佳平均正规化的影响显著不同。在大衰退开始之前,单纯形/最佳平均正则化将概率质量向上移动,相对于简单平均,向更高的方向移动,尤其是从1.0%-1.5%的范围移动到1.5%-2.5%的范围,主要是调整密度预测位置和对称性。然而,在此之后,单纯形/最佳平均正则化将概率从分布的中心扩散到分布的两个尾部,从1.0%-2.5%的范围向外扩散到0.5%以下和3.0%以上,主要是调整密度预测离散度和峰度。正则化效应及其在大衰退开始时的结构变化如图5所示:PIT直方图,欧元区通货膨胀注:我们展示了简单平均值和最佳值的P IT直方图≤4-平均混合物。第一个子样本于2007年第四季度开始,第二个子样本于2008年第一季度开始。我们在P IT下方显示红色的点式二项式置信带~ iid U(0,1)。在图4所示的热图中显示得更加清晰。检查和比较各种混合物的概率积分变换(P It s)是有用的。Diebold等人(1998年)考虑连续情况,其中P IT被定义为P ITt=Ryt-∞pt(u)du,并表明密度预测的正确条件校准简化了它~ iid U(0,1)。Czado等人(2009)将评估框架扩展到离散情况,并表明结果仍然适用于适当的离散IT定义。

27
可人4 在职认证  发表于 2022-4-26 15:34:00
为了评估均匀性,以及与均匀性的任何偏差模式,在图5中,Czado et al.(2009)的weshow直方图中,离散P表示简单平均值和最佳值≤4-平均混合物。P-IT直方图揭示了简单平均混合物的问题,这与我们在图3和图4中对两种状态的讨论相匹配,并且得到了最好的改善≤4-平均正则化。特别是,简单平均P-IT直方图显示两个子样本的一致性存在明显偏差,且偏差的形状非常不同。没有必要显示单纯形P,因为单纯形和最佳≤4-如前所述,平均混合物几乎相同。图6:随时间变化的密度预测混合物,欧元区实际利率注:我们显示了以频率多边形表示的密度预测混合物。预测是按季度进行的,从1999年第一季度到2019年第三季度。在第一个子样本中,简单平均P-IT直方图高度倾斜,如图5的左上面板所示,接近0的概率质量太小,接近1的概率太多,再次表明相对于简单平均密度预测,有太多的大的通货膨胀实现。然而,正如前面所讨论的,正则化会使密度向上移动,从而产生一种改进的(如果仍然不完善的话)密度≤4-如图5左下角的面板所示,取其平均值。在第二个子样本中,简单的平均P-IT直方图更像图5右上面板中显示的U形。在这种情况下,正则化会像前面讨论的那样分散密度,更好地适应尾部实现,并产生最佳效果≤4-如图5右下角的面板所示,取其平均值。最后,在我们之前对ECB/SPF通胀预测进行检查的同时,我们还检查了实际利率密度预测。

28
大多数88 在职认证  发表于 2022-4-26 15:34:06
实际利率密度是一个简单的符号变化和流动密度的位置变化:f(rt,t+1)=it,t+1- f(πt,t+1),(15)其中r表示实际利率,i表示名义利率,π表示通货膨胀。实际利率密度当然是由方程(15)中的流动密度驱动的,但将其转化为借贷的实际成本仍然很有趣。在图6中,我们展示了简单的平均值和最佳值≤4-平均实际利率密度预测,在图7中,我们展示了它们之间的差异,以及实现情况。图7:最佳利率之间的差异≤4-平均混合和简单平均混合,欧元区实际利率注:我们展示了最佳利率之间差异的热图≤4-平均混合物和简单平均混合物。红色阴影表示最佳情况下的概率增加≤4-平均混合,蓝色阴影表示概率降低。我们还叠加了已实现的欧元区实际利率。是的。人们会立即被在大部分样本中分配给负实际利率的高概率所震惊。例如,自大衰退结束以来,P(rt,t+1)<0通常大于1/2,而实际利率通常为负值。尽管如此,我们早期的通货膨胀模式和教训仍然完好无损,因为真实利率密度预测是由通货膨胀密度预测驱动的。根据大衰退的开始,有两种明确的实际利率“正规化制度”。首先,实际利率密度被向下推,因为正如前面所讨论的,正规化会推动通货膨胀密度向上。

29
nandehutu2022 在职认证  发表于 2022-4-26 15:34:13
在第二种情况下,实际利率密度变得更加分散,因为正则化使流动密度更加分散。6结论和未来研究方向我们提出了构建密度预测正则化混合的方法,探索了各种目标和惩罚,我们在实质性探索中使用了这些方法。没有必要显示实际利率的正则化估计结果,因为对数分数与从通货膨胀到由等式(15)定义的实际利率密度预测的转换无关。图6和图7中也不需要包括单工面板,因为单工面板和≤4-平均通货膨胀密度正则化,因此实际利率密度正则化几乎相同。最后,也不需要显示实际利率P IT直方图,因为它们是图5中通货膨胀P IT直方图的精确镜像,如等式(15)所示。欧元区通货膨胀和实际利率调查密度预测。所有个体调查预测者(即使是事后最佳预测者)的表现都优于我们的规则化混合预测。例如,单纯形和最佳平均混合预测的对数分数比事后最佳个体预测者的对数分数高出约7%,比事后中值预测者的对数分数高出15%。在大衰退之前,正规化将通胀密度位置向上转移到更高的通胀,从而将实际利率密度位置向下转移,从而纠正偏差。从大衰退开始,正则化倾向于将概率质量从通货膨胀和实际利率密度预测的中心转移到尾部,纠正过度自信。未来研究的各种途径都是可能的。

30
能者818 在职认证  发表于 2022-4-26 15:34:19
例如,可以使用概率积分变换作为正则化的混合估计目标,最小化t统计量(例如Kolmogorov-Smirnov)的阶数,以检验aniid U(0,1)概率积分变换的联合假设。其次,我们可以扩大我们的方法,以允许非线性混合物,如Takanashi和McCalin(2020)最近的工作,如Jore等人(2010年)所述的灵活时变混合物重量,以及Kapetanios等人(2015年)所述的随密度支持区域变化的混合物重量。最后,虽然我们没有强调在我们的经验工作中需要超参数选择的正则化方法(单纯形+脊线或单纯形+熵),但它们并不代表未来探索的有趣方向。一个明显的问题是可行的实时超参数选择。附录A单纯形+熵正则化估计器的推导单纯形+熵估计器解决了优化问题:ω=arg minω-TXt=1logKXk=1ωkfk,t(yt)!|{z}对数分数+(α- 1)-KXk=1log(ωk)!|{z}熵惩罚(A.1)s.t.ωk∈ (0,1),KXk=1ωk=1。正如我们将要展示的,这是贝叶斯分析中的后验模式,(1)由对数分数给出的对数似然,以及(2)Dirichlet Previor,它将正概率仅放在单位单纯形上,但对于特定的超参数配置,它也向等权收缩。特别是,K维Dirichlet先验由K个超参数控制,当它们相等时,先验平均值为1/K。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 16:32