楼主: kedemingshi
1506 19

[经济学] 用层次分析法预测分类的CPI通货膨胀成分 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-4-24 10:25:24
完整HRNN模型的说明。放大Hierarchylevel 0CPIHeadlineLevel 1能源服装食品等级2男士水果和蔬菜等级3蔬菜水果(标题CPI),πn不存在,因此我们设置了一个平均值和单位方差为零的正常非信息规则化先验。现在让我们通过以下方式表示所有级别的所有系列的聚合:X = {XnTn}n∈I.同样地,我们用θ = {θn}n∈IandT={τn}n∈I所有RNN的聚合X据观察,θ是未观察到的学习变量,由方程(6)确定。超参数α 根据等式(6)通过交叉验证程序设定。方程(5)中,我们提取后验概率:p(θ|X, (T)=p(X |θ, (T)p(θ)P(X)∝"On∈ITn"Ot=1.N(xnt; g(θn, Xnt-1), τ-1.n)"On∈IN(θn; θπn, τ-1.θn一) 。(7) HRNN优化遵循最大后验概率(MAP)方法。也就是说,我们希望找到最佳参数值θ*以便:θ*= 阿格麦克斯θ日志p(θ|X, T) 。(8)(8)g我们选择了工作g成为标量GRU,因为GRU能够长期存储,但参数比LSTM少。因此,每个节点n与具有自身参数的GRU关联:θn= [uzn, urn, uvn, wzn, wrn, wvn, bzn, brn, bvn]. 然后g(θn, Xnt)是由tGRU的连续应用xni用1≤ i ≤ t根据方程式(3)。最后,HRNN优化采用随机梯度上升(8)结构。4.2. HRNN推断过程,它可以应用于在一个称为推断的过程中进行预测。在我们θ*如下所示:给定一系列历史CPI值Xnt对于节点n, 我们预测下一个CPI值ynt+1= g(θn, Xnt), 如第4.1节所述。这种类型的预测是针对下个月的CPI,即地平线h = 0.在这项工作中,我们还测试了模型对未来前景进行预测的能力h ∈ {0, .., 8}.

12
mingdashike22 在职认证  发表于 2022-4-24 10:25:30
这个h-水平预测是以递归的方式获得的,每个预测值ynt有食物吗ynt+1随着时间的推移,精确度逐渐降低h 增加。5.数据集这项工作基于美国劳工和统计局(BLS)发布的月度CPI数据。在接下来的内容中,我们将讨论数据集的特征,我们的预数据在HRNN代码中可用。5.1. 美国消费者价格指数第十个月。这些价格标签来自全美75个城市地区的约2400家零售和服务机构。住房和租金是根据城市人口统计数据从测量中收集的:1。CPI-U代表城市消费者的CPI,大致涵盖这些项目,其权重每年1月更新。2.W类消费物价指数代表城市工薪阶层和文职人员的消费物价指数,涵盖约29%的人口。该指数关注的是收入至少有50%来自文员或带薪工作的家庭,该家庭至少有一部分收入者必须在一年中至少有70%的时间里从事过工作。CPI-W表示福利成本以及未来合同义务的变化。在这项工作中,我们关注CPI-U,因为它通常被认为是1994年1月以来的最佳衡量标准。因此,我们的样本范围为1994年1月至2019年3月。值得注意的是,在过去的几年里,增加了新的指数,并提名了一些指数。因此,等级制度可能会发生变化,这就给我们的锻炼带来了挑战。5.2. CPI等级与0级的总体CPI相当。1级由8个主要综合类别组成,即(5)“医疗保健”、“6”娱乐”、“7”教育和通信”,以及(8)“其他商品和服务”。中级(2-5级)由更具体的聚合组成,如“能源商品”、“家庭保险”等。

13
kedemingshi 在职认证  发表于 2022-4-24 10:25:37
较低级别(6-8)由细粒度指数组成,如“苹果”、“培根及相关产品”,“眼镜和CPI的三个层次结构(0-2级)。5.3.数据准备我们使用了BLS网站上公开的数据。然而,BLS每月在单独的文件中发布归档数据。因此,需要单独的每月文件存储库。此外,这些文件的格式多年来发生了变化(例如,txt、pdf和csv格式都在使用中)为了分析不同时间段的变化格式,我们做了大量工作。分层CPI数据以月度指数值的形式发布。我们将CPI值转换为月度对数变化率,如下所示:我们表示xttt表示为rate(t) 并由以下人员给出:rate(t) = 100×原木xtxt-1.. (9) 变化率如等式(9)所示。我们将数据分为训练数据集和测试数据集,如下所示:对于每个时间序列,我们保留训练数据集的第一个(早期)70%的测量值。以及其他基线。测试数据集用于评估。第6节的结果是基于这种划分的。表1总结了应用方程式(9)后CPI时间序列的数据点数量和一般统计数据。当比较标题CPI和完整的WWW时。bls。gov/CPI表1:描述性统计数据集#平均月平均STD最小值#最大值#。

14
何人来此 在职认证  发表于 2022-4-24 10:25:44
每个指数的测量指标只有303 0.18 0.33-1.93 1.22 1 303水平1 6742 0.17 0.96-18.61 11.32 34 198.29水平2 6879 0.12 1.10-19.60 16.81 46 149.54水平3 7885 0.17 1.31-34.23 16.37 51 121.31水平4 7403 0.08 1.97-35.00 28.17 58 107.89水平5 10809 1.01 1.43-21.04 242.50 92 87.906水平6 7752 0.09-11.49-16.71.51.50-13.45水平1.90-13.90-11.4580.74等级8 595 0.08 1.56-5.27 5.02 7 85.00完整等级52405 0.10 1.75-35.00 242.50 424 123.31注:等级和完整指数等级中每个等级的标题CPI和CPI-U的一般统计数据。在整个期间都可以使用。图5描绘了不同水平的CPI变化率分布的方框图。方框描述了中值以及第75百分位上限和第25百分位下限。胡须表示总的最小和最大速率。图5进一步强调,随着CPI层级的下降,变化率更不稳定。我们可以预期,层级结构中的分类成分预测将比标题更加困难。部门。我们注意到,一些行业(如服装和能源)比其他行业更容易受到高可用性的影响。正如预期的那样,对这些行业的预测将更加困难。6.评价和结果xtt^xtxt基于历史价值。此外,我们用εt当时的估计误差t. 在所有情况下h-地平线预测是通过递归迭代ONE过程生成的。6.1. 基线模型我们将HRNN与以下CPI预测基线进行比较:1。ρ^xtρ如下:^xt= α+'Iρi=1.αixt-i+ εt, 在哪里{αi}ρi=0是模型的参数。图5。每个层级的月度通货膨胀率方框图。0 1 2 3 4 5 6 7层级-1-0.50.00.51.01.5月费率图6。

15
nandehutu2022 在职认证  发表于 2022-4-24 10:25:50
每个部门的月度通货膨胀率方框图。食品和福利运输住房服装服务能源医疗保健部门-3.-2.-101234月费2。菲利普斯曲线(PC)-PC(ρ) 是AR的一个扩展(ρ) 这就是失业率ut每月t在CPI预测模型中,例如:^xt= α+'Iρi=1.αixt-i+ βut-1+ εt, 在哪里{αi}ρi=0和β 是模型的参数。3.ρAR的(ρ). 它经常用于同时对两个或多个时间序列进行建模。变量(ρ)估计下个月的价值k基于历史价值的时间序列ρ^Xt= A+ ('Iρi=1.AiXt-i) + εtXt最后ρ来自k月份的不同时间序列t, ^Xt是模特的{Ai}ρi=0(k × k)εt误差项向量。4、Random Walk(RW)-我们考虑RW(ρ) Atkeson等人(2001)的模型。ρ过去的ρ 月比:^yt=ρ'Iρi=1.xt-i+ εt.5.差距中的自回归(AR-Gap)——AR-Gap模型在预测差距中的波动趋势之前减去了一个波动趋势(Faust and Wright,2013)。流入缺口定义为gt= xt- τt, 哪里τt是当时的通货膨胀趋势吗t代表缓慢变化的局部平均值。该趋势值为RW估算值(ρ) 详情如下:τt=ρ'Iρi=1.xt-i. 通过考虑当地的通货膨胀趋势τt, 该模型试图提高模型的平稳性gt并通过^gt= α+'Iρi=1.αigt-i+ εt, 在哪里{αi}ρi=0是模型的参数。

16
kedemingshi 在职认证  发表于 2022-4-24 10:25:56
最后τt被添加回^gt实现最终通货膨胀预测的预测:^xt=^gt+ τt.6.逻辑平稳过渡自回归模型(LSTAR)——LSTAR是AR的一个扩展,允许根据F(t; c, γ)ρ, c, γρ它描述了数据中的两种趋势(高和低),以及一个将它们联系起来的非线性传递函数:^xt=α+ρ~Oi=1.αixt-i!(1 - F(t; γ, c))+β+ρ~Oi=1.βixt-i!F(t; γ, c)+ εt, (10)F(t; γ, c)=1+e-γ(t-c)cγcρ逻辑函数在0到1之间单调变化t增加和t = c{αi}ρi=0和{βi}ρi=0,而γ, 和c 是超参数。7.随机森林(RF)——RF(ρ) 模型是一种集成学习方法,它建立了一组决策树(Song and Ying,2015),以减少过度配置并提高泛化能力(Breiman,2001)。在预测时,平均ρ最后ρ 样本和输出是下个月的预测值。8.ρ决策树的集合,以类似于其他推进模型的阶段方式进行训练(Schapire,1999)。不像射频(ρ) 平均值是多少ρ之前所有树的剩余误差。在预测时,返回所有树的预测之和。GBT的输入(ρ) 模特是最后一个ρ 样本和输出是下个月的预测值。9.全连接神经网络(FC)——FC(ρ) 该模型是一个完全连接的神经网络,具有一个隐藏层和一个ReLU激活(Ramachandran等人,2017)。输出层采用无激活的方式,以平方损耗优化的方式来描述回归问题。FC的输入(ρ) 模特是最后一个ρ 样本和输出是下个月的预测值。10.深度神经网络(Deep NN)——深度神经网络(ρ) 该模型是一个由10层和100个神经元组成的深层神经网络,如Olson等人所述。

17
可人4 在职认证  发表于 2022-4-24 10:26:02
(2018年),其在预测通货膨胀方面表现良好(Goulet-Coulombe,2020年)。Wefollows:学习率设置为lr = 0.005,训练持续了50个时期(而不是活动函数)。这些变化产生了更准确的预测,因此我们决定将其纳入我们的所有评估中。深度神经网络的输入(ρ)模特是最后一个ρ样本和输出是下个月的预测值。11.与PC类似的失业深度神经网络(深度神经网络+失业)(ρ) 它延伸到了阿尔(ρ) 通过将失业数据包括在内,美国的ρρρ失业率样本ut. 在超参数方面,我们使用了Deep NN中的诱惑值(ρ).6.2. 消融模型旨在证明基于GRU的HRNN分层成分的贡献,而不包括分层成分:1。ρρ作为输入,以预测下一个值。格鲁(ρ), 单个GRU用于定义GRU,但假设CPI的不同组成部分表现相似,且单个单元足以对所有节点建模。2.独立GRU(I-GRU)-在I-GRU中(ρ), 我们训练了不同的GRU(ρ) 每个CPI节点的单位。S-GRU和I-GRU方法代表两个极端:分别对待每个节点。I-GRUs(ρ) 相当于HRNN的一个变体τθn= 0; n ∈ I这是HRNN的一个简单变体,用于训练独立的GRU,一个用于层次结构中的每个新成员。3.针对HRNN的层次结构,我们设计了KNN-GRU(ρ) 基线。不使用层次信息先验的节点。因此,KNN GRU与基本向量GRU的关系如下:首先k使用Pearson相关测度找到每个HCPI节点的最近邻。然后,分离因子GRU(ρ) 针对每个CPI汇总,对各单位进行了培训k大多数相似的节点使用最后一个ρ节点的值n以及它的k-最近的节点。通过这样做ρ来自相关节点的相关信息。6.3.

18
kedemingshi 在职认证  发表于 2022-4-24 10:26:09
评估指标继Faust and Wright(2013)和Aparicio and Bertolotto(2020)之后,我们报告了三个评估指标的结果:1。均方根误差(RMSE)-RMSE由以下公式得出:RMSE =vutTT~Ot=1(xt-^xt), (11)xtt^xt预言。2.皮尔逊相关系数-皮尔逊相关系数φ吉文比:φ =COV(XT,^XT)σX× σ^X, (12) 在哪里COV(XT,^XT)是一系列实际值和预测值之间的协方差,以及σXT和σ^XT分别是实际值和预测值的标准偏差。3.距离相关性度量可以检测两个随机变量之间的线性关联,也可以检测非线性关联(Székely等人,2007年;周,2012年)。距离相关系数rd由以下公式给出:rd=dCov(XT,^XT)qdVar(XT) ×dVar(^)XT), (13) dCov(XT,^XT)还有预测,还有DVAR(XT)安德瓦尔(^)XT)分别是实际值和预测值的距离方差。6.4. 结果改变CPI等级,以便在较低水平上进行预测。因此,我们提供了8种不同的层次结构。

19
可人4 在职认证  发表于 2022-4-24 10:26:16
为了完成,我们还提供了我们不期望其表现优于的结果。表二:平均结果统计数字分类消费物价指数统计数字分类消费物价指数统计数字平均结果统计数字统计数字统计数字统计数字统计数字统计数字平均结果统计数字平均结果统计数字统计数字平均结果表二(表二)平均结果(表二)平均结果(表二)平均结果分类消费物价指数各分类消费物价指数指数各组成部分的平均结果(表)平均数字模型模型(模型)每每每每每每每一水平的模型建模建模每每每每每每一水平的水平相关数字(1)名称AR(1)=(1)1.00(1)1)1)=1)1.00(在水平(1)0)0 0)0 1)0 1 1 1 1)0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 1.00 1.001.00 1.00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1.04LSTAR(ρ = 4.c = 2.γ = 1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0 0.0 0 0.0.0 0.0 0.0.0 0.0.0 0 0 0.0.0 0.0 0 0.0 0 0.0 0 0.0 0.0 0 0 0.0 0.0 0 0 0.0.0.0 0.0.0 0.0.0 0 0.0 0 0 0 0 0.0 0 0 0 0 0 0 0 1.07 1.04 1.12 0.10 0.08I-GRU(4)0.83 0.84 0.85 0.85 0.86 0.89 0.17 0.13KNN-GRU(1)0.90 0.0.0 0.0.0.0.0.0.0.0.0.0.0.0.9 0.0.9 0.9 0.9 0.0.9 0.0.9 0.0.0.0 0.0.0 0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.9 0.0.9 0.9 0.0.9 0.0.9 0.0.9 0.0.0.0.9 0.0.0.9 0.0.0.0.0.0.9 0.0.0.0.0.0.0.9 0.0.0.0.0.0.0.0.0 0.0.0.0.0.0.0.0.0.0.0.0 0 0 0 0.0.0 0 0.0.0 0 0 0 0 0 0 0 0 0.0.0.15 0.80 0.81 0.81 0.81 0.23 0.30HRNN(4)0.78 0.78 0.79 0.79 0.79 0.80 0.24 0.29注:平均值构成总体CPI的所有424个通货膨胀指数的结果。RMSE结果与AR(1) 并根据其结果进行归一化,即:。,RMSEModelRMSEAR().

20
可人4 在职认证  发表于 2022-4-24 10:26:23
根据Diebold-Mariano检验,结果具有统计学意义p < 0.02.表2描述了CPI层次结构中所有分类指数的平均结果。我们给出了0、1、2、3、4和8个月的预测结果。其结果与AR(1) 模型和标准化依据:RMSEMode lRMSEAR(). 在里面α = 1.5ρk = 5.任何情况下的替代方案。值得注意的是,HRNN优于I-GRU,I-GRU强调了使用分层信息的重要性和HRNN超规则GRU的优势。此外,在CPI层次结构上,HRNN也优于不同的KNN。根据Diebold和Mariano(1995)的成对测试,这些结果在统计学上具有显著性,p值低于0。2

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 07:05