楼主: 大多数88
1587 18

[经济学] 贝叶斯结构时间序列模型的发展趋势 生长 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

68%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
62.9698
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23514 点
帖子
3880
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
摘要翻译:
本文通过Scott和Varian(2014)的混合频率增广贝叶斯结构时间序列模型(BSTS)研究了Google Trends形式的互联网搜索数据对实时预测美国实际GDP增长的额外好处。我们表明,在其他宏数据在季度早期可用之前,一个大维度的搜索词集能够改善nowcasts。高收录概率的搜索词与GDP增长呈负相关,我们认为这源于它们发出的信号,可能是由于预期的大低谷而引起的特别关注。我们进一步提出了几个改进:我们允许收缩状态方差为零以避免过拟合状态,扩展SSVS先于Ishwaran等人的更灵活的正态逆伽马先验。(2005)对底层模型的大小保持不可知,并适应Carvalho等人的马蹄形先验。(2010)到BSTS。应用于GDP增长临近预报的仿真研究表明,马蹄形先验BSTS模型比SSVS模型和原始BSTS模型有明显的改进,在密集数据生成过程中预期收益最大。
---
英文标题:
《Developments on the Bayesian Structural Time Series Model: Trending
  Growth》
---
作者:
David Kohns, Arnab Bhattacharjee
---
最新提交年份:
2020
---
分类信息:

一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--
一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--

---
英文摘要:
  This paper investigates the added benefit of internet search data in the form of Google Trends for nowcasting real U.S. GDP growth in real time through the lens of the mixed frequency augmented Bayesian Structural Time Series model (BSTS) of Scott and Varian (2014). We show that a large dimensional set of search terms are able to improve nowcasts before other macro data becomes available early on the quarter. Search terms with high inclusion probability have negative correlation with GDP growth, which we reason to stem from them signalling special attention likely due to expected large troughs. We further offer several improvements on the priors: we allow to shrink state variances to zero to avoid overfitting states, extend the SSVS prior to the more flexible normal-inverse-gamma prior of Ishwaran et al. (2005) which stays agnostic about the underlying model size, as well as adapt the horseshoe prior of Carvalho et al. (2010) to the BSTS. The application to nowcasting GDP growth as well as a simulation study show that the horseshoe prior BSTS improves markedly over the SSVS and the original BSTS model, with largest gains to be expected in dense data-generating-processes.
---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:时间序列模型 时间序列 发展趋势 贝叶斯 econometrics

沙发
何人来此 在职认证  发表于 2022-4-16 11:10:27 |只看作者 |坛友微信交流群
贝叶斯结构时间序列模型的发展:趋势增长*David Kohnsé经济系,Heriot-Watt UniversityandArnab BhattacharjeeDepartment of Economics,Heriot-Watt University,2020年11月3日本文通过Scott and Varian(2014)的混合频率增强贝叶斯结构时间序列模型(BSTS)的镜头,研究了GoogleTrends形式的互联网搜索数据对实时预测美国实际GDP增长的额外好处。我们表明,在其他宏数据在季度早期可用之前,一个大维度的搜索词集能够改善nowcastss。高收录概率的搜索词与GDP增长呈负相关,我们认为这可能是由于预期的大低谷而引起的特别关注。在此基础上我们进一步改进了ER:允许将状态方差缩小到零以避免对状态进行修正,在Ishwaran等人的正态逆伽马先验之前扩展了SSVS。(2005)对潜在的模型大小保持不可知,同时调整了Carvalho等人的马蹄先验。(2010)到BSTS。对GDP增长模型的应用和模拟研究表明,马蹄形先验BSTSIMI显著优于SSVS模型和原始BSTS模型,关键字:全局-局部先验、非中心状态空间、收缩、谷歌趋势*作者要感谢Arnab Bhattacharjee、Mark Scha halter、Atanas Christev、Aubrey Poon、Gary Koop和苏格兰经济学研究生课程会议的所有与会者提供了宝贵的反馈。电子邮件:dek1@hw.ac.uk1介绍临近预报模型的目标是利用解释性数据集的实时数据发布时间表,对目标变量进行“早期”预测。临近预报对中央银行和其他政策环境尤其相关,他们的任务是根据国内生产总值或国际收支等关键经济变量实施前瞻性政策。这些,然而,相对于它们的参考周期,发布的滞后时间长达7周。因为即使是每月的宏观数据也有相当大的滞后,除了传统的宏观经济数据之外,现在很常见的是将更多来自大数据源的信息结合起来,如互联网搜索词、卫星数据、扫描仪数据等(Bok et al.,2018),这些信息具有近实时可用的优势。因此,越来越多的文献研究了使用谷歌趋势(GT)形式的谷歌搜索数据来预测经济时间序列的效用,谷歌趋势衡量进入谷歌搜索引擎的某些搜索词的相对搜索量。大多数应用研究了基于GT的nowcasts相对于简单的自回归过程和调查指标的改进。后一种比较似乎很自然,因为搜索词volumecan被视为对产品供求的调查以及观点和情绪的表达(Scott and Varian,2014)。特别是,文献建立了预测不到英国住房市场(McLaren and Shanbhogue,2011)、英国、以色列和德国失业相关数据(Askitas and Zimmermann,2009;Suhoy et al.,2009)、美国私人消费(Vosen and Schmidt,2011)和价格预期(Guzman,2011;D\'Amuri and Marcucci,2017)的改进。这些研究和相关研究的一个共同点是,搜索词具有预测能力,尤其是当它们与需求/供给决策和偏好信号直接相关时(Niesert et al.,2020),比如失业数据,互联网搜索引擎提供了求职者寻找工作的主导漏斗(Smith,2016)。虽然从理论角度来看,互联网搜索与总体经济行为的联系不太清楚,但越来越多的研究报告称,Google Trends甚至在预测这方面有用。

使用道具

藤椅
何人来此 在职认证  发表于 2022-4-16 11:10:34 |只看作者 |坛友微信交流群
D\'Amuri和Marcucci(2017)表明,与“工作”相关的精心挑选的搜索类别有助于预测美国的头条失业率,Choi和Varian(2012)以及Niesert等人都对此进行了预测。(2020)谁以更自动的方式选择谷歌趋势,通过国内生产总值和计算出版物的确切滞后,也取决于计量经济学家希望预测哪一种年份的数据。由于早期年份的总量如GDP可以显示年份之间的实质性差异,这不是一个简单的问题。尼塞特等人。(2020)将这一结果也扩展到其他国家,Koopand Onorante(2019)全面表明,Google Trends改善了一系列月度宏观变量的现况,并警告说,这些改善在很大程度上取决于调查的时间段和变量。与Choi和Varian(2012)相似,Koop andOnorante(2019)认为谷歌趋势在预测数据的转折点和大低谷方面表现尤其出色。对此进行筛选的工作假设是,与感兴趣的宏观变量相关的谷歌趋势获得了一种形式的“集体智慧”,这种“集体智慧”不需要表示积极或消极的关系,但捕捉到了可能与转折点相关的注意力。我们调查了季度宏观经济数据,即GDP增长是否成立。虽然费拉拉和西莫尼(2019)表明,在更传统的宏观经济信息到来之前,谷歌趋势改善了欧元区季度增长的现况,但据我们所知,没有研究考虑使用谷歌趋势来预测美国GDP增长。作为一个有趣的例子,offigure(9)绘制了美国年化实际GDP增长和季度搜索词“实际GDP增长”的末尾。图1:美国年化实际GDP增长(蓝色)和deseasonalisedGoogle趋势搜索词“实际GDP增长”(橙色)的时间序列图。人们可以清楚地看到该搜索词是如何逆周期演变的,最受欢迎的是在金融危机前后。按理说,像“实际gdp增长”这样的搜索词最受欢迎的时候,它们与经济信息相关,吸引了特别的注意力,这可能是当它们出人意料地高或低时。类似的推理导致了更多关于分析文本信息和经济活动之间联系的文献(Gentzkow等人,2019年;Alexopoulos和Cohen,2015年;Baker等人,2016年;Manela andMoreira,2017年;Shapiro等人,2020年)。鉴于与传统的宏观数据相比,Google Trends的发布滞后时间要短得多,潜在的改进可能是实质性的。我们通过调查Google Trends在预测美国实际GDP增长方面的大量改进是否超越了moreRecoverly仅使用月度宏观信息来为这篇文献做出贡献。尽管概念上简单,但使用GoogleTrends等高频大数据源预测季度宏观数据会带来多重计量经济学和数据挑战。后者将在第(2)节中进一步描述。主要的计量经济学挑战涉及抽样频率的不匹配、数据发布的不同步(边缘参差不齐)、模型参数的时变和正则化的形式。虽然关于混合频率临近预报模型的文献(参见如Ba\'nbura et al.(2013))提出了多种方法,但我们的兴趣在于使用Scott和Varian(2014)流行的贝叶斯结构时间序列模型(BSTS),因为它不仅具有直观的吸引力,而且能够解决上述所有计量经济学问题,并在几个方面对其进行改进。

使用道具

板凳
可人4 在职认证  发表于 2022-4-16 11:10:40 |只看作者 |坛友微信交流群
为搭建舞台,该模型的基本思想是结合一个未观察到的组件模型来捕捉长期趋势和季节性,它可以看作是Harvey(2006)提出的时间序列的结构部分,在捕获“不规则”运动之前的尖峰和板状收缩用相当大的大维回归集:yt=τt+xtβ+δt+t,téN(0,σy)τt=μt-1+αt+τt,τt=N(0,στ)αt=αt-1+αt,αt=N(0,σα)δt=-s-1xs=1δt-s+δt,δt=N(0,σδ)(1)来解释。在(1)中,数据中的任何持久性通过一个潜在的时变斜率τt来建模,其中漂移αt是Harvey(1990)最初提出的局部线性趋势模型,并用季节变化模型来模拟。被S的季节成分所捕获。局部线性趋势模型具有直观的吸引力,即对τt的偏离描述了对适用于GDP水平的长期趋势的偏离,可以解释为产出缺口(Watson,1986;Grant and Chan,2017)。这一趋势的第二个层次αt,因此允许产出缺口的随机变化,当满足yt时,产出缺口的随机变化导致GDP增长遵循单位根过程(Clark,1987)。虽然假设GDP增长可以不受约束地漂移,仍然是经济学中的一个争议话题,但越来越多的证据表明,美国GDP增长经历了多重结构性突破(Kimand Nelson,1999;McConnell and Perez-Quiros,2000;Jurado et al.,2015)。Antolin-Diaz等人(2017)令人信服地分析认为,允许GDP增长的平稳转移是过度确定性的结构突破的首选,尤其是当状态方差受到先验的严格控制,这样随机趋势就不会过于疯狂地游荡时。事实上,Antolin-Diaz等人(2017)表明,通过对长期增长的时间变化进行建模,而不是通过例如Hodric-Prescott fireglter对其进行筛选,现在的GDP增长显著改善。由于GDP增长的局部线性趋势没有太多的理论基础,我们的改进点是将状态空间方法(1)推广到一个非中心的公式,该公式对潜在的状态方差进行了积极的正则化,以防止过度调整。我们使用一个在零上具有正概率的先验,重要的是,它允许正式地检验零后验方差的最小值(Fréuhwirth-Schnatter and Wagner,2010),因此,whethera状态是常数或时变的。由于边界测试的问题,这在频率估计模型(1)的方法中是不可能的。我们的第二个改进涉及SSVS先验。在Scott和Varian(2014)的originalBSTS模型中提出的SSVS priver是在一个预期的模型尺寸参数的假设下制定的。正如Giannone等人所示。(2017)然而,模型大小的后验分布以及由此导致的模型中的稀疏程度可能会被先验地修改模型大小参数所过度影响。因此,他们提倡一种“不可知论”的先验,允许数据确定哪一个模型大小是我们扩展到BSTS模型的首选。虽然尖峰和平板先验被广泛认为是贝叶斯变量选择和模型平均的黄金标准,但它们的离散化表示出现了计算瓶颈,在非常大的维度设置中很快变得不可行(George and McCulloch,1993)。此外,尖峰和板条先验与相关数据进行斗争,因为相关性导致多模态后验,从而导致不良混合(Piironen et al.,2017)。而Niesert等人。(2020)通过哈密顿蒙特卡罗改进了混合,我们的第三个方法贡献是进一步将BSTS框架扩展到更现代的全球-局部先验,这些先验具有连续收缩。

使用道具

报纸
mingdashike22 在职认证  发表于 2022-4-16 11:10:46 |只看作者 |坛友微信交流群
全局-局部先验,如马蹄形先验(Carvalho et al.,2010)和Dirichlet-Laplace先验(Bhattacharya et al.,2016)不仅提供了比尖峰和板条先验更好的解算优势,而且也提供了更有利的渐近性,因为这得到了Sims(2012)的证明,他们认为建模时变比消除优先级更好。嗯(Bhadra et al.,2019)。本文主要讨论马蹄先验,但附录A.1中提供的采样算法可以用于任何可以表示为法线amixture的先验。最后,尽管全局-局部先验将噪声变量缩小到接近于零,但如果没有任何进一步的稀疏假设,回归后验可能很难解释。为了弥合这一差距,我们将Ray和Bhattacharya(2018)提供的方案改编为马蹄先验增强BSTS模型。SAVS算法将后验回归估计分为信号和噪声,其中后者的阈值为零。我们在迭代的基础上应用SAVS算法,可以解释类似于贝叶斯模型平均后验的后验回归(Huber et al.,2019)的后验回归。我们的临近预报应用程序的结果显示,谷歌的搜索指数在季度早期改善了nowcasts,马蹄先验BSTS表现最好,在点和indensity nowcasts方面比Scott and Varian(2014)的原始BSTS模型的精确度提高了30-40%。这些结果在一项模拟研究中得到了验证,该研究对各种数据生成过程进行了检验。在接下来的研究中,我们将详细阐述用于临近预报的数据,如何处理混合频率和数据发布日历。其次,我们详细介绍了扩展BSTS模型的后验结果,并给出了E?Cient采样算法。然后,我们给出了基于我们对美国GDP增长的经验应用的结果,以及来自我们模拟的结果。2数据2.1混合频率本文以Giannone等人的月度宏观数据为基础进行了关联。(2016年)和通过U-MIDAS的互联网搜索信息跳过了对美国实际季度国内生产总值增长的抽样。混合频率的UMIDAS方法属于更广泛的“部分系统”模型(Ba\'nbura et al.,2013),它通过垂直重新调整协变量向量直接将较高频率信息与较低频率目标变量联系起来。从mequation(1)转换符号,以明确以较高频率即月频率采样的xtis表示xt,M=(x1,t,M,···,xK,t,M)和βM=(β1,M,···,βK,M),其中M=(1,2,3)表示四分之一t内协变量的月观测。通过将每个月列串联起来,我们得到了一个T×K~3回归矩阵X和一个K~3×1回归向量β。这种垂直调整可视化为一个单一的代表性回归:Y1 stquarter xMarxF ebxJany2ndquarter xjunxmayxapr。...........(2)2.2宏观数据美国国内生产总值的早期数据年份与历史年份相比可能会有很大的变化(Croushore,2006;Sims,2002),在评估现在的模型历史数据时使用哪些数据并不是一件小事。通过改变数据测量的数据或方法,可能会产生进一步的并发症(Carriero et al.,2015)。然而,在我们的应用程序中,只有少数解释变量记录了实时年份(参见Giannone et al.(2016)),我们的训练窗口仅限于从2004年开始(因为这是Google Trends数据库的最早数据点),我们决定使用我们数据的初始年份。因此,我们考虑了伪实时数据集:我们使用最新版本的数据,但是,在预测的每个时间点,我们只使用截至该时间点发布的数据。本应用程序的目标变量是deseasonalised U.S.

使用道具

地板
nandehutu2022 在职认证  发表于 2022-4-16 11:10:52 |只看作者 |坛友微信交流群
从弗雷德网站下载的实际GDP增长(GDPgrowth)。我们发现,与在我们的状态空间系统中建模相比,预去测数据提高了预测精度。这可能是由于样本量小。由于Google Trends仅在01/01/2004-01/06/2019期间提供,在下载时,调查期间与季度(60季度)的同期有关。我们将数据集拆分为45个季度(2004Q2-2015Q2)的训练样本和15个季度(2015Q3-2019Q1)的预测样本。宏观数据集属于Giannone et al.(2016)数据库的更新版本(从现在开始,“宏观数据”)包含13个时间序列,专业和机构预测者密切关注这些时间序列,如实际指标(工业生产,房屋开工、建筑总支出等)、价格数据(CPI、PPI、PCE)、市场数据(BAA-AAA价差)和信贷、劳动力和经济不确定性度量(商业贷款总量、平民失业率、经济不确定性指数等)表(1)概述了所有数据以及弗雷德代码。deseasonalisation在这里适用于X-13-ARIMA方法,并在从弗雷德-医学博士网站下载之前执行。2.3谷歌趋势谷歌趋势(GT)是谷歌根据给定搜索词或预先指定的搜索类别的相对搜索词受欢迎程度生成的指数,条件是给定的时间框架和位置。我们的样本包括27个谷歌趋势(C语言概述),这些趋势是基于Koop和Onorante(2019)和Bock(2018)中的根术语方法学而选择的。总的来说,对于如何最优地选择搜索项进行估计还没有达成共识。在以前的文献中提出的方法有:(i)通过Google Correlate发现的与目标变量的相关性进行预筛选(Scott and Varian,2014;Niesert et al.,2020;Choi and Varian,2012),(ii)通过交叉验证(Ferrara and Simoni,2019),(iii)使用事先的经济直觉,通过后向归纳法选择搜索词(例如:Smith(2016);埃特里奇等人。(2005年);Askitas和Zimmermann(2009)),和(iv)根词,类似地通过反向归纳指定搜索词列表,但额外从谷歌界面下载“建议的”搜索词。这有助于以半自动的方式扩大搜索词的语义多样性。正如基于纯相关性的方法并不排除虚假关系(Scott和Varian,2014;Niesertet al,2020年;Ferrara and Simoni,2019),我们选择了根术语方法论,因为从作者的角度来看,它目前为了解与经济相关的谷歌趋势提供了最好的保证。同样重要的是要注意,在选择过程中,搜索词不会基于预期的性能而被删除,而是它们与GDP无关。由于搜索词可以显示季节性,我们根据Scott and Varian(2014)的建议,通过R、R中的“STL”命令来实现,通过黄土过滤器来消除所有谷歌趋势,并确保它们各自是平稳的,以避免任何虚假的相关性。最后,我们的伪实时日历可以在表1中找到,并且是在数据的实际发布时间表之后构建的。它总共包含31个vintage,对于v=1,···,31,这些vintages构成了不相等数量的信息集ΩVT,这些信息集用于构建第4节中解释的nowcasts。为了让谷歌趋势搜索索引代表给定月份内的最新信息,我们将它们视为仅在给定月份结束时可以观察到的信息。不幸的是,谷歌关联已经暂停更新他们的数据库,超过2017年。为了减轻因抽样错误而产生的任何不准确性,我们在01/07-08/07/2019年之间下载了谷歌趋势七分集,并取了横截面平均值。

使用道具

7
何人来此 在职认证  发表于 2022-4-16 11:10:58 |只看作者 |坛友微信交流群
由于我们使用了相同的IP地址和谷歌邮件帐户,可能仍然存在一些未说明的测量误差,这可能会进一步减轻Vintage定时发布变量名pub。延迟转换FRED Code0第一个月的第一天没有可用的信息---第一个月的最后一天。基金利率和信用利差fedfunds&baa M3 fedfunds&BAAY102月1日最后一天,Google Trends M4 3第一巴士。第二个月的一天经济政策不确定性指数不确定性m-1 1使用情况XM4第二个月的第一个星期五就业情况时间和解冻m-1 2 AWHNONAG和解冻5第二个月的中旬CPI CPI m-1 2 CPI6第二个月的15-17日工业生产indpro m-1 2 indpro 7第二个月的第三周信贷和M2贷款和M2 m-1 2贷款和M28第二个月的晚些时候住房开工住房m-1 1 HOUST9第二个月的上周PCE和PCEPI PCE和pce2 m-1 2 PCE和pce2 m-1 2 PCE和PCE10最后一天第二个月喂食。基金利率和信用利差fedfunds和baa M3 fedfunds和BAAY1011月2最后一天Google Trends M4 12 1巴士。本月3日经济政策不确定性指数不确定性m-1 1使用PUINDXM13 1巴士。第3个月第1天开工建设m-2 1 TTLCONS14第3个月第1个星期五就业情况时间和解冻m-1 2 AWHNONAG和UNRATE15第3个月中CPI CPI m-1 2 CPI16第3个月第15-17日工业生产indpro m-1 2 INDPRO17第3个月第3周信贷&M2贷款&M2 m-1 2贷款&M218第3个月晚些时候住房开工住房m-1 1 HOUST19第3个月上周PCE和PCEPI PCE和pce2 m-1 2 PCE和PCE20第3个月最后一天美联储。基金利率和信用利差fedfunds&baa M3 fedfunds&BAAY1021月3日最后一天,Google Trends M4 22 1巴士。本月4日经济政策不确定性指数不确定性m-1 1使用PUINDXM23 1巴士。第4个月第1天开工建设m-2 1 TTLCONS24第4个月第1个星期五就业情况时间和解冻m-1 2 AWHNONAG和UNRATE25第4个月中旬CPI CPI m-1 2 CPI26第4个月第15-17日工业生产indpro m-1 2 INDPRO27第4个月第3周信贷和M2贷款&M2 m-1 2贷款&M228第4个月第4个月第1周住房开工m-1 1 HOUST29第4个月第1周PCE和PCEPI PCE和pce2 m-1 2 PCE和pce2 m-1 2 PCE和PCEPI30第5个月第5个月第3周Houst Start Houst m-2 1 HoustTable1:基于实际发布日期的伪实时日历。转化:1=月变化,2=月生长率,3=无变化,4=黄土分解。3方法3.1非中心状态空间Scott和Varian(2014)的原始状态空间公式收集状态τt、αt和δtin(1),并通过Durbin和Koopman(2002)的前向反向抽样(FFBS)算法联合估计它们,该算法基于Kalman farrifiglter。虽然该算法非常流行,但其结构在计算方面代价高昂,但更重要的是,它依赖于独立的正态-逆伽马(N-IG)先验值来确定状态和状态变量,Früuhwirth-Schnatter和Wagner(2010)表明,这可能导致过度利用状态空间,从而导致不精确的预测。这是由于在状态空间模型中,状态变量决定了状态过程是固定的还是时变的(见等式(1))。相反,Fréuhwirth-Schnatter和Wagner(2010)提出了状态空间的非中心表示,它将动力学分解为非时变和时变分量,前者直接在观测方程中建模状态标准差。一个正常的先验状态标准偏差可以被显示为暗示一个伽马先验状态变量,这允许更多的质量在0上,因此应用更多的收缩。

使用道具

8
nandehutu2022 在职认证  发表于 2022-4-16 11:11:04 |只看作者 |坛友微信交流群
将(1)作为我们的中心状态空间(现在忽略X),我们将其等效地重写为:yt=τ+στ~τT+Tα+σαTXS=1~αT+T,t'AN(0,σ)(3),其中~τT=~τT-1+~uτT,~uτT'AN(0,1)~αT=~αT-1+~uαT,~uαT'AN(0,1)(4)起始值~τ=~α=0。为了看出(3)和(4)与(1)是等价的,让:αt=α+σα~αtτt=τ+στ~τt+Tα+σαtxs=1αs(5)通过使用网络爬行。或者,可以使用桥接方法,如Ferrara和Simoni(2019),他们每周更新每月的GTindexs。因此,通过设置yt=τt+t,很明显,αt-αt-1=σα(~αt-~αt-1)=σα+~uαtτt-τt-1=α+σα~αt+στ(~τt-~τt-1)=α+στ+~uτt(6)恢复(1)。由于σα,α在实线上允许有支撑,它们在与状态的乘法中就不存在了:似然性对σα和στ的符号变化是不变的。因此,后验状态标准差的混合可能是糟糕的,它们的分布可能是双模态(Fréuhwirth-Schnatter and Wagner,2010)。这个问题是由吉布斯采样器中随机排列的标志所解决的,如下所述。与Fréuhwirth-Schnatter和Wagner(2010)相似,我们假设σi:σi'AN(0,Vi)→i∈{τ,α}的正态先验以0为中心。收集θ=(τ,α,στ,σα)中的所有状态空间参数,我们假设一个独立的多元正态先验,其对角协方差:θN(θ,vθ)(7)。当状态过程{~τ,~α}tt=1可以用任何状态空间算法估计时,我们选择附录(A.2.1)中Chan(2017)的精确采样方法。3.2在Scott and Varian(2014)的BSTS模型中,SSVS优先变量的选择是通过一个两分量共轭尖峰-板条先验来完成的,该先验利用了Zeller的G-先验的一个变体和已知的预期模型大小。虽然由于共轭假设而计算速度快,但许多高维问题从先前的独立性(Moran et al.,2018)和一个完全分层的公式中受益,以让数据决定参数的最可能值(Ishwaran et al.,2005)。因此,我们跟随Ishwaran等人。(2005)对SSVS先验的推广,得到了正态逆γ先验:βjγj,δjΩγjn(0,δj)+(1-γj)N(0,c×δj)δjΩγma(A.a)γjΩBernoulli(π)ππBeta(b,b)(8),其中j∈(1,···,K)。与斯科特和瓦里安(2014)的尖峰优先相比,直觉仍然是一样的,因为Coavariate的e-ect是由一种混合的法线建模的,其中一个itis要么通过一个零附近的狭窄分布收缩到接近零,尖峰分量,尽管一个相对独立的使用正态分布,但自由调整,平板分量。在最初的BSTS模型中,指标变量γj依赖于一个规定的先验π,该先验π支配着一个变量的先验包含概率,(8)允许通过另一个层次的数据来估计它,而超参数c被选择为一个非常小的数,从而迫使噪声变量的收缩接近于零,而在最初的BSTS模型中,指标变量γj依赖于一个规定的先验π,该先验π控制着一个变量的先验包含概率。我们设置B=B=1,它有选择性地假设任何预期的模型大小都是先验可能的,因此允许稀疏但也允许稠密的模型解(Giannone et al.,2017)。最后,也允许先验方差δJIS是分层的。后肢是标准的,在附录(A.1)中描述。γJIS的后验对分析人员特别感兴趣,因为它给出了一个变量重要性的数据信息度量。

使用道具

9
mingdashike22 在职认证  发表于 2022-4-16 11:11:10 |只看作者 |坛友微信交流群
即,p(γy)可以解释为一个变量的后验包含概率。3.3马蹄先于马蹄先于马蹄,像许多最近流行的收缩先验一样,属于全局-局部先验的广义类,其一般形式如下:βjλj,v,σN(0,λjσ),j∈(1,···,K)λjπ(λj)dλj,j∈(1,···,K)ππ(Ⅴ)d'A(9)。这类先验的思想是全局尺度控制应用于回归的整体收缩,而局部尺度λj允许当回归子在响应上有较大的e值时,回归子逃脱的局部可能性。已经提出了各种全球性的局部收缩理论(参见Polson和Scott(2010)),但在这里我们可以说集中在最流行的,Carvalho等人的马蹄先验上。(2010)采用两个半Cauchydribute:λjíc+(0,1)'Aíc+(0,1)(10)进一步表明,这两个胖尾先验值意味着收缩率先验值在其极限处具有picke-and-slab先验值,因此可以连续逼近SSVS(Piironen et al.,2017)。由于它与频率收缩先验的特殊联系(Polsonand Scott,2010),可以表明它不仅具有良好的样本性能,而且与竞争的全球先验相比具有良好的渐近行为(Bhadra et al.,2019)。3.4 SAVS算法虽然马蹄形先验将把噪声变量缩小到接近于零,但从该先验的后验总和统计中可能无法立即清楚地看出可变性对现在演算的重要性,尤其是当后验是多模态时。为了帮助解释性,同时保持预测能力,我们采用Ray和Bhattacharya(2018)的SAVS算法对后验COE进行逐次抽取。该算法使用了一种受频率学家拉索估计启发的实用启发式来阈值后验回归coe-cientsto零:φj=符号(βj)xj-2max(βjxj-κj,0),(11)其中Xj=(xj1,···,xjT)是回归矩阵X的jthcolumn,符号(X)返回X的符号,β表示回归后验的一个平方。参数κJin(11)作为每个COE的阈值,类似于lasso回归中的惩罚参数,可以通过交叉验证来确定。Ray和Bhattacharya(2018)提出了一个更简单的解决方案,κJ=βJ,(12),它将给定的coe-cient按比例成平方排列,并提供了与替代惩罚水平相当的良好性能(Ray和Bhattacharya,2018;Huber et al.,2019)。为了看出与套索式正则的相似性,(11)的解可以通过以下最小化问题得到,这让人想起邹(2006):φ=Argminφxβ-xφ+kxj=1κjφj(13)φ是稀疏回归向量。后向量中非零条目的相对频率可以类似于SSVS后向量,被解释为后向包含概率。并且对参数的不确定性进行积分以获得预测分布p(~yy),我们得到类似于贝叶斯模型平均(BMA)后验(Koop和Onorante,2019)的东西。3.5采样算法手头有条件后验(见a.1),我们用以下吉布斯采样器采样状态和回归参数:1。样本(~τ,~αy,θ,β,σy)2。样本(θy,β,~τ,~α,σy)3。随机排列(~τ,~α)和(στ,σα)4的符号。样本(βy,θ,~τ,~α,σy)5。样本(σyy,~τ,~α,σy)如3.1中所述,以非递归方式对状态进行采样,该方式利用稀疏矩阵计算和精确采样。精确的采样算法在(A.2.1)中给出。在步骤2中采样θ之后,我们随机排列(~τ,~α),(στ,σα)的符号,如3.1中提到的,以帮助混合。

使用道具

10
大多数88 在职认证  发表于 2022-4-16 11:11:18 |只看作者 |坛友微信交流群
采样器的第4步将依赖于先验及其相应的超先验。虽然SSVS的后验采样方案是标准的,但我们使用Bhattacharya等人的E-cient后验采样器。(2016)对Horseshoeprior的回归COE进行采样。与用于SSVS的基于Cholesky的采样相比,计算速度显著提高(见(A.1.1))。请注意,在步骤4中,我们在迭代的基础上通过(11)执行SAVS稀疏化。4临近美国实际GDP增长,用于生成样本内和样本外预测的预测模型是:yt=τ+σt~τt+tα+σαtxs=1~αt+xtβ+,t'AN(0,σy)~τt=~τt-1+uαt,uτt=N(0,1)~αt=~αt-1+uαt,uαtèN(0,1)~αt=~αt-1+uαt,uαtèN(0,1)(14),其中t=(1,···,t)用作训练样本。我们估计了(14)基于先验(8,10,11)的三个变体,Scott和Varian(2014)的原始BSTS模型以及simpleAR(2)模型进行比较。作为BSTS应用的标准,我们对作为状态空间副产物产生的insample累积绝对超前一步预测误差以及变量的包含概率进行了比较,以揭示哪些变量驱动了预测。从生长观测yT+1的后验预测分布p(yT+1ΩVT)生成样本外的nowcasts,条件是实时信息集ΩVT,其中(v=1,···,31)指伪实时日历(1)内的年份。这导致了31个di-erent nowscats,这些nowscats是在滚动的基础上产生的,直到预测样本结束,倾向。在vintage v被归零之前尚未公布的变量是Carriero等人推荐的。(2015).点预测是作为后验预测分布的平均值计算的,并通过实时均方根预测误差(RT-RMSFE)进行比较,每个年份的计算结果为:RT-RMSFE=VuuttendtendxJ=1(yT+J-YVT+JΩVT+J-1),(15)其中YVT+jΩVT+JI是使用+J-1之前的信息对年份v进行后验预测的平均值。预测密度,通过平均实时对数预测密度得分(RT-LPDS)和实时连续秩概率得分(RT-CRPS)来衡量:RT-LPDS=tendtendxj=1logp(yT+JΩVT+J-1)=tendtendxj=1logzp(yT+JΩVT+J-1,ζ1:T+j-1)p(ζ1:T+j-1ΩVt+j-1)dζ1:T+j-1≈tendtendxj=1log(mmxm=1p(yT+jΩVt+j-1,Vm1:T+j-1)),(16)RT-LPDS=tendtendxj=1yT+j-yvt+jayv,AT+jΩVt+j-1^ayv,BT+j^avt+j-1,(17)其中,ζ1:T+j-1,为简洁起见,收集每个模型所需的所有模型参数,这些参数是通过扩展样本信息估计的,直到T+j-1和M表示为止Gibbs采样器老化后的迭代。注意,在(17)中,yv、A、BT+jΩvt+j-1是从后验预测p(yvT+1Ωvt+j-1 yt)独立得出的。如Fréuhwirth-Schnatter(1995)所示,在选择结构状态空间模型的时变和组合分量的情况下,可以将LPDS解释为基于样本信息的对数边际似然,从而形成模型的建立得分函数。RT-CRPS可以看作是绝对预报误差的概率推广。与log-score相似,它属于更广泛的严格正确的评分函数(Gneiting和Raftery,2007),它允许以一致的方式比较密度预测7 8。为了便于讨论,目标是最大限度地提高TERT-LPDS和最小化RT-CRPS。对于所有的预测度量,用于(15,16,17)的预测分布传统上是通过Kalman firefiglter(Harvey,1990)的预测方程在状态空间模型中产生的。我们转而使用Cogleyet Al的更简单的近似方法。(2005),我们发现它对我们的样本没有实际的影响。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 09:26