楼主: kedemingshi
1578 54

[量化金融] 大规模动态预测回归 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.3335
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-6-9 19:22:22 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Large-Scale Dynamic Predictive Regressions》
---
作者:
Daniele Bianchi and Kenichiro McAlinn
---
最新提交年份:
2018
---
英文摘要:
  We develop a novel \"decouple-recouple\" dynamic predictive strategy and contribute to the literature on forecasting and economic decision making in a data-rich environment. Under this framework, clusters of predictors generate different latent states in the form of predictive densities that are later synthesized within an implied time-varying latent factor model. As a result, the latent inter-dependencies across predictive densities and biases are sequentially learned and corrected. Unlike sparse modeling and variable selection procedures, we do not assume a priori that there is a given subset of active predictors, which characterize the predictive density of a quantity of interest. We test our procedure by investigating the predictive content of a large set of financial ratios and macroeconomic variables on both the equity premium across different industries and the inflation rate in the U.S., two contexts of topical interest in finance and macroeconomics. We find that our predictive synthesis framework generates both statistically and economically significant out-of-sample benefits while maintaining interpretability of the forecasting variables. In addition, the main empirical results highlight that our proposed framework outperforms both LASSO-type shrinkage regressions, factor based dimension reduction, sequential variable selection, and equal-weighted linear pooling methodologies.
---
中文摘要:
我们开发了一种新的“解耦-再耦合”动态预测策略,并在数据丰富的环境中对预测和经济决策的文献做出了贡献。在此框架下,预测因子簇以预测密度的形式生成不同的潜在状态,这些状态随后在隐含的时变潜在因子模型中合成。因此,预测密度和偏差之间的潜在相互依赖关系被依次学习和校正。与稀疏建模和变量选择程序不同,我们没有先验地假设存在给定的主动预测子集,这些主动预测子集表征了感兴趣数量的预测密度。我们通过调查大量财务比率和宏观经济变量对不同行业的股权溢价和美国通货膨胀率的预测内容来测试我们的程序,这两个背景是金融和宏观经济学的热门话题。我们发现,我们的预测合成框架在保持预测变量的可解释性的同时,在统计和经济上都产生了显著的样本外效益。此外,主要的实证结果表明,我们提出的框架优于套索型收缩回归、基于因子的降维、序贯变量选择和等权重线性池方法。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:动态预测 大规模 econometrics Multivariate Quantitative

沙发
可人4 在职认证  发表于 2022-6-9 19:22:29
大规模动态预测回归Daniele Bianchi*Kenichiro McAlinn+初稿:2017年12月。本草案:2018年3月20日摘要我们开发了一种新的“解耦-再耦合”动态预测策略,并为有关数据丰富环境中的预测和经济决策的文献做出贡献。在此框架下,预测簇以预测密度的形式生成不同的潜在状态,然后在隐式时变潜在因子模型中进行合成。因此,预测密度和偏差之间的潜在相互依赖关系被依次学习和校正。与稀疏建模和变量选择过程不同,我们没有先验地假设存在给定的主动预测子集,这些主动预测子集表征了感兴趣量的预测密度。我们通过调查大量金融比率和宏观经济变量对不同行业的股权溢价和美国的通货膨胀率的预测内容来测试我们的程序,这两个背景是金融和宏观经济学的热门话题。我们发现,我们的predictivesynthesis框架在保持预测变量可解释性的同时,从样本中产生了统计上和经济上的显著效益。此外,主要的实证结果表明,我们提出的框架优于套索型收缩回归、基于因子的降维、序贯变量选择和等权重线性池方法。关键词:数据丰富的模型、大数据、预测组合、模型平均、动态预测、宏观经济预测、收益可预测性。JEL代码:C11、C53、D83、E37、G11、G12、G17*英国考文垂华威大学华威商学院。丹尼尔。Bianchi@wbs.ac.uk+芝加哥大学布斯商学院,伊利诺伊州芝加哥,美国。

藤椅
mingdashike22 在职认证  发表于 2022-6-9 19:22:33
kenichiro。mcalinn@chicagobooth.edu1简介大型数据集在变量数量和观测数量方面的可用性不断增加,加上计量经济学、统计学和机器学习领域的最新进展,激发了人们对数据丰富环境中预测模型的兴趣;金融和经济领域。由于并非所有预测因素都与给定的经济决策相关,决策者通常通过引用经济学理论、现有经验文献和他们自己的启发性论点来预先选择最重要的候选协变量。尽管如此,决策者通常仍然有数十个(如果不是数百个)可能提供有用信息的明智预测。然而,随着数据维数的增加,标准技术(如普通最小二乘法、最大似然法或具有无信息先验的贝叶斯推理)的样本外性能往往会恶化,这是众所周知的维数灾难。面对大量的预测因素,三大类模型开始流行起来。Sparsemodeling侧重于从一大组预测值中选择预测能力最高的变量子集,并丢弃相关性最低的变量子集。在贝叶斯文献中,George和McCulloch(1993)(以及最近的Roˇckov\'a和George 2016以及Roˇckov\'a 2018)给出了一个突出的例子,通过数据扩充方法引入了变量选择。类似地,正则化模型采用大量的预测因子,并引入惩罚来约束模型空间。套索型正则化和岭回归是迄今为止研究和实践中使用最多的。

板凳
可人4 在职认证  发表于 2022-6-9 19:22:37
最后,密集建模基于这样一个假设,即所有变量都可以先验地为预测带来有用的信息,尽管其中一些变量的影响可能很小。因此,假设一大组预测值的统计特征由一小组公共分量捕获,这些公共分量可以是静态的,也可以是动态的。因子分析是密集统计建模的一个典型例子(参见Stock and Watson 2002和De Mol et al.2008及其参考文献),在宏观计量经济学中非常流行。所有这些方法都需要隐式或显式减少模型空间,以减轻维数灾难。然而,这些技术中哪一种最好的问题在很大程度上仍然没有解决。对于经济和金融决策,尤其是SEE,例如Timmermann(2004)、De Mol、Giannone和Reichlin(2008)、M¨onch(2008)、Bai和Ng(2010)、Belloni、Chen、Chernozhukov和Hansen(2012)、Billio、Casarin、Ravazzolo和van Dijk(2013)、Elliott、Gargano和Timmermann(2013)、Manzan(2015)、Harvey、Liu和Zhu(2016)、Freyberger、Neuhierl和Weber(2017)、Giannone,Lenza和Primiceri(2017),McAlinn和West(2017),仅举几个例子。降维技术总是导致一致性解释能力的降低,这对决策者、分析师和投资者来说可能至关重要。例如,一位致力于构建长-短投资策略的投资组合经理可能不会发现使用潜在因素是有用的,因为她无法清楚地确定这些潜在因素是有意义的风险来源,或者类似地,她也不希望关键的、经济上合理的预测值缩小到零。更重要的是,Giannone等人。

报纸
可人4 在职认证  发表于 2022-6-9 19:22:40
(2017)最近的研究表明,在贝叶斯环境下,大维度线性回归参数的后验分布并不集中在单个稀疏模型上,而是根据先验启发分布在不同类型的模型上。这些问题可能会破坏开发数据丰富的环境对经济和金融决策的有用性。在本文中,我们提出了一类数据丰富的预测合成技术,并对大数据预测建模和决策方面的文献做出了贡献。与稀疏建模不同,我们没有先验地假设预测值集中存在稀疏性。例如,假设我们有兴趣预测股票市场上提前一步的超额回报,比如说,基于数百个可行的预测因素。使用标准套索型收缩率(一种典型的解决方案)将隐含地引入一个教条主义先验,即只有一小部分回归系数对预测股票超额收益有用,其余的是噪声,即预先假设稀疏性。然而,无法保证随着时间的推移,小子集是一致的或平滑的。类似地,即使有这样一个中等规模,模型空间大约为1e+30个可能的预测值组合,这阻止了标准随机搜索变量选择算法类内的任何合理收敛,例如,spike和slab先验(参见,例如,Giannone et al.2017)。反过来,我们保留所有可用的信息,并将一个大型预测模型解耦为一组更小的预测回归,这些回归是由一组回归器之间的相似性构建的。假设这些预测因子可以根据其经济意义划分为J个不同的子组,每个子组包含较少的回归因子。

地板
可人4 在职认证  发表于 2022-6-9 19:22:43
在我们的框架中,我们不是假设稀疏结构,而是通过分别和顺序估计J个不同的预测密度来保留所有信息,每类预测值一个,并使用预测合成方法动态重新计算它们。请注意,回归子组一开始的分类方式完全独立于解耦重耦策略。在实证应用中,我们根据其经济含义对变量组进行分类。然而,没有什么可以阻止使用基于相关性的聚类算法,如K-均值、模糊C-均值、层次聚类、高斯混合或其他最近邻分类。我们提出的方法通过利用贝叶斯预测合成的理论基础和最新发展(BPS:West and Crosse,1992;West,1992;McAlinn and West,2017),显著不同于多个小模型的模型组合(例如,具有不同调谐参数的多个套索模型),如Stevanovic(2017)。这使得我们的解耦-再耦合策略在理论上和概念上保持一致,因为它将解耦模型视为单独的潜在状态,在其他典型的动态线性建模框架中使用贝叶斯定理学习和校准(见West和Harrison 1997)。在此框架下,可以依次学习子组之间的依赖关系以及每个子组内的偏差;虽然在典型的模型组合技术中丢失了关键信息。

7
可人4 在职认证  发表于 2022-6-9 19:22:47
因此,我们的框架可以被认为是一种有效的模型组合策略,它允许在数据丰富的环境中动态建模和预测,方法是将一个大维度的问题分解为一系列小问题,然后充分利用所有信息并保持对有效决策至关重要的可解释性。我们在宏观经济和金融应用程序上校准并实施所提出的方法,我们称之为解耦-再耦合综合(DRS)。更具体地说,在第一次应用中,我们使用BPS测试我们的解耦-再抽样方法的性能,以预测1986年1月至2015年12月期间美国未来一个月和三个月的年通货膨胀率,这是topicalinterest的背景(见Cogley and Sargent 2005、Primiceri 2005、Koop、Korobilis et al.2010和Nakajimaand West 2013等)。这套月度宏观经济预测指标包括更新版本的股票和沃森宏观经济面板,可从联邦储备银行ofSt获得。路易斯。有关数据集构建的详细信息,请参见McCracken和Ng(2016)。实证工作涉及一个由119个月度宏观经济和金融变量组成的平衡小组,这些变量分为八大类:产出和收入、劳动力市场、消费、订单和库存、货币和信贷、利率和汇率、价格和股市。第二个应用是基于大量预测因素,预测1970年1月至2015年12月不同行业的月度同比总超额回报,之前的学术研究和现有经济理论都选择了这些研究,目的是确保我们的结果与这些研究的可比性(参见Lewellen 2004、Avramov 2004、Goyal和Welch 2008、Rapach、Strauss和Zhou 2010以及Dangl和Halling 2012等)。

8
能者818 在职认证  发表于 2022-6-9 19:22:50
更具体地说,我们收集了八个不同类别的所有美国公司70多个预先计算的财务比率的月度数据。通过构建超过无风险利率的价值加权回报率和单个预测值的价值加权聚合,在行业层面对回报和预测值进行聚合。行业聚合基于现有公司在每个时间的四位数SIC代码。这70个比率分为八大类:估值、盈利能力、资本化、财务稳健、偿付能力、流动性、效率比率和其他。与行业特定预测因子一起,我们使用了从现有研究中获得的额外14个聚合协变量,这些协变量分为两类;总财务和宏观经济变量(见Goyal and Welch 2008和Rapach et al.2010)。为了从经验上评估我们的方法,我们将我们的框架中的预测与标准贝叶斯模型平均(BMA)进行比较,在标准贝叶斯模型平均中,预测密度与顺序更新的模型概率混合(例如Harrison和Stevens,1976;West和Harrison,1997,第12.2节),以及与simpler,使用线性池(即预测密度的算术平均值)的模型特定预测密度的等加权平均值,以及一些理论基础(如West1984)。此外,我们将我们设定的预测与最先进的套索类型正则化进行比较,套索类型正则化将最不相关变量的系数限制为空,从而导致事后sparsemodels和基于PCA的潜在因素建模(Stock和Watson,2002;McCracken和Ng,2016)。

9
nandehutu2022 在职认证  发表于 2022-6-9 19:22:53
虽然其中一些策略似乎过于简单化,但在某些情况下,至少在实证研究中的直接点预测方面,它们已被证明主导了一些更复杂的聚合策略(Trene,Kenny,Meyler和Timmermann,2013)。最后,我们还将我们的解耦-重耦模型合成方案与从单独的预测组特定集合计算的边际预测密度进行比较。通过评估样本外测井预测密度比(LPDR),初步评估预测精度;在水平k和横向时间指数t。虽然本文主要关注密度预测,但我们也报告了感兴趣预测水平上的均方根预测误差(RMSFE),该误差与LPDR结果相结合,更全面地描述了结果。无论绩效评估指标如何,我们的解耦-再耦合模型综合方案都是预测美国经济年通货膨胀率的最佳方案。这适用于bothone提前一步和提前三步预测。它显著优于连续BMA和预测密度的等加权线性池。有趣的是,LASSO在密度预测方面对模型组合/收缩方案进行了worstamong。对各类宏观经济预测因素之间潜在相互依赖性的顺序估计表明,劳动力市场压力和价格水平往往主导其他预测因素,劳动力市场在21世纪初是主要组成部分,而价格往往在测试期结束时增加其在总预测密度中的权重。在预测不同行业的年度总超额回报方面,结果可能更加明显。

10
可人4 在职认证  发表于 2022-6-9 19:22:56
LPDR之间的差异相当明显,清楚地显示出有利于DRS的性能差距。在预测领先一步时,没有任何替代规范接近DRS。虽然等权线性组合被证明是一个有挑战性的基准,但我们表明,LASSO型收缩估计量和PCA在样本外表现出色,尤其是在预测提前一步的超额回报密度时。这一结果与Diebold和Shin(2017)的最新证据一致,该证据显示了LASSO估计器在样本外实时预测练习中的次优性。我们还将我们的模型组合方案与上述竞争对手进行了比较,其依据是假设有代表性的投资者具有电力公司偏好,那么我们的经济表现。在整个样本中,在月度水平上对无约束和卖空约束投资者进行比较。我们发现,经济约束导致在所有领域和几乎所有竞争规范中都有较高的可靠性当量(CER)值。具体而言,卖空限制导致各行业平均每年超过100个基点的较高CER(相对于无限制情况)。与PredictiveAccurance结果一致,我们通常发现,在投资组合约束下,DRS策略比竞争规范产生更高的CER改进。此外,我们还表明,DRS允许在横截面和时间序列中获得更高的CER,这表明使用我们的方法可以获得重要的经济收益。本文的结构如下。第2节介绍了我们用于有效合成预测密度的解耦-重采样方法。第3节介绍了本文的核心,并报告了与美国。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-17 02:00