楼主: kedemingshi
1725 45

[经济学] 具有多个协变量的长期预测区间 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-4-26 13:45:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Long-term prediction intervals with many covariates》
---
作者:
Sayar Karmakar, Marek Chudy and Wei Biao Wu
---
最新提交年份:
2021
---
英文摘要:
  Accurate forecasting is one of the fundamental focus in the literature of econometric time-series. Often practitioners and policy makers want to predict outcomes of an entire time horizon in the future instead of just a single $k$-step ahead prediction. These series, apart from their own possible non-linear dependence, are often also influenced by many external predictors. In this paper, we construct prediction intervals of time-aggregated forecasts in a high-dimensional regression setting. Our approach is based on quantiles of residuals obtained by the popular LASSO routine. We allow for general heavy-tailed, long-memory, and nonlinear stationary error process and stochastic predictors. Through a series of systematically arranged consistency results we provide theoretical guarantees of our proposed quantile-based method in all of these scenarios. After validating our approach using simulations we also propose a novel bootstrap based method that can boost the coverage of the theoretical intervals. Finally analyzing the EPEX Spot data, we construct prediction intervals for hourly electricity prices over horizons spanning 17 weeks and contrast them to selected Bayesian and bootstrap interval forecasts.
---
中文摘要:
准确预测是计量经济时间序列文献中的一个基本焦点。通常,从业者和政策制定者希望预测未来整个时间范围的结果,而不是仅仅提前一步预测。这些序列除了自身可能的非线性依赖性外,还经常受到许多外部预测因素的影响。在本文中,我们在高维回归环境中构造时间聚合预测的预测区间。我们的方法基于由流行套索程序获得的残差分位数。我们考虑了一般的重尾、长记忆、非线性平稳误差过程和随机预测。通过一系列系统排列的一致性结果,我们为我们提出的基于分位数的方法在所有这些场景中提供了理论保证。在通过仿真验证了我们的方法之后,我们还提出了一种新的基于bootstrap的方法,可以提高理论间隔的覆盖率。最后,通过分析EPEX现货数据,我们构建了17周内每小时电价的预测区间,并将其与选定的贝叶斯和bootstrap区间预测进行了对比。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--
一级分类:Mathematics        数学
二级分类:Statistics Theory        统计理论
分类描述:Applied, computational and theoretical statistics: e.g. statistical inference, regression, time series, multivariate analysis, data analysis, Markov chain Monte Carlo, design of experiments, case studies
应用统计、计算统计和理论统计:例如统计推断、回归、时间序列、多元分析、数据分析、马尔可夫链蒙特卡罗、实验设计、案例研究
--
一级分类:Statistics        统计学
二级分类:Statistics Theory        统计理论
分类描述:stat.TH is an alias for math.ST. Asymptotics, Bayesian Inference, Decision Theory, Estimation, Foundations, Inference, Testing.
Stat.Th是Math.St的别名。渐近,贝叶斯推论,决策理论,估计,基础,推论,检验。
--

---
PDF下载:
--> Long-term_prediction_intervals_with_many_covariates.pdf (809.07 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:协变量 econometrics Multivariate Practitioner Econometric

沙发
能者818 在职认证  发表于 2022-4-26 13:45:21
多卵巢综合征的长期预测区间*, Marek Chud\'y和Wei Biao Wuo佛罗里达大学、维也纳大学、芝加哥大学2021年10月4日摘要精确预测是经济计量时间序列文献中的基本焦点之一。通常,从业者和决策者希望预测未来整个时间范围的结果,而不是仅仅提前一步预测。这些序列除了自身可能的非线性依赖性外,还经常受到许多外部预测因素的影响。在本文中,我们构造了高维回归环境下时间聚集预测的预测区间。我们的方法基于由流行套索程序获得的残差分位数。我们考虑了一般的重尾、长记忆、非线性平稳误差过程和随机预测。通过一系列系统排列的一致性结果,我们为我们提出的基于分位数的方法在所有这些场景中提供了理论保证。在通过仿真验证了我们的方法之后,我们还提出了一种新的基于bootstrap的方法,可以提高理论区间的覆盖率。最后,通过分析EPEX现货数据,我们构建了17周内每小时电价的预测区间,并将其与选定的贝叶斯和bootstrap区间预测进行了对比。关键词:预测、重尾分布、长期依赖、电价、Bootstrap、时间聚集*通讯作者,电邮:sayarkarmakar@ufl.edu,地址:美国佛罗里达州盖恩斯维尔纽厄尔大道230号-32601。电话:+1(352)273-1839.1介绍预测间隔(以下简称PI)有助于预测者获取有关时间序列未来值的不确定性。

藤椅
mingdashike22 在职认证  发表于 2022-4-26 13:45:27
从理论和算法的角度来看,这一直是时间序列分析的一个中心话题。观测X后,对时间序列的k步超前预测,人们从许多不同的角度讨论了这个问题。而条件平均值(Xn+k | X,…,Xn)的估计自1975年以来受到了大多数关注;在过去几十年中,其他方法也得到了显著发展,见Gyor Fiandottucsak(2007年)、Morvai(2003年)、Gyor Fi等人(1998年)、Morvai等人(1996年)、Belyaev(1968年)、Morvai等人(1997年)、Brockwell等人(1991年)、Gyor Fi等人(2013年)、Pourahmadi(2001年)。尽管如此,在应用科学家的眼中,对预测区间(Pi)的评估仍具有挑战性(例如,Chat fiield,1993;Clements and Taylor,2003),因为经验覆盖率越高,往往会带来更大宽度的成本,从而降低精度。在本文中,我们主要研究在一个可能具有一般误差过程的高维线性模型下,利用来自多个预测因子的信息,构造和评估单变量序列的PI。此外,我们构建PIs的目标不是单变量序列的单一未来值,而是整个预测期内其值的总和。该装置在电信和数据服务、能源和金融领域有实际应用。这些行业的特点是,有关销售、价格或回报的数据以每小时一次的频率收集,而管理层则对未来几周或几个月的总销量预测感兴趣。在使用流行的ARCH/GARCH模型对股票收益率进行波动性预测时,通常(随着时间的推移)累积均方误差(AMSE)是一种评估指标(见(Starica,2003;Fryzlewicz et al.,2008;Karmakar et al.,2020)等)。

板凳
大多数88 在职认证  发表于 2022-4-26 13:45:33
在预测能源或电力消耗时,政策制定者希望预测未来一个月或几个月的使用情况。综合预测有助于他们确定此类商品的价格。参见Zhou等人(2010)中提到的一些应用。时间聚合也有助于达成信托基金、养老金管理和保险公司、特定衍生品的投资组合管理(Kitsul和Wright,2013)和资产(见Bansal等人,2016)等做出的战略决策。为了纳入外部回归,Ludwig et al.(2015)发现,纳入分类风速和温度(在德国70多个气象站进行测量)可以改善EPEX预测的日前电价。。我们对其框架进行了调整,以允许长期电价预测(EPF),即必须控制天气条件、当地经济、运行依赖性,这对长期和中期预测非常重要。类似的应用可以在电力投资组合风险管理、衍生定价、中长期合同评估和维护计划中找到。为了挑战我们的预测,我们提供了几种预测方法的样本外比较,其中包括穆勒和沃森(2016)的Bayes-PIs,以及通过指数平滑、神经网络和回归等方法获得的bootstrap-PIs,这些方法在R-package预测中实现了自相关误差(见Hyndman和Khandakar,2008)。预测一个未来值的总和而不是仅仅一个k步超前预测的一个有趣的优点是,如果预测的视界长度很大,它允许一些弱的大数定律生效。

报纸
可人4 在职认证  发表于 2022-4-26 13:45:40
为了方法学的发展和相应的理论进步,我们在高维回归环境中探索了Zhou等人(2010)基于分位数的PI的性质。首先,我们确定周等人(2010)在创新过程建模中使用了线性过程。这限制了适用范围。利用吴(2005a)在一篇论文中提出的预测密度和函数依赖框架的思想,我们将分位数一致性结果推广到一大类非线性过程,包括阈值/转移自回归(Lundberghet al.,2003)过程和一些非线性版本的GARCH过程。在回归方面,迄今为止获得的分位数一致性结果仅限于低维回归设置。这为探索高维回归环境提供了强大的动力,因为这将使我们能够整合多个预测因子,更好地解释数据的可变性。特别是,我们将重点放在预测因子数量增长快于样本量(log p=o(n))的场景上。使用流行的套索估计器,我们能够为这些PI提供理论保证。这篇论文的一个有趣贡献是,我们的一致性比率如何明确地描述了短程或长程依赖和较轻或较重尾部的价格。我们还展示了在高维区域中随机设计的尖锐一致性结果,这可以被视为一个本身很重要的贡献。

地板
可人4 在职认证  发表于 2022-4-26 13:45:47
因此,本文一方面通过扩大时间序列的范围,提出了未来聚合预测理论;同时,它允许在高维回归环境中存在许多协变量。特别是,本文可以为一个简单的基于套索的预测程序如何维持这种一般的时间序列依赖性提供一些理论依据。和环境政策(Knittel和Roberts,2005年;Huurman等人,2012年)。此外,由于复杂的季节性(每日、每周和每年)、异方差性、厚尾和突然的价格飙升(最近的综述见Weron,2014年)。除了理论贡献之外,我们还研究了PIs在只有相对较短样本的长期预测情景下的实际有效性。一项新发现是,当用于预测的聚合时间范围的长度与过去数据的长度相比增长时,最初基于分位数的PI会失败。针对这一缺点,我们采用了一种bootstrap辅助的方法来提高样本外覆盖率。除了一个推测性的观点来证明我们的bootstrap程序,这些模拟结果支持我们使用真实世界的小时电价数据为最终样本外实验选择PI。本文的其余部分组织如下:第2节展示了基于分位数的PI的构造,并详细介绍了一种新的bootstrap调整,以提高覆盖率。第3节详细阐述了分位数一致性结果:错误/创新过程可以是线性或非线性的,短期或长期的,并且可以有轻尾或重尾。基于误差过程的一致性,我们使用第4节来考虑套索拟合残差的一致性结果。与传统的固定设计不同,本节还讨论了随机设计。

7
何人来此 在职认证  发表于 2022-4-26 13:45:54
接下来,第5节详细介绍了模拟,我们比较了低维和高维回归设置的OLS、LAD和LASSO。第6节使用包括我们在内的几种方法分析EPEX现场电力。为了将我们的方法与文献中的竞争方法进行对比,我们使用了一种伪样本外(POOS)方法。最后,第7节提供了结束语。我们将一些理论结果和所有定理的证明推迟到附录中。现在我们介绍一些符号。对于随机向量Y,写Y∈ Lp,对于p>0,如果kY kp:=E(|Y|p)1/p<∞. 对于Lnorm,写k·k=k·k。在整个文本中,Cp表示一个仅依赖于p的常数,c表示一个普适常数。除非另有规定,否则这些可能在不同的行中采用不同的值。那么,x+=max(x,0)和x-= -最小值(x,0)。对于两个阳性序列ANA和bn,ifan/bn→ 0,写an=O(bn)。写一封信。如果是≤ cbn,对于一些c<∞. 对于随机变量序列Xn和可能的随机或非随机序列Yn,如果Xn/Yn,我们说Xn=oP(Yn)→ 概率为0。如果Xn/Yn是一个完全随机变量,我们分别说Xn=OP(Yn)。均值为u且协方差矩阵为∑的d变量正态分布用N(u,∑)表示。用IDD×DID实体矩阵表示。对于矩阵a=(aij),我们定义其元素- ∞ 作为| A的规范|∞= maxij | aij |及其`范数as | A |=maxjPi | aij |。2方法:预测区间的构造假设一个单变量目标时间序列yi,i=1,n遵循回归模型yi=xTiβ+ei,β∈ Rp,(2.1),其中EIS代表平均零时间相关误差过程。假设模型(2.1),我们希望为yn+1+构造PI+yn+mafter观测(yi,xi);i=1,N

8
大多数88 在职认证  发表于 2022-4-26 13:46:00
我们首先讨论场景β=0,即yi=ei是一个零平均噪声过程。这是高维回归问题的入门,并介绍了基于基本分位数的预测区间构造方法。2.1在没有协变量的情况下,我们将在后面的第3.2节中适当定义短程、长程、轻尾和重尾分布的概念。不严格地说,短程依赖性代表依赖性的更快衰减,因为在长程依赖过程缓慢杀死依赖性的情况下,滞后增加。重尾是指误差过程甚至不具有有限的秒矩的情况。根据依赖强度和尾部行为,Zhou等人(2010)提出了两种不同类型的PIs,用于m步前聚合反应en+1+…+en+m。我们在这里展示了它们,并进行了一些建议性的修改,尤其是对于我们不同估计长期方差的FirstApproach。2.1.1淬火CLT方法如果过程ETT表现出短程依赖性和轻尾行为,那么根据淬火中心极限定理,Zhou等人(2010)提出了以下PI形式(en+1+·····+en+m),[L,U]=[QN(α/2),QN(1)- α/2)]σ√m、 (2.2)其中σ是et的长期标准偏差(sd)。然而,由于σ未知,必须对其进行估计。可以使用子采样块估计器估计EI过程的长期方差σ(参见等式。

9
何人来此 在职认证  发表于 2022-4-26 13:46:09
(2) 在Dehling等,2013年)σ=pπl/2nκXk=1klXi=(k)-1) l+1ei, (2.3)使用块长度l和块数κ=dn/le,以获得100(1- α) %PI[L,U]=±σQtκ-1(α/2)√m、 Qtκ在哪里-1是带κ的student-t分位数- 1个自由度。2.1.2基于分位数的经验方法一种可以解释误差过程的长程依赖性或重尾行为的更一般的方法使用以下分位数^Q(u),第u个经验分位数ofiXj=i-m+1ei;i=m,n、 在这种情况下,PI是[L,U]=h^Q(α/2),^Q(1- α) /2)i.(2.4)与样本量n.2.2低维回归相比,该方法对m的适度增长率具有合理的覆盖率。现在假设(2.1)中β可能为非零。对于p<n,采用独立但线性的误差过程,在估计β后,Zhou等人(2010)构建了πasn+mXi=n+1xTi^β+PI For n+mXi=n+1^ei,(2.5),其中^ei=yi- xTi^β是回归残差。关于β估计量的选择,如果误差过程显示出轻尾行为和短期依赖性,我们通常使用OLS估计量β=argminPi(yi)-xTiβ)。对于重尾或长程相关误差(见Huber和Ronchetti,2009),最好使用一般距离ρ(·)和^β=argminPiρ(yi- xTiβ)。距离的例子包括1的LQ回归≤ Q≤ 2.在本文中,我们的重点是aLASSO型最小二乘估计(参见2.6),在可能存在相关和非线性误差的情况下,协变量p的数量远大于样本n.2.3高维回归考虑高维回归情况,即p n、 这里我们使用了流行的套索估计量^β=argminβ∈RpnnXi=1(yi)- xTiβ)+λpXj=1 |βj |,(2.6),惩罚系数λ。然后我们得到PIs(2.5),其中β被LASSOestimator代替。

10
何人来此 在职认证  发表于 2022-4-26 13:46:15
本文的主要贡献之一在于,直观且计算快速的lasso估计器能够很好地适应时间聚合响应,但仍能提供理论上的一致性保证,正如我们在第4.2.4节“未来预测”中所示,(2.5)中的PI要求协变量Xnamely xn+1的未来值,xn+m.Zhou等人(2010年)讨论了这些预测因子是三角函数的情况,因此完全可以预测。在计量经济学的实际应用中,考虑随机设计更具吸引力,这样我们就可以将协变量也看作随机变量。这自然提出了如何预测协变量未来值的问题。在理论部分,我们对第4节中随机设计的一致性结果进行了说明。然而,在第6节的实施中,我们选择简单地使用天气协变量的年平均预测。2.5 Bootstrap adjustment在我们对真实数据的实际实现中,我们在第2.2节中提出了算法的Bootstrap adjustd版本。在静态自举中,我们从{1,2,…,n}和一系列几何变量L,L,··中随机均匀地抽取一个起始点序列。根据Lian的值和起始值,我们绘制一个连续的Li长度块,然后最终将这些块连接在一起,以得到长度n的复制序列。然后,最后我们查看每个此类序列的最终m,但可以理解的是,仅查看最后m并不特别重要,因为起始点是一致的。我们推测,这确保了分位数的一致性,尽管为平均值提供了更多的离散度。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 08:01