楼主: kedemingshi
1764 45

[经济学] 具有多个协变量的长期预测区间 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-4-26 13:47:31
(4.6)数量Φq,α提供了一种简洁自然的相关性度量,可以有效地解释高维度和时间相关性。也让错误流程(ei)承认以下代表ei=Ge(工程安装,工程安装-1, . . .), (4.7)在哪里夏尔i.i.d.和GEI是一个可测量的函数。然后可以使用这种函数依赖性度量来定义累积依赖性。然而,由于回归问题的结构,我们可以跳过对EIP过程的定义。相反,对于随机设计情况下的分位数一致性,我们需要一个函数依赖于叉积过程x.je的表达式。如下δxek,q=maxj≤pkxljel- 十、*k、 lje*k、 lkq,(4.8)其中e*k、 l=Ge(艾尔,工程安装-1.工程安装-k、 …)及{ei}是一份{嗯。使用(4.8),我们将x.je的依赖性调整标准定义为(4.1)。在1上均匀地处理≤ J≤ p如下:maxj≤pkx。杰。kq,α=supt≥0(t+1)α∞Xi=tδxei,q.(4.9)在随机协变量和误差过程的背景下,我们现在将分位数一致性结果陈述如下。定理4.2。(套索随机的经验分位数一致性)假设Φq,α<∞ 还有maxj≤pkx。杰。kq,α<∞ 对于某些α>0的情况。设Qn(u)为(^Si)nm的分位数。我们假设限制特征值假设restoch(s,κ)保持不变,κstoch:=κ(s,3),其中s是真参数向量β中非零项的数量,κ(s,c)=sminJ{1,··,p},|J|≤s、 min | uJc|≤c | uJ | uTE(xtxTt)ukuJk。(4.10)假设(4.3)中的稀疏性条件适用于λ=2r,其中r=max{Apn-1log p maxj≤pkx。杰。k2,α,B-maxj≤pkx。杰。kq,αn-1+min{0,1/2-1/q-α}}.除此之外,我们还感到满意√对数p/√N→ 0

22
mingdashike22 在职认证  发表于 2022-4-26 13:47:37
然后,将Qn(u)替换为“Qn(u)”后,REM 3.4的SRD特定结论成立。注:注意,交叉乘积空间x.je上的一致函数依赖度量。通常可以使用H¨older不等式和常用的三角形不等式技术来简化。有关非线性协变量过程的函数依赖性测量的一些示例和计算,请参见Wu和Wu(2016)。基于(2.5)线的预测区间需要xi的未来值,而我们没有观察到。一种可能的解决方案是建立一个具有适当滞后的向量自回归(VAR)模型,然后估计1的k步超前预测≤ K≤ m使用VAR过程的估计矩阵系数。也可以对xiand EID过程进行假设,并以更严格的方式处理。但是,由于我们的重点是基于分位数估计预测区间的相对简单但渐近有效的方法,所以我们省略了这一讨论。相反,为了实际实施,(参见第6节的数据分析,其中,对于协变量,我们使用了风和温度数据,这些数据在本质上是随机的),我们只使用过去一年的同比平均值来代替i=n+1,n+m.由于m也在增长,因此聚集的xTiβ值自然会集中在过去一年的聚集平均值附近。我们计划在未来的工作中讨论同时估计未来的问题。5模拟在本节中,我们比较了上述方法在低维和高维设置中使用OLS、LAD和LASSO估计器的预测性能。

23
大多数88 在职认证  发表于 2022-4-26 13:47:44
在低维设置中,将评估基于CLT的方法(如第2节所述的淬火CLT)和基于QTL分位数的方法之间的比较。5.1模拟设置此处的重点是基于其覆盖概率对上一节讨论的PI进行评估。我们首先将误差过程(et)生成为:(a)ei=φei-1+ σi、 (b)ei=σP∞j=0(j+1)γ我-j、 (c)ei=φei-1+G(ei)-1.δ、 T)(φei-1) + σi、 与二、i、 d.来自α*-分布稳定。重尾指数α*= 1.5,自协方差衰减参数γ=-0.8,过渡速度参数δ=0.05,自回归系数φ=0.6,φ=-0.3,噪声标准偏差σ=54.1,阈值T=0,都是基于自回归模型选择的,该模型适用于实证部分后面使用的电价。逻辑转移函数由G(ei)给出-1.δ、 T)=(1+exp(-δ(ei)-1.- (T)-1、这三个样本代表(a)重尾短记忆错误过程,(b)重尾长记忆错误过程,以及(c)称为具有重尾创新的logistic平滑过渡自回归(LSTAR)的非线性错误过程。分别地最后,我们在误差过程中加入大量外源性协变量,得到yi=xTiβ+ei,i=1,n+m.我们根据(y,x)计算我们的PI,(yn,xn)并在y+1:m=1/mPmi=1yn+i上对其进行评估。注意,我们预测的是平均值,而不是总和。这是因为在不同的预测范围内更容易比较预测绩效,在下面的实证部分中也证明了这一点。关于协变量,我们考虑了两种情况(i)p<n和(ii)p>n。Inscenario(i)(见表1i),我们比较了基于OLS、LAD和LASSO估计器的PI。

24
mingdashike22 在职认证  发表于 2022-4-26 13:47:50
我们设定n=8736(≈ 1年的小时数据),m=168、336、504、672(1、2、3、4周的小时数据),p=319(151个天气变量和168个周期变量),类似于第6节中所述的经验应用(除了地平线跨度长达17周)。在场景(ii)(见表1ii)中,我们仅使用LASSO,因为其他两个估计器不是唯一确定的。我们设置n=336(每小时2周的数据),m=24,48,72,96(每小时1,2,3,4天的数据)和p=487(151个天气变量和336个周期变量)。β元素∈ 是统一分配局的身份证吗[-1, 1]. 此外,由于LASSO估计的性质取决于β的稀疏性,我们假设=(1)-kβk/p)=50%。补充在线材料包含稀疏度=90%和20%的结果,即高稀疏度和低稀疏度设置的结果。在整个实验过程中,我们对所有1000次重复保持(稀疏)β固定。我们计算名义覆盖率(1)的PI- α) =60%、80%、90%、95%,并根据覆盖概率(以下复数为CPs)比较第2节中提出的淬火CLT方法和QTL方法(\\1- α) =Xj=1I[L,U]j,^β3\'yj,+1:m,基于平均温克尔损失(温克尔,1972)L=|[L,U]j,^β|+αinfz∈[L,U]j,^β| yj,+1:m- z |,j=1,1000,其中第j次试验的I为1,当间隔[L,U]j,^β和0未覆盖时,\'yj,+1:mis。

25
能者818 在职认证  发表于 2022-4-26 13:47:56
Winkler损失是一种常用的分位数类型损失,它会惩罚PI的宽度和未命中的大小,因此适合根据已知分位数比较PI(最近的讨论见Askanazi et al.,2018)。值得注意的是,名义覆盖率越高1-α:通过因子2/α,将更多的权重分配给模型。5.2模拟结果可以从实验中得出两个一般性结论,与协变量的维数是高还是低无关:为了计算方便,我们减少了n,因此p>n不必太大。本文之前的版本也包含了基于柯西分布的结果。为了简洁起见,我们省略了同样的一般结论对于所有方法,其CP始终低于校准的标称覆盖率此外,CP随着预测范围的扩大而下降。相比之下,Winkler损失不会随着预测期的增长而单调增加,这表明CP和“锐度”之间的权衡在这些预测期内是稳定的。进一步的结果需要区分低维和高维场景。在低维场景中(见表1i),通常情况下,以下情况适用:o当底层进程具有长内存时,PI的CP最低。oQTL PIs在所有序列中的CpA和Winkler损失方面都主导了淬火CLT。因此,CLT不能通过“锐度”来补偿CP。长期来看,CP可能会低于名义覆盖率的一半基于LASSO和LAD估计器的QTL-Pi表现最好。虽然LASSO QTL在CP方面占主导地位,但LAD CTL具有更好的“清晰度”,导致基于Winkler损失的LAD略高于LASSO。这条规则的例外是当序列显示长内存时。

26
能者818 在职认证  发表于 2022-4-26 13:48:02
允许较高的β值将使套索成为温克勒损失的赢家,而较低的稀疏值将赋予小伙子权力。对于高维场景,前面的一些陈述并不成立。与Chud\'y等人(2020)的设计类似,层位/样本比变得非常高,即m/n>1/4。此外,我们必须面对我们使用套索的维度诅咒。尽管如此,这种设置对QTL的表现有很大的负面影响(见表1ii),因此我们利用了基于剩余^ei=yi复制的数据驱动调整- ^yi使用固定引导。我们用ADJ表示调整后的QTL。有关实施的详细信息见第6节,其中DJ在与此处类似的设置下使用。这些模拟为我们提供了以下结果:oQTL-Pi并没有在所有系列和层位上主导淬火CLT。事实上,在最短的时间范围内,CLT在Winkler损失的CP方面获胜(至少在较大的名义覆盖范围内)。此外,对于长记忆系列,我们可以跨越所有的视野。有关LASSO调节参数λ选择的详细信息,请参见附录Co一般来说,QTL的CP比之前的设置更差,尤其是在预测期较长的情况下然而,第2.5节中介绍的自举调整会在所有系列和所有范围内(最短的范围除外)带来重大改进。在Winkler损失中,非线性情况下的改善最为明显。此外,我们可能想知道β的稀疏性和生成分布的影响是什么。一般来说,当β非常稀疏时,CPs略高。反过来,从柯西分布中提取的β会导致较小的CPS。

27
kedemingshi 在职认证  发表于 2022-4-26 13:48:09
尽管如此,两种备选方案都会得出相同的一般结论,相同方法(对于相同的系列和水平)之间的差异在两个百分点的范围内。名义60%80%90%95%60%80%90%95%6实际数据:EPEX现货电价下,我们将通过我们的方法获得的预测与通过实际数据中的POOS获得的现有预测进行比较和对比。以下是我们将探索的竞争方法列表:(ADJ)调整QTL-LASSO方法,在方法子节2中描述。5.(RBS)稳健贝叶斯(M¨uller和Watson(2016)),(ARX)ARMAX模型的自举路径模拟,(ETS)指数平滑状态空间模型(Hyndman等人,2008),(NAR)神经网络自回归(Hyndman和Athanasopoulos,2013,第9.3节)。我们首先简要介绍上述最后三种方法,以便与第2.5节中规定的ADJ进行比较。稳健的Bayes-PIs RBS:对于这种复杂的单变量方法,我们关注直觉,并参考M¨uller和Watson(2016)的补充附录,了解有关实施的更多细节。稳健的Bayes-PIs是专门为长期预测而设计的,例如,当m/n≈ 1/2. 首先,利用低频余弦变换从YT信号中提取出高频噪声。预测第一个q频率所跨越的“y+1:m”空间是获得“y+1:m”条件分布的关键。为了扩大该方法可用于的过程类别,同时跟踪参数不确定性,穆勒和沃森(2016)采用了贝叶斯方法。此外,结果PI进一步增强,以使用最不利的分布获得常客覆盖率。这需要对非标准分布的分位数进行高级算法搜索,这是它在实现方面的主要缺点。

28
可人4 在职认证  发表于 2022-4-26 13:48:14
另一方面,他们支持的在线材料提供了一些预先计算的输入,使计算速度更快。(i) 对于小q,计算yt系列的余弦变换xT=(x,…,xq)。(ii)近似(`y+1:m,xT)的协方差矩阵。(iii)解决(穆勒和沃森,2016年,第1721页)中的最小化问题(14),以获得均匀覆盖的稳健分位数。(iv)PIs由[L,U]=y+[Qrobustq(α/2),Qrobustq(1)给出- α/2)].ARX、ETS和NAR的自举PI:(i)使用克利夫兰等人(1990)提出的季节和趋势分解方法,调整YT的每周周期。(ii)根据AIC自动选择模型,并将相应的模型调整为yt。对于ARX和NAR,我们还使用聚合天气数据,定义为“wt=Pk=1wk,t,”“τt=Pl=1τl,以及周末虚拟变量作为外源性卵巢(详见补充附录C)。(iii)模拟b=1,B未来路径^ybn,tof长度m,来自估计模型。(iv)从一组平均值“^yb+,1:m,b=1,…”中获得相应的分位数,B.6.1数据描述和目标预测“y+1:m=1/mPmt=1yn+t,即德国和奥地利未来每小时一天的平均领先电价——欧洲电力交易所(EPEX SPOT)的最大市场。我们决定预测未来平均值的原因之一是,穆勒和沃森(2016)的贝叶斯方法是专门为平均值设计的。由于所有其他方法都是灵活的,因此我们使用平均值作为比较的共同基础。价格来源于前一天的每小时拍卖,交易员在拍卖中交易第二天的特定商品。

29
nandehutu2022 在职认证  发表于 2022-4-26 13:48:20
由于市场每天24小时运行,我们在2013年1月1日00:00:00 UTC和2014年4月30日23:00:00 UTC之间进行了11640次观测。我们将数据分为一个培训期,从2013年1月1日00:00:00 UTCto到2013年12月31日23:00:00 UTC,以及一个评估期,从2014年1月1日400:00:00 UTC到2014年4月30日23:00 UTC(见图1A)。预测范围为m=1,17周(168,…,2856小时)。对图1C中价格的周期图进行检查,可以发现周期1周、1天和1/2天的峰值。混合季节性很难通过适用于月度和季度数据的Sarimor ETS模型或Dummy变量进行建模。相反,我们使用具有季节性傅里叶频率的正弦波之和,ωk=2πk/168,k=1,2,对应于1周、1/2周、,2小时(见Bierbauer等人,2007年;Weron和Misiorek,2008年;Cartea和Figureoa,协调世界时)。-100-50 0 50 100 1月4月7月10月1月4日-50 0 50 100 12月1日12月15日1月1日1月15日2010年1月15日10000 20000 30000w d 12h 8h 6h 3h 2HCAB图1:电力现货价格,A)完整样本,B)价格水平下降,C)在1周、1天和12小时内出现峰值的周期图。2005). 线性组合β(s)k,β(c)k的系数可以用最小二乘法估计。此外,我们使用2个虚拟变量作为所有周末的指标。如第1节所述,本地天气变量也被用作协变量。天气条件隐含地捕捉了一周以上的季节性模式,这在预测长视野时非常重要。当地天气以151小时风速表示,在5年(2009-2013)内观测到温度序列,即包括培训期,但不包括评估期(见上文)。

30
mingdashike22 在职认证  发表于 2022-4-26 13:48:26
为了估计评估期内样本数据中的一些缺失和未观察到的值,我们采用了5年内每个天气序列的每小时平均值。总的来说,我们有168个三角协变量,151个天气协变量和2个假人,它们给出了一整套321个协变量。6.2讨论不同方法的性能在我们将ADJ与其他竞争对手进行比较之前,我们将讨论一些在分析任何实际数据集时常见的问题。在图1B中,我们看到2013年12月的价格水平下降。因此,基于整个训练期的预测将不受偏见的影响。相比之下,仅使用bootstrap(Hyndman and Fan,2010年)12月数据对未来值进行的breakSee后替代近似值将意味着潜在有价值信息的丢失。在这种情况下,可以通过降低较旧观测值的权重(Seeesaran et al.,2013),也被称为指数加权回归(Taylor,2010),来实现最佳的权衡效果。为了获得更好的预测性能,我们使用具有标准化指数权重vn的指数加权回归-t+1=δt-1((1 - δ))/(1 - δt),t=1,n,δ=0.8。这适用于ADJ和NAR方法。ETS和ARX模型隐式地提供指数向下加权,但具有最佳选择的权重。穆勒和沃森(2016年)表明,苏格兰皇家银行对结构变化非常稳健。我们还想看看使用分类的天气数据,而不是整个气象站汇总的天气数据,是否有实际的好处。因此,我们不使用图2A中的回归器,只使用图2B中的确定性回归器,使用确定性回归器和聚合天气变量计算ADJ PI,定义为图2C中的“wt=Pk=1wk,t,”、τt=Pl=1τl,tas,最后使用图2D中的所有321个协变量。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-24 17:42