楼主: 可人4
1954 35

[量化金融] 关于预测组合难题 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-8 04:34:54
事实上,Hendry和Clements(2004)证明,当候选预测模型在信息变量中都被误判和破坏时,估计最佳权重的方法可能不如SA。在第7节中,我们的蒙特卡罗例子还表明,当DGP动力学中出现断裂时,SA可能会主导复杂的方法。第二,通常的做法是,候选预测已经在某些方面进行了筛选,以便它们或多或少处于平等地位。例如,Stock and Watson(1998)和Stock and Watson(2004)应用了各种模型选择方法,如AIC和BIC,以确定有前途的线性或非线性候选预测模型。最近,Bordignonet等人(2013年)选择了不同类型的模型(ARMAX、时变系数等),并建议SA在结合少量业绩预测时效果良好。在使用专业预报员调查数据的研究中,也期望每个专业预报员在满意地完成自己的预报之前进行一些模型筛选。在这些情况下,可能不会有特别糟糕的候选预测,候选预测(至少是排名靠前的)可能会或多或少地对最佳组合做出贡献,这使得SA成为一种具有竞争力的方法。在第8节中,我们使用蒙特卡罗例子来说明筛选可以作为FCP的来源。最后,这个谜题也可能是出版偏见的结果;当SA不能很好地工作时,人们不倾向于强调SA的性能。根据我们对上述FCP的所有理解,我们将解决第三项中提出的问题,并在第68节中提供有关SA稳健性的进一步信息。

12
何人来此 在职认证  发表于 2022-5-8 04:34:57
特别是,我们将看到,SA在几个方面的表现实际上并不稳健:当i)添加不理想、较差或冗余的预测时,其表现可能会发生显著甚至实质性的变化;或ii)对预测的筛选程度不同。此外,处理结构断裂的滚动窗口的大小也会影响SA的相对性能。幸运的是,正如我们将看到的,一些组合方法可以在很大程度上避免这些缺陷。3.问题设置假设分析师对预测实值时间序列y,y,感兴趣。给定每个时间点t≥ 1,假设Xt是观察yt之前显示的(可能是多变量)信息变量向量。分析人员可能无法访问XT。以XT和zt为条件-1=:{(xj,yj),1≤ J≤ T-1} ,ytis随后由未知分布pt(·| xt,zt)生成-1) 条件平均mt=E(yt | xt,zt-1) 条件方差vt=Var(yt | xt,zt-1). 然后,yt可以表示为yt=mt+εt,其中ε是条件均值和条件方差分别为0和vt的随机噪声。假设在观察yt之前,分析员可以访问K真实值预测^yt,i(i=1,··,K)。这些预测可以用不同的模型结构和/或信息变量的不同组成部分来构建,但关于如何创建每个原始预测的细节在实践中可能不可用,也不被认为是已知的。分析人员在(线性)预测组合中的目标是构造一个权重向量w=(w,·wK)T∈ RK,基于观测yt之前的可用信息,找到yt的点预测,预测组合^yt,w=PKi=1wi^yt,i。

13
能者818 在职认证  发表于 2022-5-8 04:35:00
权重向量在不同时间点可能不同。评估产生预测的程序的性能{^yt,t=1,2,…}给定时间范围T,我们考虑平均预测风险rt=TTXt=1E(yt- ^yt)在我们的分析和模拟研究中。对于实际数据评估,由于无法计算风险,我们使用均方预测误差(MSFE)作为替代:MSFET=TTXt=1(yt)- ^yt)。根据FCP,就RTA和MSFET而言,权重w变化很小或没有时间变化的简单方法(例如,等权重)通常优于时间变化很大的复杂方法。4.CFA与CFI:FCPIn的隐藏来源本节,我们研究两种不同情景下预测组合方法的性能。未能识别这些场景本身可能会导致FCP。我们在回归设置下使用了两个与Huang和Lee(2010)相似的简单但说明性的蒙特卡罗示例来演示CFA和CFI场景。案例1。假设yt(t=1,··,t)由线性模型yt=xtβ+εt生成,其中xt是i.i.d.N(0,σX),εt独立于xt,是i.i.d.N(0,σ)。考虑预测1生成的两个候选预测:^yt,1=xt^βt;预测2:^yt,2=^αt,其中^β和^α皮重均来自使用历史数据的普通最小二乘法(OLS)估计。鉴于Forecast 1本质上代表了真实的模型,它与Forecast 2的结合不能渐进地改善最佳单个预测的性能,因此给出了CFA场景的一个例子。让T作为评估期的固定起点,T作为评估期的终点。给定Tto T的评估期,让RT、1、RT、2和RT、wbe分别为预测1、预测2和组合预测的平均预测风险。如果我们让RT,Sab为SA在时间T的平均预测风险,我们预期RT,SA>RT,1。

14
何人来此 在职认证  发表于 2022-5-8 04:35:03
事实上,附录中的提案2显示了SRT,1RT,SA→σ+βσX/4as T→ ∞, (1) 最优组合渐近地将所有权重分配给Forecast 1。在CFA情景下,由于最佳候选人未知,预测组合的自然目标是匹配最佳候选人的表现。案例2。假设yt(t=1,··,t)由线性模型yt=(xt,1+xt,2)β+εt生成,其中xt=(xt,1,xt,2)皮重i.i.d.遵循均值为0的二元正态分布,公共方差σX=σX=σX。让ρ表示xt,1和xt,2之间的相关性。随机误差εt独立于xt,为i.i.d.N(0,σ)。考虑预测1生成的两个候选预测:^yt,1=xt,1^βt,1;预测2:^yt,2=xt,2^βt,2,其中^βt,1和^βt,2都是通过历史数据的OLS估计获得的。与案例1不同的是,案例2呈现了一个场景,其中每个应聘者只预测信息集中的一部分员工。在某种程度上,可以预期,将两种预测结合起来就像汇集不同来源的重要信息一样,会产生比两种候选预测更好的表现。通过以与案例1相同的方式定义平均预测风险RT,1,RT,2,RT,SAT,我们可以从附录中的命题3中看到RT,1RT,SA→σXβ(1)- ρ) +σXβ(1)- ρ)(1 - ρ) /2+σas T→ ∞. (2) 显然,当这两个信息集不是高度相关时,SA可以提高预测性能。本案例给出了一个典型的CFI场景示例,寻求更积极的目标是找到候选预测的最佳线性组合是合适的。我们的观点是,对FCP的讨论应考虑不同的组合场景。接下来,我们对这两个案例进行蒙特卡罗研究,以提供谜题的解释。

15
大多数88 在职认证  发表于 2022-5-8 04:35:06
已经开发出适合CFA场景的组合方法,以最佳候选人的表现为目标。在我们的数值研究中,我们选择AFTER方法(Yang,2004)作为代表,我们知道AFTER方法比以最佳线性或凸加权为目标的方法付出的估计代价更小。相比之下,CFI场景的组合方法通常试图估计最佳权重。我们选择候选预测响应的线性回归(LinReg)作为代表。没有估计相关性的贝茨和格兰杰(1969)方法(简而言之,BG)被用作附加基准。对于案例1,我们进行如下模拟。设置σ=σX=1。考虑一个20β的序列,这样相应的信噪比(s/N)在对数尺度上均匀分布在0.05和5之间。对于每个β,我们进行以下100次模拟,以估计平均预测风险。产生了100个观测样本。前60个观测值用于构建候选预测模型,随后用于生成剩余40个观测值的预测。预测组合方法包括SA、BG、AFTER和LinReg方法,用于组合候选预测,最后20个观测值用于绩效评估。将每种预测组合方法的平均预测风险除以SA的平均预测风险,得到归一化平均预测风险(用归一化RT表示)。结果汇总在图1中。对于情况2,我们设置β=β=β,ρ=0,σ=σX=σX=1。其余模拟设置与案例1相同。图2总结了标准化平均预测风险(相对于SA)。在案例1中,从图1可以清楚地看出,在CFA场景下,AFTER是首选的选择方法。

16
mingdashike22 在职认证  发表于 2022-5-8 04:35:10
另一方面,LinReg的表现一直低于AFTER。有趣的是,当S/N相对较低(小于0.35)时,我们观察到LinReg的“谜题”表现比SA差,这是由于权重估计误差。如果分析员正确地识别出这是CFA场景,并采用类似AFTER的相应方法,“谜题”就会消失:AFTER可以比SA表现更好(或非常接近SA),而LinReg失败。在案例2中,如果分析员在没有意识到潜在的CFI场景的情况下应用后,我们观察到SA在应用后表现出色的“谜题”。“谜题”并不是完全令人兴奋,因为AFTER是针对最佳个体预测的性能而设计的,而(2)表明SA可以比最佳个体预测更好。当信噪比相对较高时,LinRegas似乎是正确的选择方法。然而,0.05 0.10 0.20 0.50 1.00 2.00 5.000.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1S/N合理化RTAfterbglinReg图1:(案例1)比较不同预测组合方法的平均预测风险(虚线代表SA基线;x轴为对数标度)。与案例1中观察到的情况类似,LinReg在N/N比率较低时会受到权重估计误差的影响,这再次让人感到“困惑”,LinReg的表现比SA差。案例2还显示了一个有趣的观察结果,即即使SA是有限意义上的“最佳”权重,应用SA也并不总是最佳的。事实上,(A.2)和(A.3)inProposition 3意味着,如果我们采用所有权重之和为1的共同限制,SA是渐近最优权重。然而,如果我们不限制权重范围,渐近最优权重会为每个候选预测分配一个单位权重。

17
何人来此 在职认证  发表于 2022-5-8 04:35:14
这就解释了在S/N比为0的情况下,LinReg比SA的优势。05 0.10 0.20 0.50 1.00 2.00 5.000.6 0.8 1.0 1.2 1.4 1.6S/n标准化RTAfterbglinReg图2:(案例2)比较不同预测组合方法的平均预测风险(虚线代表SA基线;x轴为对数标度)。它很大。上述观察结果表明,不同的组合方法可能具有显著不同的性能,这取决于潜在的场景。如果没有根据正确的场景正确选择组合方法,则可能出现FCP。在不了解潜在场景的情况下,比较这些方法可能无法提供FCP的完整情况,盲目应用SA可能会导致次优性能。我们提倡在考虑预测组合时,尝试识别潜在情景(CFAor CFI)。需要指出的是,当相关信息有限时,可能无法确定预测组合情景。在这种情况下,与袁和杨(2005)中描述的模型选择和模型组合(平均)的比较类似,强制选择将导致结果预测的变异性增大。更好的解决方案是预测的自适应组合,如下一节所示。5.多层次根据第4节中的理解,我们发现在考虑预测组合方法时,应该努力了解与最佳候选方法相比是否有很大的改进空间。

18
能者818 在职认证  发表于 2022-5-8 04:35:17
当由于要实时处理大量预测量而难以决定或无法实施时,我们可能会问:我们能否找到一种在CFA和CFI场景中都表现良好的自适应(或通用)组合策略?请注意,这里的自适应指的是适应预测组合场景(而不是适应以实现最佳个人绩效)。另一个问题是:在CFI情况下,当估计误差的价格较高时,自适应组合策略是否仍能像SA一样表现良好?正如我们在第4节案例2中所看到的,仅使用用于CFI场景的方法(如LinReg)无法成功解决第二个问题。事实证明,这两个问题的答案是肯定的。这个想法与克莱门等人(1995)的一个哲学评论有关:“任何预测组合都会产生一个预测。因此,给定预测集的特定组合本身可以被认为是一种可以竞争的预测方法……”预测(或程序)组合的使用在理论上是实现自适应极小极大优化的有力工具(见Yang(2004),Wang等人(2014))。在我们讨论的背景下,SA、AFTER和LINREG等组合预测都可以被视为候选预测,并可以作为预测组合方案中的单个候选预测。因此,我们设计了一个两步组合策略:首先,我们使用SA、AFTER和LinReg构建三个新的候选预测;其次,我们对这些新的候选预测应用AFTER算法来生成组合预测。我们将这种两步算法称为多级AFTER(简称mAFTER),因为它涉及两层AFTER算法。

19
nandehutu2022 在职认证  发表于 2022-5-8 04:35:20
关键在于第二步的AFTER算法,它允许mAFTER自动确定SA、AFTER和LinReg中最佳候选个体的性能。在CFA场景下,考虑到AFTER是正确的选择方法,mAFTER可以像我们单独使用AFTER一样执行。在CFI的情况下,mAFTER的表现接近SA和LinReg。因此,当LinReg避免严重的估计误差时,mAFTER将与SA紧密合作,从而避免高昂的成本。事实上,如果我们分别用^y(SA)t、^y(LR)和^y(M)t表示从SA、LinReg和mAFTER生成的预测,我们的命题1如下。提议1。在附录所示的规律性条件下,mAFTER策略的平均预测风险满足TXT=TE(yt- ^y(M)t)≤infinf1≤我≤KTTXt=TE(yt- ^yt,i)+阻塞(K)T,TTXt=TE(yt)- ^y(SA)t)+cT,TTXt=TE(yt)- ^y(LR)t)+cT,其中,C和一些不依赖于时间范围T的正常数有关。命题1是Yang(2004)定理5的结果。它表明,在平均预测风险方面,mAFTER可以与最佳原始个人预测、SA预测和LinReg预测(以最好的为准)的性能相匹配,订单价格相对较小,最多为log(K)/T。为了证实mAFTER策略可以解决上一节中所述的“难题”,我们重复案例1和案例2的模拟研究,并分别总结图3和图4中的结果。在案例1中,必须确保Mafter正确跟踪AFTER的性能。在案例2中,当S/N相对较大(>0.5)时,mAFTER利用机会改进原始的个体预测,并与LinReg表现非常接近;当S/N相对较小(<0.5)时,mAFTER的行为与SA非常相似,并成功避免了LinReg造成的严重估计误差。

20
能者818 在职认证  发表于 2022-5-8 04:35:24
因此,与依赖SA相比,像mAFTER这样的“复杂”组合策略可能是一种诱人的安全方法,可以避免FCP。请注意,mAFTER是一种相当通用的预测组合策略。在战略的第一步中,分析师可以选择自己生成新候选预测的方式(不一定限于AFTER和LinReg),只要它们包括SA、CFA场景的代表性方法和CFIscenario的代表性方法。在我们的研究中,AFTER和LinReg只是被选为方便的代表。我们还在第9.6节的真实数据示例中演示了mAFTER策略的性能。SA真的强大吗?与其他预测组合方法相比,SA被誉为表现最佳的方法之一。很明显,SA在传统的统计学意义上是不可靠的:即使是一个非常糟糕的候选人也可能会将组合预测的性能破坏到任意更糟的位置。一个更有趣的问题是在实际相关的环境中评估SA的健壮性。前两部分已经表明,SA在处理这两种不同场景时,其相对性能并不稳健。在本节中,我们表明,当新的预测候选对象被添加到候选库中时,SA即使在松散的意义上也不稳健,尤其是当新候选对象仅具有与原始候选库相关的冗余信息时。相比之下,后类型组合方法在添加较差或多余的候选预测时可能相当稳健。在这里,我们考虑以下三种情况。案例3。假设一个新的信息变量xt,3与xt,1的分布相同,且与zt无关-1和(xt,1,xt,2)。在案例2中,一个新的候选预测^yt,3=xt,3^βt,3加入候选池,其中^βt,3通过OLS估计和历史数据获得。案例4。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-12 06:28