楼主: 可人4
1951 35

[量化金融] 关于预测组合难题 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-5-8 04:35:27
一个新的候选预测值^yt,3=xt,2^βt,2与预测值2相同,加入candi0。05 0.10 0.20 0.50 1.00 2.00 5.000.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1S/N合理化RTAFTERLINREG图3:(案例1)适应情景下的mAFTER性能(虚线代表SA基线;x轴为对数刻度)。案例2中的日期池。案例5。新的候选预测^yt,3=~xt,2~βt,2是使用转换后的信息变量^xt,2=exp(xt,2)生成的,其中^βt,2是通过OLS估计和历史数据获得的。请注意,案例3中的新候选者是一个非常糟糕的预测,而案例4和案例5中的新候选者包含信息变量的子集。在上述所有案例中,没有新信息添加到候选库中。按照与案例2相同的模拟设置,我们将重点放在SA和AFTER上,并计算比率be0。05 0.10 0.20 0.50 1.00 2.00 5.000.6 0.8 1.0 1.2 1.4 1.6S/n标准化RTAFTERMAFTERLINREG图4:(案例2)mAFTER在改善情景下的性能(虚线代表SA基线;x轴为对数刻度)。在案例2中,添加新候选人后的MSFE和MSFE之间。图5显示,添加非信息性或冗余候选预测后,AFTER的性能几乎保持不变,而SA的性能恶化。7.不恰当的加权公式:FCP的来源一般来说,流行的预测组合方法通常隐含地假设时间序列和/或预测误差是平稳的。

22
nandehutu2022 在职认证  发表于 2022-5-8 04:35:30
理论上,如果我们能够获得足够长的历史数据,它们应该表现良好。0.05 0.20 1.00 5.001.0 1.1 1.2 1.3 1.4 1.5 1.6病例3S/NMSFE比率0。05 0.20 1.00 5.001.00 1.02 1.04 1.06 1.08 1.10情况4S/NMSFE比率0。05 0.20 1.00 5.001.0 1.1 1 1.2 1.3 1.4案例5S/NMSFE比率图5:研究SA对添加新候选预测的稳健性。然而,在实践中,当DGP发生变化,候选预测无法快速适应新的现实时,这种导出的加权公式往往不合适。例如,人们通常认为结构突变可能会意外发生,使候选预测的相对性能不稳定,并给我们留下SA表现良好的印象。接下来,我们用一个蒙特卡罗例子来说明结构断裂下的FCP。我们没有假设信息变量发生确定性变化(Hendry和Clements,2004),而是考虑DGP动态中的突变:yt=Pk=1β1,kyt-k+εtif 1≤ T≤ 50,β2,1yt-1+β2,2yt-2+εtif 51≤ T≤ 100,β3,1yt-1+εtif 101≤ T≤ 150,其中系数βj,k(j=1,2,3)是从(0,1)上的均匀分布随机生成的,εt是i.i.d.N(0,1)。在这里,结构断裂发生在t=50和t=100。候选预测模型是从滞后1到滞后6的自回归,以及weapply SA、BG、LinReg和AFTER来生成组合预测。模拟重复100次,最后100个时间点作为评估期,以获得平均预测风险。为了进行比较,我们考虑了BG、LinReg和AFTERmethods,其估计滚动窗口大小rw=20或40,这意味着仅使用最新的rw观测值来估计每个预测的权重。结果汇总在表1中。

23
mingdashike22 在职认证  发表于 2022-5-8 04:35:34
平均预测风险与SA有关,括号内的数字为标准误差。表1:比较结构突变下不同组合方法的标准化平均预测风险。SA LinReg BG后标准1.000 1.026(0.011)1.005(0.003)1.047(0.010)rw=40 1.000 1.060(0.033)0.992(0.002)0.991(0.009)rw=20 1.000 1.64(0.42)0.980(0.003)0.952(0.007)我们可以从表1中看出,当使用所有历史数据确定权重时,由于候选预测的相对性能不稳定,三种标准组合方法的性能均低于SA。当我们将估计窗口缩小到最近的40和20个时间点时,BG和AFTER在SA上实现了更好的性能,而LinReg的性能恶化。当我们缩小权重估计窗口时,有两个相反的因素可以理解这个结果。当仅使用最新预测时,我们减少了旧数据支持的加权公式的偏差,但同时增加了估计权重的方差。在所考虑的三种方法中,估计误差因素占主导地位。另一方面,AFTER的设计并不是为了积极瞄准最佳重量,因此从缩小的滚动窗口中获益最大。由于结构突变对预测组合方法的复杂影响,可以说,重点应该放在如何检测问题上(例如,见Altissimo和Corradi,2003;Davis等人,2006),以及如何相应地提出新的组合形式(例如,使用最新的观察结果来避免不恰当的加权公式)。

24
nandehutu2022 在职认证  发表于 2022-5-8 04:35:37
然而,在实践中很难正确识别结构断裂,这个例子表明,在存在结构断裂的情况下,SA的相对性能不如BG和naively Chosen滚动窗口后的性能。8.将预测模型筛选与FCPIn实证研究联系起来,候选预测模型通常以某种方式进行筛选/选择,以生成一组较小的候选组合。如第6节案例3所示,SA的性能尤其容易受到性能不佳的候选模型的影响。模型筛选的常见做法可能有助于提高SA的性能。接下来,我们用一个蒙特卡罗例子来说明筛选的影响。让我们来看看∈ Rp(p=20)是由均值为0、协方差为∑的多变量正态分布随机生成的p维信息变量向量,其中(∑)i,j=ρi-j |和ρ=0或0.5。考虑一个线性模型设置为YT=xTtβ+εt的DGP,其中系数β=(3,3,2,1,1,1,1,0,0,···,0)和ε皮重i.i.d.N(0,σ),σ=2或4。在此设置下,XT中只有前7个变量对yt重要,而其余变量是冗余的。如果我们假设分析员可以完全访问信息向量xt,我们可以用信息变量的任何子集建立线性模型作为候选预测。这是从王等人那里知道的。

25
kedemingshi 在职认证  发表于 2022-5-8 04:35:40
(2014)如果我们使用ABC标准(Yang,1999)选择大小合适的最佳子集模型,或通过适当的自适应组合方法(Yang,2001)组合子集回归模型,预测风险可以自适应地在软稀疏函数类和硬稀疏函数类上实现最小最大最优性。受这一结果的启发,我们考虑以下筛选和组合方法。首先,给定模型的大小(即acandidate线性模型中使用的信息变量的数量),根据估计均方误差选择最佳OLS模型。第二,从第一步选择的p模型中,根据ABC标准找到模型的前X%(X=10,20,40,60,80)。请注意,大小为r的子集模型的ABC准则是ABC(r)=Pnt=1(yt)- ^yt,r)+2rσ+σlog公共关系, 式中,n为估计样本量,^yt,ris为拟合响应,σ可由估计均方误差代替。两步筛选后的剩余子集模型用于构建候选预测以进行组合。在模拟中,总时间范围设置为200。筛选程序应用于前100个观测值,其余模型用于构建后100个时间点的候选预测。采用了不同的预测组合方法,并使用最近50次观测结果对其性能进行了评估。模拟重复100次,表2总结了标准化平均预测风险(相对于SA)。表2显示,AFTER的表现优于包括SA在内的所有其他竞争对手。这与我们对典型CFA场景的理解是一致的,在这种情况下,正确选择组合方法是正确的。然而,当我们减少X并选择少量候选预测集进行组合时,SA的性能逐渐接近之后的性能。

26
kedemingshi 在职认证  发表于 2022-5-8 04:35:43
这样的结果并不完全令人惊讶,因为当只选择前几个模型时,简单地对它们进行平均,可以获得与通过适当的子集选择或组合方法获得的最佳结果类似的结果(Wanget al.,2014)。在CFA的情况下,LinReg不是一个合适的选择,与SA相比,它似乎表现不佳。随着X的减小,LinReg受权重估计误差的影响变小,并且LinReg的性能相对于SA有所提高。从这个例子中,我们可以看出SA的性能对筛选的程度并不可靠。一般来说,确保最佳筛选以使SA表现良好是一项非常具有挑战性的任务。因此,虽然SA在这个特殊的例子中对于积极筛选(保留很少的候选人)效果相对较好,但总体上不应首选SA。如果没有一个好的筛选/选择规则,分析员就没有太多的自由来做出糟糕的决定。

27
能者818 在职认证  发表于 2022-5-8 04:35:47
我们注意到,一个可能的解决方案是首先创建新的候选预测(例如,通过线性回归方法生成的预测表2:比较筛选程序后不同预测组合方法的归一化平均预测风险。Top X%10%20%40%60%80%σ=2,ρ=0在0.9980.9890.9660.9510.945BG 1.000 0.999 0.9970.9970.997 0.996INREG 1.017 1.024 1.056 1.0981.151σ=2,ρ=0.5在0.9960.990.958 0.956 0.990.000后970.996LinReg 1.013 1.024 1.043 1.095 1.159σ=4,ρ=0.5在0.994 0.987 0.981 0.981 0.974BG 0.999 0.998 0.998 0.997LinReg 1.002 1.012 1.056 1.101 1.163σ=4,ρ=0.5在0.995 0.990.976 0.969 0.961BG 1 0.000 0.998 0.997 0.997 0.997LinReg 1.0301或利用最重要的信息,然后,通过对原始预测和组合预测应用多级事后方法(第5节中介绍),可以发挥良好筛选/选择规则的作用,以减少表现不佳或重复预测的影响。9.真实数据示例在本节中,我们研究了美国专业预测师协会(Society of Professional Forecasters)的数据集,以评估SA和mAFTER策略。该数据集是对美国宏观经济预测的季度调查。Lahiri等人(2013年)通过采用两种缺失预测插补策略(称为回归插补(REG插补)和简单平均插补(SA插补)来生成完整的面板,很好地处理了缺失预测。正如Lahiri等人(2013)所指出的,1990年数据管理机构的变化以及随后丢失的数据模式的改变,使得很难使用整个数据周期进行有意义的评估。

28
何人来此 在职认证  发表于 2022-5-8 04:35:50
因此,我们继承了他们的缺失预测插补和预测选择策略,并将重点放在1968年第4季度到1990年第4季度这段时间,以评估Mafter策略的绩效。考虑了三个宏观经济变量:经季节性调整的GDP物价变动年率(PGDP)、实际GDP增长率(RGDP)和季度平均月失业率(UNEMP)。RGDP和PGDP的数据集有14个候选预测,UNEMP的数据集有13个候选预测。每个预测都会提前提供g季度(g=1、2、3、4)预测。我们使用给定的缺失预测插补方法,将SA、AFTER、BG、LinReg和mAFTER应用于宏观经济变量的每个SPF数据集。每个预测组合方法使用总时间范围的前四分之一来建立初始权重,剩余时间点用于计算每个方法相对于toSA的归一化MSFE。通过取对应于1,2,3,4四分之一预测的四个MSFE的平均值,我们总结了表3中不同组合方法的性能。从表3可以看出,尽管在不同的目标宏观经济变量下,AFTER的表现相当不同,但mAFTER策略为所有三个变量提供了整体稳健的表现。对于PGDP,AFTER表现最好,比SA高出10%。与SA相比,使用mAFTER成功地保持了这一优势。

29
大多数88 在职认证  发表于 2022-5-8 04:35:53
对于RGDP,whileSA和BG在预测后高达13%,mAFTER成功地将性能提升到表3:将预测组合方法的性能与SPF数据集进行比较(显示的值是在预测前1,2,3,4个季度的标准化MSFE平均值)。mAFTERREG插补PGDP 1.00 1.88 0.95 0.90 0.90RGDP 1.00 1.64 1.00 1.11 1.01UNEMP 1.00 1.79 0.99 0.98 0.98SA-插补PGDP 1.00 2.17 0.98 0.95 0.95RGDP 1.00 1.83 1.13 1.03UNEMP 1.00 1.69 0.99 0.97 0.98后的目标变量SA LinReg BG在SA的3%范围内。最后,对于UNEMP变量,SA、BG和毕竟表现非常相似,差异不超过3%,mAFTER的表现与SA或之后没有太大差异。积极追求最佳权重的LinReg方法在所有三个目标变量中表现不佳。有趣的是,从图6中可以看出,对于PGDP和RGDP变量,SA和之后的最大绩效差异出现在一个季度的预测中;在每一种情况下,马夫特都能与SA和之后的强者相匹配。10.结论在看似神秘的FCP的启发下,我们解释了为什么经常出现模糊现象,并研究了与简单平均(SA)相比,复杂的组合方法何时能很好地工作。我们的研究表明,以下原因可能会导致这个谜题。首先,估计误差是FCP的一个重要来源。理论和经验证据都表明,相对较小的样本量可能会阻止mAFTER1Q-ahead2Q-ahead3Q-ahead4Q-AHEADPG归一化MSFE0后的一些梳理。4 0.6 0.8 1.0 1.2 1.4BG在mAFTER1Q-ahead2Q-ahead3Q-ahead4Q-AHEADRGDP标准化MSFE0之后。4 0.6 0.8 1.0 1.2 1.4图6:将不同预测组合方法的标准化MSFE与REG估算的SPF数据集进行比较。左面板:PGDP变量。

30
kedemingshi 在职认证  发表于 2022-5-8 04:35:57
右面板:RGDP变量。对于每种方法,从左到右的条形分别代表1、2、3、4个季度的预测结果。虚线表示SA基线。通过可靠地估计最优权重来确定组合方法。第二,如果我们在不考虑底层数据场景的情况下应用一种组合方法,FCP就会出现。SA的相对性能可能在很大程度上取决于哪个场景更适合数据。第三,组合方法的加权公式并不总是适用于数据,因为结构突变和冲击可能会意外发生。通过复杂方法获得的权重公式不能足够快地适应现实,导致性能不如SA稳定。第四,候选预测通常会以某种方式进行筛选,以便用于组合的其余预测往往具有类似的性能,而SA在这种情况下可能会运行良好。然而,SA可能对筛选过程敏感,扩大候选人才库可能有利于其他组合方法;因此,对SA在模型筛选后效果良好的经验观察应该持保留态度。第五,可能存在公开偏见,即当SA给出良好的经验结果时,人们倾向于报告FCP的存在,但当SA给出平庸的结果时,可能不会强调SA的表现。关于上述前两个原因,我们的研究表明,不难找到数据并以某种方式建立候选预测,以支持复杂或简单的方法。在CFA的情况下,我们意识到,通过应用旨在针对最佳候选预测性能的组合方法,可以避免沉重的估计价格。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 16:36