根据Guo和Tse(2013)提出的最大相对论(maximized relativeRMSE)准则,选择分解过程中添加的高斯噪声的振幅。图2描述了应用于美国实际年度房价的分解示例。有关插图,请参见Dua和Ray(1995)。有关该方法的更多详细信息,请参见Wu和Huang(2009)图2:将原始(1strow)实际年度美国房价分解为6个系列。最后一行(直线)是EEMD过程的剩余部分。在分解过程中,每个IMF的频率随着其指数的增加而下降。Wu et al(2007)提出,每个IMF代表时间序列的不同动态,波动性较大的IMF描述了该现象的短期动态,波动性较小的IMF描述了该现象的长期趋势。Moghtaderi等人(2013年)在此框架基础上提出了一种基于分解的趋势提取技术。他们认为,应将长期趋势作为总和而非独立的IMF进行检查,因为各个IMF之间分散着个体特征,并且并非仅在一个IMF中孤立。换句话说,他们认为长期趋势是1)低频IMF和2)EEMD分解的最终残差的总和。扩展了Moghtaderi等人(2013)的观点,我们认为所有IMF都可以进行评估,以构建初始时间序列的短期动态表示和长期趋势函数。前者是更多挥发性IMF总和的结果,而后者可以按照Moghtaderi等人(2013)描述的程序获得。因此,分离问题可以分解为选择最合适的IMF指数,该指数定义了短期和长期动态之间的界限。
使用数学符号,上述平滑函数表示为: 哪里是索引初始序列的平滑变量, R IMF总数,R最终EEMD残差,以及我们开始求和的IMF指数。例如,在图3中,将实际房价序列分解为5个IMF和最终残差。通过将第3、4和5条厚度与最终残差相加,我们得到了图3红色曲线的平滑函数。图3:美国实际房价及其EEMD平滑序列。2.4支持向量回归(SVR)支持向量回归是Vladimir Vapnik(1992)提出的经典支持向量机算法的直接扩展,起源于统计学习领域。尽管该方法能够提供具有高泛化能力的准确预测,但它尚未引起人们对经济学和金融时间序列信息的浓厚兴趣。在为数不多的实证应用中,Rubio et al(2011)基于SVR模型预测电力负荷,而Papadimitriouet al(即将推出)开发了用于电能市场定向价格预测的SVM模型。H"ardle et al(2009)评估了公司的违约风险,SVMand"agüt et al(2012)扩展了银行业的违约风险预测。Khandaniet al(2010)使用SVR模型进行私人信贷风险评估,Papadimitriou et al(即将出版)使用SVR模型进行衰退预测。最后,Gogas等人(2013)在机器学习框架下比较了简单总和和除数货币总量,以预测美国GDP。其基本思想是找到一个线性函数,该函数最多与数据集的实际值存在预定偏差。
方向性预测是房地产市场参与者和政策主管部门的主要兴趣所在,因为正如所讨论的那样,房价的未来方向可能是商业周期当前和未来阶段的指标。为了测试所提出的EEMD-EN-SVR方法对实际房价指数的预测能力,我们将其与几种备选的5070901101301501701902101890189418989811902190619101914191819221926193419381942194619501954195819621966197019741978198219861990199419982002200620010Schiller指数预测模型进行了比较。除了EEMD-EN-SVR之外,我们还开发了一个随机游走(RW)和一个简单的自回归版本,没有任何额外的解释变量labeledEEMD AR SVR;仅将房价指数的平滑部分和波动部分的过去值用作输入变量。根据最小样本MAPE选择EMD AR SVR和EEMD-EN-SVR模型的最佳滞后结构。对于EEMD-AR-SVR模型,我们为波动分量选择了两个滞后,为平滑分量选择了六个滞后。按照第2节中描述的BVAR模型的收缩方案,我们引入了所有预测值的滞后值,并让EN从中选择信息量最大的预测值。换句话说,在BVAR框架中,EN可以选择变量的第二个滞后,但排除第一个滞后,这与经典VAR模型相反。EN为平滑部分选择一个输入变量,为平滑部分选择36个输入变量。此外,我们还开发了自回归条和BVAR模型,这些模型已在房价预测文献中广泛使用。BVAR模型收缩过程的一个关键优势是,它们适应数据特征,排除了相关变量,并侧重于预测方面信息更丰富的变量。