样本内预测和样本外预测的比较
样本内预测(in-sample forecasts)指使用模型预测样本内的值,其与实际观测值的差异即残值。例如在预测季度通货膨胀率变动的模型中,样本的数据为1962-2004年的季度通货膨胀率变动数据,根据预测的模型,我们可以计算样本内,即1962-2004年的季度通货膨胀率变动数据,再将其与实际观测值相比较,观察残值的大小。
样本外预测(out-sample forecasts)指使用模型预测样本外的值,体现了模型对现实世界的预测能力。例如在上述预测季度通货膨胀率变动的模型中,样本的数据为1962-2004年的季度通货膨胀率变动数据,但我们可以通过回归模型预测2005年及以后年份的季度通货膨胀变动。在实际中,样本外预测主要用于检验回归模型的可靠程度。
如果针对一组数据,不同时间序列模型均显著,则计算均方误差根(RMSE,root mean squared error),均方误差小的模型更优。均方误差根(RMSE)在计算上接近于前文提到的标准误差(),即残差平方和均值的平方根。但在判断模型的可靠性时,我们不能使用标准误差,即不能使用样本内的数据,而是应该使用样本外的数据。例如在季度通货膨胀率变动的模型中,我们应该使用2005年以后的季度通货膨胀变动数据的预测值和实际值之间的差异来判断该模型的可靠程度。通过样本外数据计算的均值方差根越小,说明模型对未来的预测能力越好。