混合建模实际就是在同一个数据文件下,建立多组方程的方法,这种方法的应用主要是希望建立线性模型,因为经济生活中,经常需要使用模型进行预测,而非线性模型很难确保下一期的稳定性,也就是预测的不确定性很大,所以尽管变量间多数是呈现非线性关系,但我们仍然希望训练出线性模型。
下面看一下常用的局部线性平滑的方法。
| (1)线性模型的前提是变量间的线性关联,线性相关程度越大,模型拟合的越好,并利用OLS估计,使其残差最小,不过该算法对异常值很敏感,会导致部分散点的垂直偏差过大。 变量间显非线性关系时,如果仍使用OLS估计的话,其实线性关系之外的散点均可视为异常值,那么残差势必增加。见下图 |
(2)虚线是整体拟合线,如果分而拟合的话,效果一定会很好,不过问题是如何选择拐点或门限,直接选择显然太过主观,关于寻找拐点的方法也很多, 门限自回归的那一类的算法适用于时序数据,截面数据比较常用的是局部线性平滑的方法。 下面这个图形更能说明局部线性平滑过程。
| |
| (3)使用局部线性的方法,对训练出的线性模型会更便于解释。 一般使用不同带宽(带宽内权重相同)来计算交叉验证的结果——除去某样本点后,计算预测值与观察值离差的平方和最小。找到带宽与最小值的最佳点,然后做出取舍。 该方法考虑了散点的分布疏密性、局部性和整体性等诸多优点,因此应用很广泛。 |