比如一个多元线性回归 y =a + b*x1 + c*x2 + e
多重共线性:是指变量x1和x2两个序列之间有很强的相关性(可以检验他们两个的相关系数),想象一种极端,x1和x2有一一对应的关系(完全相关,x2=2*x1),那么回归方程就变成了 y = a + (b+2c)x1+e,所以你只能估计出b+2c,并不能分别估计出b和c,这样就可以总结出多重贡献导致的问题,即:当共线性很严重时,参数的估计会出现错误或有偏,极端情况是有些参数无法估计出来。解决办法有很多种:建议可以自己去参考教材,大部分书籍都会讲怎么解决。
交互作用:是指一个变量x1如何影响x2对Y的关系的影响,或者x2如何影响x1对Y的关系的影响。模型可以变为y =a + b*x1 + c*x2 + d*x1*x2+e,要检验x1如何影响x2与y的关系,可以对x2求导:y = c+d*x1,说明x2与y的关系会随x1的变化而变化,具体怎么影响,要看c和d的符号。同理也可以检验x2如何影响x1与y的关系,对x1求导就可以了。
异同:多重共线性是一种回归出现的计量问题,这个问题会影响我们的回归参数的估计结果。而交互作用是一种研究问题的手段,通过设计交互项来说明我们想要验证的假设。所以这是两类不同的问题,一个是方法,一个是实际问题。 在做研究时,交互项的加入也可能导致多重共线性问题,比如上面加交互项的模型,x1,x2,x1*x2三者之间很有可能存在多重共线性。反过来,多重共线性问题可能导致交互项结果估计不准确,从而导致你验证不了你的假设。在交互项中解决多重共线性的一个方法是:变量去中心化,也就是x1,x2减去他们的均值再回归。


雷达卡




京公网安备 11010802022788号







