多重共线性,是我们学习计量几乎入门时就会接触的一个专业名词。对多重共线性的认识,仅限于在做回归时看一看相关性系数表(而且一般都不会有问题),再了不起的就是算一下VIF。但其实对它并没有一个直观的认识。也就是,在实际处理数据的时候,多重共线性会导致什么问题,或者说如何影响回归结果?
在正式进入这个问题之前,我想指路一个连玉君老师在知乎上的回答,问题是,加入某个控制变量后原解释变量不显著了是什么原因(链接见文末)。他的case III就是讲多重共线性。其实连老师的回答和置顶评论已经解释了原理,但我却是在自己实际跑数据时,遇到这个问题之后才深刻理解了它。这里,我也就用一个跑数据的例子,来直观地展示多重共线性,是如何影响我们做论文时朝思暮想的“星星”的。
https://zhuanlan.zhihu.com/p/360436120