|
伍德里奇课本上的经典案例:在一个研究犯罪率的研究里,研究者让犯罪率和失业率进行回归,一般正常来说,失业率越高犯罪率应该越高,因为失去工作的人更可能参与抢劫、偷窃等犯罪活动,但是这个研究的一元回归发现,失业率前面的系数是负的!后来这个研究者加入了一个控制变量——五年前相应地区的失业率(这是一种计量控制方法,相当于控制了很多没有加入的变量,你可以理解为是加入了一个”文化传统、社会结构“这样类型的变量),控制了其他因素后,系数变成正的了.
这个例子是说,你可能是在一元回归里忽略了很多重要变量.一元回归的结果是可能是错误的.
为什么会有这样的效应呢?这是因为如果遗漏了重要变量,回归的结果会有偏误:真正的X1的系数B1会偏误为(如果我们假设X2是被遗漏的变量),B1(有偏)=B1(无偏)+B2*L12 .其中L12是X1、X2的相关系数,B2是X2的无偏系数,如果B2*L12很大的话,可能会改变B1(有偏)的方向.例如例子1里,B1(无偏)是正的(女性记忆力好),B2是正的(教育多,记忆力好),L12是负的(女性教育相对男性少),由于B2*L12的绝对值很大,导致了B1(有偏)变成负的了.
|