我觉得关键问题在于,内生性的原因不是单一的,遗漏变量,测量误差,联立因果...
那么能力这个解释变量首先是因为无法度量被omitted了,遗漏变量产生的内生性问题满足,解决这个层面内生性的方法之一是使之可以被度量,那么就用iq作为他的代理变量,iq显然和u高度相关,因为iq和能力高度相关。
然后iq引入后,却存在测量误差引起的内生性问题,具体这个测量误差是什么,书上没有解释清楚,我猜是除了能力,其他被忽略的变量也可以影响iq得分,比如健康状况啊,学区教学质量之类的,所以这个iq和能力以外的其他omitted variable也相关,也就有内生性问题了。
那么就用工具变量,包括母亲的受教育程度、其他能力测试得分、地理区域等等作为工具变量来获得一个iq的拟合值,这个拟合值不再是单纯的一个分数,而是一些其他体现能力的变量的结合,还记得能力才是我们真正担心的内生变量吗?这些和能力有关的变量满足了“相关性”,又与能力以外的其他omitted variable认为无关,满足了“外生性”,iq的拟合值也就不再有内生性问题了。、
总之,有的内生性,仅仅是omitted variable造成的,代理变量引入后,就解决了,而且代理变量本身不存在问题,而书里面的代理变量还有其他问题,这两者并不是无关,但并不总是关联的。
|