使用工具变量是因为存在内生性,无法使用OLS来得到β的无偏估计量。我们设定一个模型之后最重要的就是求出β的值,从而预测某些指标。
用OLS可求β,但是OLS的前提假设是1.线性假定 2.{y,x}是渐进独立的平稳过程,即独立同分配 3.前定解释变量,即X与U不相关 4.满秩 5.U的期望值为零 ;然而如果存在内生性,违反了OLS的假设,无法使用此估计方法,所以利用工具变量消除内生性,并采用2SLS法来解决。
具体的例子,比如研究工资(lwage)和经验(exper)、经验的平方(expersq)、教育(educ)之间的线性关系,先对其进行回归,由于怀疑丢失了重要的核心变量能力(ability),且能力和教育可能高度相关,所以有内生性问题,且能力不可测。所以考虑用父亲和母亲的教育程度作为教育的工具变量。stata中具体指令如下:
reg lwage exper expersq educ
reg educ exper expersq motheduc fatheduc
predict educp ,xb
predict educr ,residuals
//2SLS
reg lwage exper expersq educp
ivregress 2sls lwage exper expersq (educ = motheduc fatheduc) ,first
estat endogenous
// regression-based Hausman test
reg lwage exper expersq educ educr
|