近期一直在梳理工具变量检验问题,感觉一直在用这些命令,可是一直都很乱,看结果看的稀里糊涂。为了更好的纠正检验工具变量的过程,特将检验工具变量的命令整理如下,整理过程中存在部分疑虑和不确定地方,希望大家可以共同学习和纠偏。 存在的疑惑希望解答:
1、在利用ivreg2时,出现Stock-Yogo weak ID test critical values: <not available>是怎么回事?这样就无法将Cragg-Donald Wald F statistic与Stock-Yogo weak ID test critical values这个值进行对比了,还是只需要看Cragg-Donald Wald F statistic的F值大于10就好?
2、为什么在利用ivreg2时,有时候结果出现Sargan statistic,有时候出现Hansen J statistic呢?这两个检验显示的结果,如:Hansen J statistic (overidentification test of all instruments): 0.000,是不是就表明工具变量无效?
工具变量检验方法整理如下:
首先,进行hausman test,检验所有变量是否均为外生变量,H0:所有解释变量外生;P=0拒绝原假设 其次,如果工具变量个数>内生变量,则进行过度识别。
命令使用:利用estat overied进行验证。
结果判断: sargan test:H0:工具变量有效。
最后,弱工具变量检验:
方法1:偏R2
方法2:一阶段回归时,看F值,F>10拒绝存在“弱工具变量”的原假设
使用命令:estate firststage,all forcenonrobust(针对方法1和方法2)
结果判断:shea's partial R2的P=0、一阶段回归F>10
方法3:Cragg-Donald Wald F统计量,这里又说这个值>10即可,也有人说要大于Stock-Yogo weak ID test critical values在10%的水平,拒绝原假设,H0:存在弱工具变量。
方法4:Kleibergen-Paap rk LM statistic F值很大,P=0拒绝原假设。
使用命令:利用ivreg2
(补充弱工具变量的含义:两阶段最小二乘中,第一阶段回归是利用OLS建立每个内生变量关于工具变量和外生变量的回归,得到x_hat;第二阶段回归则利用x_hat来取代x,由此得到bei ta。弱工具变量则是cov(zi,xi)约等于0,即工具变量计划不能解释x的变动。)
以上为检验工具变量的基本方法。当工具变量个数=内生变量时,无法进行过度识别,当工具变量个数>内生变量时,进行过度识别检验。