本人最近在研究内生性问题,有一些总结和疑问,欢迎大家讨论。
1 内生变量与内生性:
在回归过程中由于解释变量和被解释变量互为因果、存在遗漏变量等原因,导致回归的误差项和解释变量存在相关性,这叫做内生性,而可以引入某个内生变量,或者工具变量消除这种内生性。
2 Heckman选择模型消除内生性
heckman模型第一步选择过程产生一个逆米尔斯数,这是消除选择过程的选择偏差产生的一个新的变量,可以看做是一个内生变量。如果第二步的回归中不引入逆米尔斯比,则存在遗漏变量导致的内生性问题,因此heckman模型解决了两个问题:1)消除选择偏差;2)解决遗漏变量导致第二部存在的内生性问题。(实质上可能是一个问题)
3 双工具变量模型(2SLS)
双工具变量模型我个人理解,认为它和heckman模型存在很大的相似之处。首先heckman第一步中引入而第二步没有引入的那些变量,实际上相当于2SLS模型第一步中引入用来代替内生变量的工具变量;而Heckman模型第二步引入的第一步所产生的逆米尔斯比数则相当于2SLS模型第二步中引入的工具变量。只不过heckman模型的第一步是一个二元响应变量的选择过程,而2SLS第一步响应变量是连续的。
4 干预效应模型(treatreg)
干预效应模型和Heckman模型相比,实际上是选择了所有的样本,而并非能观察到的样本。因此干预效应模型会对所有的样本产生一个逆米尔斯比,并且在第二步过程中不仅引入第一步产生的内生变量逆米尔斯比,而且还引入了第一步的因变量作为解释变量。个人觉得这个模型与Heckman模型的最大区别就是,它其实不是不选择样本,而是分别并且同时选择观察到的和观察不到的样本进行分析。但是这个时候如果只引入这个消除选择偏差的逆米尔斯比,而不选择样本,则会导致没有控制住内生的选择变量(第一步的因变量)。因此干预模型将选择变量引入第二部的回归中,相当于作为了一个控制变量,有效地剔除了选择偏误,当然这没有直接对样本进行限制的效果好。(这块可能说的有点绕)
说了这么多,希望大家来讨论下以下几个问题:
1)上面说heckman模型解决了内生性问题,那么它解决的仅仅是遗漏逆米尔斯比的内生问题还是同时解决了互为因果关系所导致的内生性问题?
2)Heckman模型和干预效应模型的实际区别仅仅是选择样本的不同吗?(heckman是选择观察到的样本,干预效应模型分别且同时选择观察到的和观察不到的样本)


雷达卡










京公网安备 11010802022788号







