8、 更高级的问题来了:您是否听说过变量的内生性呢?如果模型一不小心出现了内生变量怎么办,会对模型结果产生什么样的影响呢?我们有哪些手段可以去判定一个模型是否存在内生变量呢?
如果发现模型确实存在变量内生的情况,我们有哪些办法可以去解决它呢?请举例说明。这个问题奖励会比较高哦。
什么是变量的内生性呢?
对于多元回归模型:
我们知道高斯—马尔科夫假定,MLR.4假定是条件均值为零的假定,即给定自变量的任何值,误差μ的期望值都为0.当假定MLR.4成立时,我们说我们具有外生解释变量(exogenous explanatory variables),如果出于某种原因自变量xj与μ仍相关,那么xj就被成为内生解释变量(endogenous explanatory variable)。这就是变量的内生性。我们举个例子说明一下。
典型的一种内生形式是联立性,即联立方程模型(simultaneousequations
model),我们给出劳动的供给和需求方程
令qts=qtd=qt
显然,这两个方程的被解释变量与解释变量完全一样。如果直接做回归,那么估计的究竟是需求函数还是攻击函数呢?两者都不是。如下图所示:
因为OLS能够成立的重要条件之一是MLR.4,否则,OLS的估计量将是不一致的,即无论样本容量多大,OLS估计量都不会收敛到真实的总体参数。一般来说,这是无法接受的,然而,内生变量是如此的常见。那么我们怎样去解决这样一个问题呢,工具变量法是一个不错的方法。既然OLS的不一致性是因为内生变量与扰动项相关而引起,如果我们能够将内生变量分成两部分,即一部分与扰动项相关,另一半部分与扰动项不相关,那么就有希望用与扰动项不相关的那部分得到一部分估计。这可以通过工具变量来实现。
工具变量法
假设在图10.1中,存在某个因素使得供给曲线经常移动,而需求曲线基本不动,此时就可以估计需求曲线,见下图。这个使得供给曲线移动的变量就是工具变量。假设影响供给方程扰动项的因素可以分解为两部分,即可以观测的气温xt与不可观测的其他因素:
假设气温xt是个前定变量,与两个扰动项都不相关,即Cov(xt,μt)=0, Cov(xt,νt)=0.由于气温xt的变化使得攻击函数沿着需求函数移动,这使得我们可以估计出需求函数。在这种情况下,称气温xt为工具变量(intrumental variable)。一个有效的工具变量应该满足相关性和外生性两个条件。相关性是指工具变量和内生变量相关,外生性是指工具变量与扰动项不相关。
从上式也可以看出,如果工具变量与内生变量无关,即无法定义工具变量估计。如果工具变量与内生变量的相关性很弱,则会导致估计量方差变得很大,这被称为“弱工具变量问题”。传统的工具变量法一般通过两阶段最小二乘法(Two Stage Square,简记为2SLS或TSLS)来实现。即通过两个回归来完成。
第一阶段回归:用内生解释变量队工具变量回归,得到拟合值;
第二阶段回归:用被解释变量队第一阶段回归的拟合值进行回归;
但是使用工具变量法的前提是存在内生解释变量,这需要检验。如何从统计上检验解释变量是否为内生呢?由于扰动项不可观测,因此无法直接检验解释变量与扰动项的相关性。但如果找到有效的工具变量,则可以借助工具变量来检验变量的内生性。有以下几种方法:
1.“豪斯曼检验”:基本思路是把可能存在测量误差的解释变量与工具变量做回归,将得到的残差序列作为解释变量加入初始的模型,如果残差序列是显著的,则说明存在测量误差,反之不存在。具体步骤为:1)、对所研究的回归模型,无论是否存在测量误差,先采用OLS法得到参数估计量;2)、对可能存在的测量误差的解释变量,选择与其相关的工具变量,将可能存在测量误差的解释变量对选择的工具变量回归,并且获得回归残差;3)、将回归残差作为解释变量加入第一步的回归模型,再次进行OLS回归,得到回归残差的参数估计值和显著性检验结果;4)、若参数估计值显著,则存在观测误差,反之不存在。
但是传统的豪斯曼检验不适用于异方差的情形。
2.“杜宾—吴—豪斯曼检验”,该检验在异方差的情形下也适用,更为稳健。
这是我对第8个问题的相关整理结果。


雷达卡



京公网安备 11010802022788号







