原文信息:Blundell, R. and Bond, S., 1998. Initial Conditions and Moment Restrictions in Dynamic Panel Data Models. Journal of Econometrics 87, 115-143.
在经济学实证研究中,panel data相对于cross-sectional data而言有很多优势,其一是可以控制一些随时间不变的individual effects和一些随个体不变的time effects,如果这些不可观测因素与解释变量有关系的话,panel data提供了一个不需要在估计方程外寻找instrumental variables的解决方案。相对于cross-sectional data而言,由于可以对同一个cross-sectional unit观测很多期,panel data还可以研究因变量的动态变化趋势以及自变量对因变量的短期影响和长期影响,这就是所谓的dynamic panel data model。一般的动态面板模型,都是通过将因变量的滞后一期作为解释变量来实现,比如
Y(it)=aY(it-1)+bX(it)+c(i)+u(it)。
其中i表示第i个cross-sectional unit,t表示第t期的观测值,c(i)是随时间不变的individual effects。当t期的自变量X(it)增加一个单位时,t期的Y(it)会随之增加b个单位,因此b代表X对Y的短期影响。当Y(it)增加b个单位时,Y(it+1)又会增加ab个单位,Y(it+2)又会增加a^2b个单位,一直下去直到无穷,所以X对Y的长期影响便是b+ab+a^2b+…...=b/(1-a),如果a<1,那么长期影响是大于短期影响的,而这种dynamic impact在cross-sectional data里是没办法研究的。
Arellano and Bond (1991)提出先对动态方程做一阶差分,从而消除individual effects,得到Y(it)- Y(it-1)=a(Y(it-1)-Y(it-2))+b(X(it)-X(it-1))+(u(it)-u(it-1)),因为u(it)-u(it-1)跟Y(it-1)-Y(it-2)存在相关性,差分后的方程不能直接使用OLS进行估计。Arellano and Bond (1991)假设u(it)是序列无关的,因此可以利用Y(it-2)作为内生变量Y(it-1)-Y(it-2)的instrumentalvariable。这是因为一方面Y(it-2)与Y(it-1)-Y(it-2)相关,另一方面Y(it-2)与u(it)-u(it-1)不相关。同理,Y(it-3),Y(it-4),……,Y(1)都可以作为Y(it-1)-Y(it-2)的IV。如果我们假设X(it)是严格外生的,那么所有期的X也可以作IV。使用这样的工具变量就可以得到参数a和b的Generalized method of moments (GMM) estimators,这样的估计方法在实证文献里又叫Differenced GMM estimator。但是很多simulationstudies发现,Arellano-Bond estimator表现得并不好,尤其是当样本量不是很大的时候。Blundell and Bond (1998)指出当a比较接近于1,或者c(i)的方差相对于u(it)的方差非常大的时候,Y(it-2)与Y(it-1)-Y(it-2)的相关性会趋近于0,换句话说,Y(it-2)并不是Y(it-1)-Y(it-2)的一个好的IV,而是一个weak IV。当工具变量比较weak的时候,GMM estimator通常表现相当不稳定,在有限样本下,估计的bias会比较大,同时估计的方差也会很大。
为了克服这个问题,Blundell and Bond (1998)提出可以不需要对原始方程做一阶差分,如果我们定义v(it)=c(i)+u(it)为复合的error term,那么我们可以将方程写为Y(it)=aY(it-1)+bX(it)+v(it)。相对于一阶差分后的方程,Blundelland Bond称原始方程为level equations,并以滞后一阶的因变量差分(Y(it-1)-Y(it-2))做为level equation的IV,之所以这样做,一方面是因为Y(it-1)-Y(it-2)和Y(it-1)有关,而且Blundell and Bond (1998)证明即使a接近于1,或者c(i)的方差相对于u(it)的方差非常大,Y(it-1)-Y(it-2)和Y(it-1)的相关性也不会趋近于0,而是一个固定的正常数。另一方面Y(it-1)-Y(it-2)与v(it)无关。当然一般情况下Y(it-1)-Y(it-2)与v(it)是有关系的,毕竟v(it)含有individual effects c(i),但是在一些假设下,Y(it-1)与v(it)的相关性刚好与Y(it-2)与v(it)的相关性抵消,这一条件由Blundell and Bond (1998)的方程(4.5)给出,这是一个关于初值Y(i1)的条件,描述的是Y(i1)如何依赖于individualeffects以及u(i1),而这一条件在Arellano and Bond (1991)的Differenced GMM的估计框架中是并不需要的,所以从这个角度来说,Blundell and Bond (1998)推荐的IV是没有Arellanoand Bond (1991)的IV robust的,因为前者需要这个关于初值Y(i1)的假设,而后者是不需要的。
为了综合利用差分和level的IV,Blundell and Bond (1998)推荐将两个IV结合在一起,从而实现得到更精确的GMM估计。具体来讲,用(Y(it-2),Y(it-3),…,Y(i1),X(i1),X(i2),…,X(iT))做differencedequation Y(it-1)=a(Y(it-1)-Y(it-2))+b(X(it)-X(it-1))+(u(it)-u(it-1))的IV,而用Y(it-1)-Y(it-2)做levelequation Y(it)=aY(it-1)+bX(it)+v(it)的IV,因为对每个个体i而言,有T-2个differencedequations和T-2个level equations,所以总共就会2(T-2)的估计方程。运用GMM估计这些方程即可得到a和b的consistent estimators,这就是所谓的System GMM estimators。Blundell and Bond (1998)通过一个simulationexperiment和一个估计劳动需求函数的empirical example验证了System GMM estimators比Differenced GMM estimators具有更小的bias和方差。在应用计量经济学研究中,这两个estimators也成为估计动态面板模型最常用的两个方法,在常用的统计软件,包括STATA和R中都有相应的命令快速计算这两个estimators,并有相应的Sargan-Hansen overidentification test来检验这两个estimators中使用的IV的有效性。
参考文献
Arellano, M., Bond, S.R., 1991. Some Tests of Specification for Panel Data: Monte Carlo Evidence and an Application to Employment Equations. Review of Economic Studies 58, 277-297.
Abstract: Estimation of the dynamic error components model isconsidered using two alternative linear estimators that are designed to improvethe properties of the standard first-differenced GMM estimator. Both estimatorsrequire restrictions on the initial conditions process. Asymptotic efficiencycomparisons and Monte Carlo simulations for the simple AR(1) model demonstratethe dramatic improvement in performance of the proposed estimators compared tothe usual first-differenced GMM estimator, and compared to non-linear GMM. Theimportance of these results is illustrated in an application to the estimationof a labour demand model using company panel data.
转自:香樟经济学术圈
相关文献:http://www.sciencedirect.com/sci ... e170c1622dea3c7207e
-------------------------------2016年5月27日10:41:17