这里的检验是Badi. H.Baltagi著《面板数据计量经济分析(4th Ed.)》书上第四章的内容,原假设(或天真假设或零假设),备择假设,统计量形式、检验效果等都是来自于此书。
前言
面板数据的模型类型现在按照因素和效应分成四个种类
图1 面板模型分类
所以,需要检验的情形为:
1.多个截面或时间序列模型与混合模型的检验。使用Chow检验的变体,为了应对异方差的Roy-Zellner检验。
2.混合模型和面板模型的检验。该检验是检测是否有必要采用面板模型。检验对比模型为混合OLS模型(pool model)和单因素固定效应模型。使用F检验进行检验。
3.单因素与双因素模型之间的比较。使用F检验和LM检验。
4.固定效应和随机效应检验。使用Houseman检验。需要说明的是固定效应和随机效应的划分在学界是有争议的,Paul D. Allison 认为是固定效应模型,Jeffery M. Wooldridge认为是随机效应模型,Badi. H. Baltagi 和Cheng Hsiao同时包容两者。
一、混合估计检验
检验目的是预测方程的参数是否在不同地区间相同或不同时间上相同。将横截面数据和时间序列混合研究的经济应用可以分为两类:(1)截面混合。即大量的个体和寥寥数期的时间序列。(2)对数据个体混合,个体混合的原理和截面混合的原理是一样的。
书上介绍了一般情形下的chow检验(chow检验是F检验),其后说明该检验效果很差,建议如果混合数据模型用于因素误差模型,应当使用Roy-Zellner检验。
${{\hat{F}}_{obs}}=\frac{{{y}'\left[{{{\hat{\Sigma }}}^{-1}}\left( {{Z}^{*}}{{\left( {{Z}^{*T}}{{{\hat{\Sigma}}}^{-1}}{{Z}^{*}} \right)}^{-1}}{{Z}^{*T}}-Z{{\left( {{Z}^{T}}{{{\hat{\Sigma}}}^{-1}}Z \right)}^{-1}}{{Z}^{T}} \right){{{\hat{\Sigma }}}^{-1}} \right]y}/{\left(N-1 \right)\left( K+1 \right)}\;}{{\left( {{y}^{T}}{{{\hat{\Sigma}}}^{-1}}y-{{y}^{T}}{{{\hat{\Sigma }}}^{-1}}{{Z}^{*}}{{\left({{Z}^{*T}}{{{\hat{\Sigma }}}^{-1}}{{Z}^{*}}\right)}^{-1}}{{Z}^{*T}}{{{\hat{\Sigma }}}^{-1}}y \right)}/{N\left( T-1\right)\left( K+1 \right)}\;}\sim F\left( \left( N-1 \right)\left( K+1\right),N\left( T-1 \right)\left( K+1 \right) \right)$
这里$Z$ 为约束模型(混合模型),${{Z}^{*}}$为无约束模型(多个截面或时间序列模型),$\hat{\Sigma }$ 为约束模型估计的误差方差矩阵。实际检验的时候可以分两步完成,第一步估计$\hat{\Sigma }$,并用${{\hat{\Sigma }}^{-{1}/{2}\;}}$左乘约束方程$y=Z\delta +e$ ,第二步运用Chow检验。很多软件支持Chow检验。
二、混合模型与个体效应和时间效应的检验
这部分处理前言中提到的第2、第3个情形。$u$ 是个体特殊效应,$\lambda$ 是时间效应。在这一部分的统计检验的原假设有相互之间具有一定关系的这么几种:
$H_{0}^{a}:\sigma _{\mu }^{2}=0$,$H_{0}^{b}:\sigma_{\lambda }^{2}=0$,$H_{0}^{c}:\sigma _{\mu }^{2}=\sigma _{\lambda }^{2}=0$,$H_{0}^{d}:\sigma_{\mu }^{2}=0\left( \sigma _{\lambda }^{2}>0 \right)$,$H_{0}^{e}:\sigma_{\lambda }^{2}=0\left( \sigma _{\mu }^{2}>0 \right)$
这五个原假设分别对应不存在个体效应,不存在时间效应,个体效应和时间效应都不存在,允许存在时间效应的情况下不存在个体效应,允许存在个体效应的情况下不存在时间效应。因而如果$H_{0}^{c}$ 被拒绝,应考虑使用某种类型的面板模型。也可以使用一个原假设$H_{0}^{c}:{{\mu }_{1}}=\cdots ={{\mu }_{N-1}}=0,{{\lambda}_{1}}=\cdots ={{\lambda }_{N-1}}=0$,并用F检验检验。还有一个取巧的方法(R语言中plm包中的解决方法)是检验对比模型为混合OLS模型(pool model)和单因素固定效应模型。使用F检验进行检验。
(一)Breusch-Pagan检验(BP检验)
基于信息矩阵构造LM统计量,在$H_{0}^{c}$的原假设条件下LM渐进服从${{\chi}^{2}}\left( 2 \right)$分布。在$H_{0}^{a}:\sigma _{\mu }^{2}=0$条件下LM1渐进服从${{\chi}^{2}}\left( 1 \right)$,在$H_{0}^{b}:\sigma _{\lambda }^{2}=0$条件下LM2渐进服从${{\chi}^{2}}\left( 1 \right)$。该检验在$\sigma _{\mu }^{2},\sigma _{\lambda }^{2}$接近于0的情况下表现良好。
(二)King, Wu(kw检验)和Honda(hongda检验)与标准化的拉格朗日乘子检验
解决了Breusch-Pagan检验中存在的双边检验问题。该检验是单边检验。Honda(1985)建议使用一种一致最有效检验来检验$H_{0}^{a}:\sigma _{\mu }^{2}=0$。统计量形式看书上p56式4-25。该统计量对非正态分布也是稳健的。但在回归变量较多或者一些变量之间存在内部相关性时,检验效果即使在大洋本情形下也是较差的。
对于$H_{0}^{a}:\sigma_{\mu }^{2}=0$建议采用SLM统计量,该统计量对单边LM统计量中心化和标准化,所以渐进服从$N\left( 0,1 \right)$分布。还有一种建议是采用局部均值最有效(locally mean most powerful, LMMP)单边检验。不过该检验与Honda的一致最有效检验相同。
对于$H_{0}^{b}:\sigma_{\lambda }^{2}=0$,单边Honda类型的LM统计量渐进服从$N\left( 0,1 \right)$分布。该统计量的平方对应于$L{{M}_{2}}$统计量。LMMP检验与Honda的一致最有效检验是相同的。
对于$H_{0}^{c}:\sigma_{\mu }^{2}=\sigma _{\lambda }^{2}=0$,Breusch-Pagan给出的双边LM检验是${{A}^{2}}+{{B}^{2}}\sim{{\chi }^{2}}\left( 2 \right)$,Honda推荐了一种“方便的”单边检验${\left( A+B \right)}/{\sqrt{2}}\;$,在$H_{0}^{c}$条件下服从$N\left(0,1 \right)$分布。遵循King和Wu,Baltagi等推导了对于$H_{0}^{c}$的LMMP单边检验。由下式给出。
$KW=\frac{\sqrt{T-1}}{\sqrt{N+T-2}}A+\frac{\sqrt{N-1}}{\sqrt{N+T-2}}B$,在$H_{0}^{c}$条件下服从$N\left(0,1 \right)$分布。
(三)Gourieroux,Holly和Manfort检验(GHM检验)
注意到实际应用中A、B可能是负的,在GHM之后,Baltagi等人提出的检验$H_{0}^{c}$的如下检验:
\[\chi _m^2 = \left\{ \begin{array}{l} {A^2} + {B^2}{\kern 1pt}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} A > 0,B > 0\\ {A^2}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} A > 0,B \le 0\\ {B^2} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} A \le 0,B > 0\\ 0{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} A \le 0,B \le 0 \end{array} \right.\]
其中$\chi_{m}^{2}$表示混合${{\chi }^{2}}$分布。在原假设条件下
$\chi _{m}^{2}\sim \left( \frac{1}{4} \right){{\chi }^{2}}\left( 0\right)+\left( \frac{1}{2} \right){{\chi }^{2}}\left( 1 \right)+\left(\frac{1}{4} \right){{\chi }^{2}}\left( 2 \right)$,其中${{\chi }^{2}}\left(0 \right)$以概率1等于0。这一检验对Honda和KW检验具有优势,因为不受A和B可能值得影响。
(四)条件LM检验
当使用HO统计量来检验$H_{0}^{a}$的时候,一个隐含的假定是不存在时间效应。这可能导致错误的判断。Baltagi等人提出$H_{0}^{d}:\sigma _{\mu }^{2}=0\left( \sigma _{\lambda }^{2}>0\right)$检验的$L{{M}_{\mu }}$统计量和$H_{0}^{e}:\sigma _{\lambda }^{2}=0\left( \sigma _{\mu }^{2}>0\right)$检验的$L{{M}_{\lambda }}$统计量。其中$L{{M}_{\mu }}$统计量趋近于单边Honda统计量HO。$L{{M}_{\lambda }}$统计量渐进服从于$N\left( 0,1 \right)$分布。
(五)ANOVA F检验和似然比检验
在单因素固定效应模型中,ANOVA的F统计量检验固定效应的显著性表现良好。
单边似然比检验(LR)采用如下形式:
$LR=-2\log \frac{l\left( res \right)}{l\left( unres \right)}$
其中$l\left(res \right)$表示(在原假设下)有约束的极大似然值,而$l\left( unres \right)$表示非约束的极大似然值。LR检验要求单因素和双因素误差模型的MLE估计量。在所考虑的原假设相同的条件下,LR检验统计量和LM检验统计量服从相同的渐进分布。
对于$H_{0}^{a},H_{0}^{b},H_{0}^{d},H_{0}^{e}$,$LR\sim\left( \frac{1}{2} \right){{\chi }^{2}}\left( 0 \right)+\left( \frac{1}{2}\right){{\chi }^{2}}\left( 1 \right)$,对于$H_{0}^{c}$,$LR\sim\left( \frac{1}{4} \right){{\chi }^{2}}\left( 0 \right)+\left( \frac{1}{2}\right){{\chi }^{2}}\left( 1 \right)+\left( \frac{1}{4} \right){{\chi}^{2}}\left( 2 \right)$
(六)蒙特卡洛结果
1.$H_{0}^{a}:\sigma _{\mu }^{2}=0$为真,$\sigma _{\lambda}^{2}$很大时,对于假设$H_{0}^{a}$的所有常规检验都很糟糕。因为他们忽视了$\sigma _{\lambda }^{2}>0$。实际上双边BP检验表现最差。过度拒绝原假设。而HO,SLM,LR和F的实际检验水平都低于名义检验水平。当$\sigma _{\mu }^{2}$变大时,在拒绝原假设$H_{0}^{a}$方面,所有的检验表现都良好,但是对于很小的正的$\sigma _{\mu }^{2}$,所有统计量的检验功效随$\sigma _{\lambda }^{2}$的增加而恶化。
2.$H_{0}^{d}:\sigma _{\mu }^{2}=0$(允许$\sigma _{\lambda}^{2}>0$)的检验。$L{{M}_{\mu }}$,LR和F统计量的表现良好。他们的实际检验水平并没有显著不同于名义检验水平。同时对于较大的$\sigma _{\mu }^{2}$,所有这些统计量都有很高的检验功效,以98%~100%的概率拒绝原假设。结果还显示过度设定模型,即把真实单因素模型($\sigma _{\lambda }^{2}=0$)设定成双因素模型($\sigma_{\lambda }^{2}>0$)并不影响这些检验的功效。最后,所有这些检验的功效都随着$\sigma _{\lambda }^{2}$的增大而提高。实际上,在检验方差分量时,过度设定模型优于模型设定不足。
3.$H_{0}^{c}:\sigma _{\mu }^{2}=\sigma _{\lambda }^{2}=0$,BP,HO,KW和LR的实际检验水平显著的低估了名义检验水平,而GHM和F统计量实际检验水平与名义检验水平没有显著不同。A和B的负值使得HO和KW估计的实际检验水平低估了名义检验水平。最后,与LR和LM统计量相比,ANOVA F统计量表现得相当好,即使对于非正态误差项,T固定,小样本,当$N\to \infty $,F检验仍能够得到渐进有效的。
关于预检估计量和系数估计:预检估计两首先用GHM检验,然后利用条件LM检验,$L{{M}_{\mu }}$统计量和$L{{M}_{\lambda }}$统计量。如果GHM没有拒绝原假设,预检估计量退化为OLS统计量。如果原假设被拒绝,进行$L{{M}_{\mu }}$和$L{{M}_{\lambda }}$检验。根据检验结果,预检估计量退化为单因素或双因素的可行广义最小二乘法(FGLS)估计量。蒙特卡洛模拟显示:根据真实GLS估计量的相对MSE修正的FGLS和MLE是最优估计量。但是研究者很难正确设定模型的形式,修正的FGLS估计量的相对MSE,预检估计量是次优的。对于误设的固定效应和随机效应,FGLS估计量的MSE会产生很大的误差。对于非正态假定和预检估计量的双倍显著性水平(10%而不是5%),上述结果依然如此。


雷达卡




京公网安备 11010802022788号







