8660 1

[宏观经济学政策] 实证中常用Stata操作命令和代码总结(2) [推广有奖]

  • 3关注
  • 84粉丝

学术权威

92%

还不是VIP/贵宾

-

威望
0
论坛币
394079 个
通用积分
1053.2698
学术水平
25 点
热心指数
23 点
信用等级
10 点
经验
235534 点
帖子
3479
精华
0
在线时间
5950 小时
注册时间
2020-11-11
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
实证中常用Stata操作命令和代码总结分享(2)注(来源于211统计课堂,属于好文分享,如有侵权联系我立马删除)
2.异方差检验
Breusch-Pagan test in STATA:其基本命令是:estat hettest var1 var2 var3
其中,var1 var2 var3 分别为你认为导致异方差性的几个自变量。是你自己设定的一个
滞后项数量。同样,如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性。
White检验:其基本命令是在完成基本的OLS 回归之后,输入imtest, white
如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性

处理异方差性问题的方法:方法一:WLSWLS是GLS(一般最小二乘法)的一种,也可以说在异方差情形下的GLS就是WLS。在WLS下,我们设定扰动项的条件方差是某个解释变量子集的函数。之所以被称为加权最小二乘法,是因为这个估计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。在stata中实现WLS的方法如下:reg (被解释变量) (解释变量1) (解释变量2)…… [aweight=变量名]其中,aweight后面的变量就是权重,是我们设定的函数。一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。在stata中也可以方便地实现:首先做标准的OLS回归,并得到残差项;reg (被解释变量) (解释变量1) (解释变量2)……
predict r, resid
生成新变量logusq,并用它对所有解释变量做回归,得到这个回归的拟合值,再对这个拟合值求指数函数;gen logusq=ln(r^2)
reg logusq (解释变量1) (解释变量2)……
predict g, xb
gen h=exp(g)
最后以h作为权重做WLS回归;reg (被解释变量) (解释变量1) (解释变量2)…… [aweight=h]如果我们确切地知道扰动项的协方差矩阵的形式,那么GLS估计是最小方差线性无偏估计,是所有线性估计中最好的。显然它比OLS更有效率。虽然GLS有很多好处,但有一个致命弱点:就是一般而言我们不知道扰动项的协方差矩阵,因而无法保证结果的有效性。

序列相关性问题的检验与处理

序列相关性问题的检验:
首先,要保证所用的数据必须为时间序列数据。如果原数据不是时间序列数据,
则需要进行必要的处理,最常用的方法就是:
gen n=_n
tsset n
这两个命令的意思是,首先要生成一个时间序列的标志变量n(或者t 也可以);
然后通过tsset 命令将这个数据集定义为依据时间序列标志变量n定义的时间序列数据。
最直观的检验方式是通过观察残差分布,其基本步骤是在跑完回归之后,直接输

Predict error, stdp
这样就得到了残差值;然后输入命令:
plot error n
会得到一个error 随n 变化的一个散点图。
D-W检验——对一阶自相关问题的检验:D-W检验是对一阶自相关问题的常用检验方法,但是如果实际问题中存在高阶
序列相关性问题,则不能用这个检验方法。
D-W 检验的命令如下:
首先,输入回归命令,
reg Variable1 Variable2 Variable3…VariableM
输出一个简单的OLS估计结果。然后,再输入命令:
dwstat
这时会输出一个DW  统计量。通过与临界值之间的比较,可以得出结论。也可
以执行如下命令
estat durbinalt 直接进行Durbin检验。

Breusch-GodfreyTest in STATA——检验高阶序列相关性:
在得到一个基本回归结果和error 之后,我们假设这样一个关系:
et = α0 + α1 et-1 + α2 et-2 …+ αk et-p + β1 x1t + β2 x2t … +βk xkt +εt
BG  检验的原假设是:H0  :  α1 = α2 = … αp =0。
其基本命令是:
bgodfrey , lags(p)
其中p  是你自己设定的一个滞后项数量。如果输出的p-value 显著小于0.05,则
可以拒绝原假设,这就意味着模型存在p  阶序列相关性;如果输出的p-value 显
著大于0.05  甚至很大,则可以接受原假设,即不存在p  阶序列相关性。
处理序列相关性问题的方法——GLS: 常用的几种GLS  方法:
(1) Cochrane-Orcutt estimator 和Prais-Winsten estimator
其基本命令是
prais var1 var2 var3, corc
(2) Newey-West standard errors
其基本命令是
newey var1 var2 var3, lag(3)
其中,lag(3)意思是对三阶序列相关性问题进行处理;如果需要对p  阶序列相
关性问题进行处理,则为lag(p) t因变量,g,f,c是自变量,_26存放了弟26个观测值,为需要预测的值reg t g f c if _n!=26点预测predict taxpredict if _n==26
均值的区间预测predictnl py=predict(xb),ci(lb ub) l(95)
因变量的区间预测adjust g=117251.9 f=24649.95 c=99.9,stdf ci level(95) Hausman检验是检验内生性的最常用的方法。它是通过比较一致估计量与有效估计量的Wald统计量。
命令格式为:
  .hausman name-constistent [name-efficent] [,options]其中,name-cosistent指一致估计的结果, name-efficent 指有效估计的结果。注意,一致、有效估计量的先后顺序不能改变。Option选项:constant  计算检验统计量将常数也包括在内,默认值为排除常数
allegs 利用所有方程进行检验,默认只对第一个方程进行检验
skipeqs(eqlist) eqlist只能以方程名称而不能以方程序号表示
equation(matchlist) 比较设定的方程。
force 即使假设条件不满足仍进行检验
df(#) 默认值为一致估计与有效估计的协方差矩阵的差的估计
sigmamore 协方差矩阵采用有效估计量的协方差矩阵
sigmaless   协方差矩阵采用一致估计量的协方差矩阵
tconsistent(string)  一致估计量的标题
tefficient(string) 有效估计量的标题
工具变量估计
命令格式:
.ivregress esitimator depvar [varlist1] [varlist2=varlist_iv] [if] [in] [weight][,options]
其中,estimator包括2sls,gmm,liml三种。varlist1为模型中的外生变量,varlist2为模型中的内生变量,varlist_iv为模型中的工具变量。Nonconstant  不包括常数项
Hascons  用户自己设定常数项
CMM 选项:
  wmatrix(wmtype)  robust,cluster clustvar,hac kernel, unadjusted
  center  权数矩阵采用中心矩
  igmm 采用迭代GMM估计
  eps(#) 参数收敛标准。默认值为eps(le-6)
  weps(#)  权数矩阵的收敛标准。默认值为w eps(le-6)
Vce(vcetype) unajusted,robust,cluster clustvar,bootstrap,jackknife,hac kernel
level(#)置信区间
First 输出第一阶段的估计结果
Small 小样本下的自由度调整
.estat firststage [,all forcenonrobust]该命令给出第一阶段的估计结果以及各种统计量,包括排除外生变量的相关性检验。All选项给出所有的拟合优度统计量。如果模型存在多个内生变量,则stata给出R2、偏R2、调整的R2 、F统计量;如果模型存在多个内生变量,则stata给出Shea偏R2和调整的偏R2。
forcenonrobust给出最小特征值统计量及其临界值,即使采用稳健估计(这一检验的假设条件是误差项为独立正态分布)。
        estat overid[,lag(#) forceweights forcenonrobust]
该命令给出了过度识别约束检验。如果使用2sls估计估计,则Stata给Sargan’s(1958)和Basman’s(1960)卡方统计量,这也是Wooldridge’(1995)稳健得分检验。如果采用liml估计方法,则stata给出Anderson and Rubin’s(1950) 卡方统计量以及Basmann F统计量;如果采用GMM估计,则stata给出hansen’s(1982)J统计量。Lags(#)用于计算得分检验的HAC(异方差自相关一致)统计量的过程中进行去噪时设定滞后阶数。如果设定lag(0),则表示不进行去噪处理。默认选择为lag(1)。这一选择仅使用于2sls估计方法和设定vce(hac)选项情况。
Forceweight    表示即使采用aweights,pweights或iweights也进行检验。Stata仅对于fweights的情况进行检验,其他权数所得到临界值可能不准确。
Forcenonrobust  指在2sls或LIML估计中即使采用稳健标准差也进行Sargan and Basmann检验(这一检验的假设的假设条件是误差项为独立正态分布)。
例子:log(wage)=a+b*educ+c*exper+d*expersq+u怀疑模型教育(educ)具有内生性问题,利用父母接受教育的年数(fatheduc,motheduc)作educ的工具变量估计上述模型。
(1)利用2SLS估计模型
.ivregress 2sls lwage exper expersq (educ=fatheduc motheduc),first第一阶段回归结果为:
  educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper
              (21.34)      (5.62)       (4.39)       (1.12)
         - 0.001expersq
             (-0.84)
第二阶段的估计结果为:
lwagehat=0.05+0.06educ+0.04exper-0.001expersq
              (0.12)     (1.95)      (5.29)       (-2.24)

(2)检验educ的内生性
.quietly  ivreg  iwage exper expersq {educ=fatheduc motheduc}
.est store IV_reg
.quietly regress lwage exper expersq educ
.est store LS_reg
.hausman IV_reg LS_reg
可以得到hausman估计量=2.7,P值=0.44。接受原假设,即educ是外生的。

2.随机效应模型估计:
xtreg  gdp invest culture sci health admin techno,re
检验随机效应模型是否优于混合OLS 模型:
在进行随机效应回归之后,使用xttest0
检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型
3. 最大似然估计Ml:
xtreg  gdp invest culture sci health admin techno,mle

Hausman检验
Hausman检验究竟选择固定效应模型还是随机效应模型:
第一步:估计固定效应模型,存储结果
xtreg  gdp invest culture sci health admin techno,fe
est store fe
第二步:估计随机效应模型,存储结果
xtreg  gdp invest culture sci health admin techno,re
est store re
第三步:进行hausman检验
hausman fe
Hausman检验量为:
H=(b-B)′[Var(b)-Var(B)]-1(b-B)~x2(k)
Hausman统计量服从自由度为k的χ2分布。当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型
如果hausman检验值为负,说明的模型设定有问题,导致Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等
可以改用hausman检验的其他形式:
hausman fe, sigmaless
对于固定效应模型的异方差检验和序列相关检验:
Xtserial gdp invest culture sci health admin techno

异方差检验:
xtreg  gdp invest culture sci health admin techno,fe
xttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model)
随机效应模型的序列相关检验:
xtreg  gdp invest culture sci health admin techno,re
Xttest1
Xttest1用于检验随机效应(单尾和双尾) 、一阶序列相关以及两者的联合显著
检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著
可以使用广义线性模型xtgls对异方差和序列相关进行修正:
xtgls  gdp invest culture sci health admin techno, panels(hetero),修正异方差
xtgls  gdp invest culture sci health admin techno, panels(correlated),修正依横截面而变化的异方差
xtgls  gdp invest culture sci health admin techno, panels(hetero) corr(ar1),修正异方差和一阶序列相关ar(1)



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata fixed effect Nonconstant newey-west

沙发
DEGE16125111 发表于 2022-4-21 21:22:03 |只看作者 |坛友微信交流群
求问,为什么p值足够小是不存在异方差性呢?应该是存在异方差吧?毕竟是拒绝同方差假定

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 23:04