楼主: 腾文耀景
35558 9

[统计软件] 工具变量的几个检验标准(不可识别检验\弱IV检验\过度识别检验) [推广有奖]

  • 0关注
  • 2粉丝

已卖:11份资源

讲师

54%

还不是VIP/贵宾

-

威望
0
论坛币
14194 个
通用积分
155.0088
学术水平
27 点
热心指数
23 点
信用等级
23 点
经验
5510 点
帖子
243
精华
0
在线时间
140 小时
注册时间
2020-9-7
最后登录
2022-4-11

楼主
腾文耀景 发表于 2022-4-8 15:32:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

用IV做2SLS回归时,需要对IV进行三个方面的检验:
1.不可识别检验,也就是IV的个数是否少于内生解释变量的个数,使用的统计量是Anderson LM 统计量/Kleibergen-Paap rk LM统计量。这里p值小于0.01说明在 1%水平上显著拒 绝“工具变量识别不足”的原假设,也就是要求p值不能大于0.1。加robust是Kleibergen-Paap rk LM统计量,不加robust是Anderson LM 统计量。也就是说在iid情况下看Anderson LM 统计量,在非iid情况下看Kleibergen-Paap rk LM统计量。

2.弱IV检验,弱IV是指IV与内生解释变量的相关性不强,微弱相关,弱IV会导致用IV估计的结果与用OLS,FE估计的结果相差很大,甚至符号完全相反。如果有较多工具变量,可舍弃弱工具变量,因为多余的弱工具变量反而会降低第一阶段回归的 F 统计量。弱IV的判断有以下四个标准:
(1)偏R2,也就是Shea's partial R2,不过xtivreg2不汇报这个统计量,得用命令

estat firststage, all forcenonrobust,汇报第一阶段的结果。

(2)最小特征统计量,minimum eigenvalue statistic,这是Stock and Yogo (2005)提出来的,stata会在ivreg2中给出临界值。Staiger and Stock (1997)建议只要该值大于10就认为不存在弱IV。这个值用于iid的情况。

(3)Cragg-Donald Wald F统计量,由Cragg and Donald (1993)提出,Stock and Yogo (2005)给出其临界值,Stata在回归时会给出临界值。CDW检验一般过15%,10%的临界值就可以,过了5%的临界值更好。名义显著性水平为5%的检验,其真实显著性水平不超过15%。也就是Stock-Yogo weak ID test critical values的15%相当于5%,也就是说要求CDW统计量大于15%的临界值就行。如果IV数量小于3则不会给出Stock-Yogo weak ID test critical values: 5%/10%/15%/20% maximal IV relative bias 。如果假设扰动项为iid,则看CDW检验统计量。如果不对扰动项作iid的假设,则看KP W rk F统计量。所以加r选项时才有KP W rk F统计量,不加则没有。不管加不加r选项,CDW统计量总有。通常建议加上r选项。

(4)Kleibergen-Paap Wald rk F统计量,Stock and Yogo (2005)给出其临界值,Stata在回归时会给出临界值。注意与不可识别检验的统计量的区别。对于CDW统计量和KP W rk F统计量要从估计偏误和检验水平扭曲两个方面进行判断是否存在弱IV问题。

一般情况下这四个值都会看,基本上几个值都是同向变化的。

3.过度识别检验,过度识别的前提是该模型至少是恰好识别的,也就是有效IV至少与内生解释变量一样多,愿假设是H0:所有IV都是外生的,拒绝愿假设意味着至少有一个IV不是外生的,与扰动项相关。三个统计量:

(1)Sargan统计量。Stata默认给出Sargan统计量。如果内生变量的数目和工具变量的数目完全相同。此时无需执行过度识别检验,因为模型是恰足确认的(equation exactly identified)。这里要求p大于0.1。

(2)Hansen J统计量,加选项robust时汇报Hansen J统计量,不加robust选项时汇报Sargan统计量。也就是说iid时用Sargan统计量,非iid时用Hansen J统计量。

(3)C统计量,加orthog(varlist),varlist为需要检验外生性的变量。与过度识别约束检验有关的另一个检验是对工具变量子集是否符合外生性假定的检验,可通过 difference-in-Sargan 统计量进行; 该统计量由两个 Sargan( 或 Hansen-J) 之差构成,也称为 C 统计量。

在xtivreg和xtivreg2后面还可加first和ffirst选项,如果选择first,窗口中就会直接显示first-stage的regression output;如果选择ffirst,则会显示first-stage中检测IV的相关性等的test statistics。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:过度识别检验 过度识别 工具变量 可识别 eigenvalue

沙发
梦及深海的鱼 学生认证  发表于 2022-4-22 00:30:19 来自手机
腾文耀景 发表于 2022-4-8 15:32
用IV做2SLS回归时,需要对IV进行三个方面的检验:
1.不可识别检验,也就是IV的个数是否少于内生解释变量的 ...
谢谢您的详细介绍!!我想请问一下,如果过度识别检验没有通过,这样的工具变量选取是否可以呢?

藤椅
蛋蛋family 发表于 2022-4-23 17:24:39
如果找了多个工具变量,是否能分别进行回归呢?这样就不存在过度识别问题了

板凳
离影。 学生认证  发表于 2023-8-18 23:06:07
你好,我用的xtivreg,末尾只能加first,没法加ffirst,否则运行不了。但是first之后,没有相关的检验结果,Kleibergen-Paap rk LM、Sargan统计量、C统计量等等都没有。可以帮我指出问题吗?我的代码是
  1. xtivreg gtfp pgdp indstr govn techno infrastr envir i.year (AIk=IVAIk),fe vce(cluster city) first
复制代码
,结果是:
  1. First-stage within regression

  2. Fixed-effects (within) regression               Number of obs     =      3,120
  3. Group variable: city                            Number of groups  =        252

  4. R-sq:                                           Obs per group:
  5.      within  = 0.9747                                         min =          1
  6.      between = 0.8705                                         avg =       12.4
  7.      overall = 0.9502                                         max =         14

  8.                                                 F(20,251)         =    1989.50
  9. corr(u_i, Xb)  = -0.3147                        Prob > F          =     0.0000

  10.                                  (Std. Err. adjusted for 252 clusters in city)
  11. ------------------------------------------------------------------------------
  12.              |               Robust
  13.          AIk |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
  14. -------------+----------------------------------------------------------------
  15.         pgdp |   .0038575   .0027935     1.38   0.169    -.0016441    .0093591
  16.       indstr |   .0000701   .0000934     0.75   0.453    -.0001138     .000254
  17.         govn |    .004005   .0016811     2.38   0.018      .000694    .0073159
  18.       techno |  -.0020586   .0007488    -2.75   0.006    -.0035333    -.000584
  19.     infrastr |   .0003776   .0014568     0.26   0.796    -.0024915    .0032467
  20.        envir |   .0000699   .0000289     2.41   0.016     .0000129    .0001268
  21.              |
  22.         year |
  23.        2004  |  -.0061736   .0030407    -2.03   0.043    -.0121622   -.0001851
  24.        2005  |  -.0112756   .0033772    -3.34   0.001    -.0179269   -.0046243
  25.        2006  |  -.0199704   .0038059    -5.25   0.000     -.027466   -.0124749
  26.        2007  |  -.0269708   .0033469    -8.06   0.000    -.0335623   -.0203792
  27.        2008  |  -.0345374   .0037823    -9.13   0.000    -.0419864   -.0270883
  28.        2009  |  -.0324016   .0040917    -7.92   0.000      -.04046   -.0243431
  29.        2010  |  -.0261155   .0042601    -6.13   0.000    -.0345055   -.0177255
  30.        2011  |  -.0311164   .0047522    -6.55   0.000    -.0404757   -.0217572
  31.        2012  |   -.028963   .0050594    -5.72   0.000    -.0389274   -.0189987
  32.        2013  |  -.0212655   .0052027    -4.09   0.000    -.0315121    -.011019
  33.        2014  |  -.0137974   .0054841    -2.52   0.012    -.0245982   -.0029966
  34.        2015  |  -.0051134    .006168    -0.83   0.408     -.017261    .0070341
  35.        2019  |   .1467271   .0086244    17.01   0.000     .1297418    .1637125
  36.              |
  37.        IVAIk |   .2822273   .0077384    36.47   0.000     .2669868    .2974678
  38.        _cons |  -.0712263   .0175786    -4.05   0.000    -.1058466    -.036606
  39. -------------+----------------------------------------------------------------
  40.      sigma_u |  .01604235
  41.      sigma_e |  .01508184
  42.          rho |  .53083105   (fraction of variance due to u_i)
  43. ------------------------------------------------------------------------------

  44. Fixed-effects (within) IV regression            Number of obs     =      3,120
  45. Group variable: city                            Number of groups  =        252

  46. R-sq:                                           Obs per group:
  47.      within  = 0.1779                                         min =          1
  48.      between = 0.1533                                         avg =       12.4
  49.      overall = 0.1602                                         max =         14


  50.                                                 Wald chi2(20)     =    4971.66
  51. corr(u_i, Xb)  = -0.1292                        Prob > chi2       =     0.0000

  52.                                  (Std. Err. adjusted for 252 clusters in city)
  53. ------------------------------------------------------------------------------
  54.              |               Robust
  55.         gtfp |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
  56. -------------+----------------------------------------------------------------
  57.          AIk |   .1837372   .1085543     1.69   0.091    -.0290253    .3964997
  58.         pgdp |   .1173014   .0286063     4.10   0.000     .0612341    .1733686
  59.       indstr |  -.0009287   .0007695    -1.21   0.227     -.002437    .0005796
  60.         govn |  -.0188937   .0135137    -1.40   0.162    -.0453801    .0075927
  61.       techno |    .016946   .0052083     3.25   0.001     .0067379    .0271542
  62.     infrastr |  -.0398589    .011779    -3.38   0.001    -.0629453   -.0167725
  63.        envir |   .0000485    .000243     0.20   0.842    -.0004278    .0005247
  64.              |
  65.         year |
  66.        2004  |   .0683866   .0222275     3.08   0.002     .0248216    .1119517
  67.        2005  |   .0715909   .0239276     2.99   0.003     .0246937    .1184881
  68.        2006  |   .0706417   .0249783     2.83   0.005     .0216852    .1195982
  69.        2007  |   .0436143   .0206444     2.11   0.035     .0031521    .0840765
  70.        2008  |   .0521505   .0231808     2.25   0.024     .0067168    .0975841
  71.        2009  |   .0613152   .0247696     2.48   0.013     .0127676    .1098628
  72.        2010  |   .0534754   .0262967     2.03   0.042     .0019348     .105016
  73.        2011  |   .0410794   .0286876     1.43   0.152    -.0151473    .0973061
  74.        2012  |   .0555402   .0319633     1.74   0.082    -.0071066    .1181871
  75.        2013  |     .02436   .0359475     0.68   0.498    -.0460959    .0948158
  76.        2014  |   .0369005   .0383688     0.96   0.336     -.038301     .112102
  77.        2015  |   .0397575   .0417701     0.95   0.341    -.0421103    .1216254
  78.        2019  |   .0421519   .0630375     0.67   0.504    -.0813993    .1657031
  79.              |
  80.        _cons |    1.13175   .1551886     7.29   0.000     .8275861    1.435914
  81. -------------+----------------------------------------------------------------
  82.      sigma_u |   .1008023
  83.      sigma_e |  .10615799
  84.          rho |  .47413945   (fraction of variance due to u_i)
  85. ------------------------------------------------------------------------------
  86. Instrumented:   AIk
  87. Instruments:    pgdp indstr govn techno infrastr envir 2004.year 2005.year
  88.                 2006.year 2007.year 2008.year 2009.year 2010.year 2011.year
  89.                 2012.year 2013.year 2014.year 2015.year 2019.year IVAIk
  90. ------------------------------------------------------------------------------
复制代码

报纸
yanyulu313 学生认证  发表于 2023-8-26 11:16:19
离影。 发表于 2023-8-18 23:06
你好,我用的xtivreg,末尾只能加first,没法加ffirst,否则运行不了。但是first之后,没有相关的检验结果 ...
xtivreg就是这样的,很多检验做不了。建议用xtivreg2

地板
离影。 学生认证  发表于 2023-9-20 16:46:52
yanyulu313 发表于 2023-8-26 11:16
xtivreg就是这样的,很多检验做不了。建议用xtivreg2
好的,谢谢你,用xtivreg2就可以了~

7
叶子huanghua 在职认证  学生认证  发表于 2023-12-7 17:17:36
yanyulu313 发表于 2023-8-26 11:16
xtivreg就是这样的,很多检验做不了。建议用xtivreg2
你好!用xtivreg2 后面无法estat endog,那我要怎么样才能检验是否有内生性呢?

8
赵安豆 发表于 2024-5-24 21:34:47
2. 弱IV检验还包括:
(2)F统计量:第一阶段的F统计量应该较大且显著,通常期望其值大于10。
(3)Km统计量:这是Kragten的多重共线性诊断,若小于10,则可能有弱工具变量。
(4)Stock-Yogo强IV检验或Hansen J统计量:用于检测工具变量的整体强度和外生性。

3. 过度识别检验(Over-identification test),当IV数量超过内生解释变量时,可以进行过度识别检验。主要使用Ramsey RESET测试或者Sargan-Hansen J统计量来检查工具变量是否超出了所需的识别条件。Sargan-Hansen J统计量的p值大于0.1表明工具变量是合适的,即不显著拒绝原假设,表示模型没有过度识别问题。

总结:在进行2SLS回归时,需要对IV进行不可识别检验、弱IV检验和过度识别检验,确保所使用的工具变量有效且合理。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



9
Anio_ 学生认证  发表于 2024-7-18 23:13:07
离影。 发表于 2023-9-20 16:46
好的,谢谢你,用xtivreg2就可以了~
请问用xtivreg的命令是什么?

10
qiwenyeQWY 发表于 2025-3-23 16:00:10
您好!我的过度识别检验报错是这样的:
no overidentifying restrictions
工具变量和解释变量个数相同,这个没有过度识别限制是无需做吗还是怎么

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 21:11