楼主: wxyrocky
10356 8

[Stata高级班] 关于xtabond2 中gmm选项的设置问题 [推广有奖]

  • 6关注
  • 2粉丝

VIP

已卖:165份资源

教授

54%

还不是VIP/贵宾

-

威望
0
论坛币
101635 个
通用积分
31.2785
学术水平
8 点
热心指数
9 点
信用等级
7 点
经验
25741 点
帖子
598
精华
0
在线时间
2245 小时
注册时间
2005-11-15
最后登录
2025-10-18

楼主
wxyrocky 发表于 2010-2-8 00:29:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
连老师:
       您好!
      我看到有篇外文文章在附录中给出的stata程序如下:
xi: xtabond2   roa 1.roa    12.roa   bsize  indep dual risk  debt i.year, gmm(roa bsize indep dual risk debt, lag(3 4) collapse) iv(i.year) twostep   robust small
说明:1.roa、12.roa分别表示roa的一阶滞后和二阶滞后。

我觉得作者把roa放在gmm中是错误的,应该替换成1.roa和12.roa才对,我的理解是gmm中不能放因变量(即使roa是内生变量),只能放自变量,不知我的理解是否正确?(我正在写类似的论文,我发现放与不放roa的结果差别很大)
      还有,lag(3 4) 后collapse不知起什么作用,在什么情况下需要加上这个选项?(我试了下,发现加上后检验指标发生了大幅度变化,有些原先能够通过检验但加上后无法通过,有些则正好相反)尽管看了stata上的说明,但感觉还不是很明白,恳请给予指点,谢谢!
另外,2SLS和GMM是不是只对线性函数形式适用,对非线性的不适合?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:XTABOND abond GMM abo tab 设置 GMM 选项

沙发
arlionn 在职认证  发表于 2010-2-8 10:20:03
wxyrocky 发表于 2010-2-8 00:29
连老师:
       您好!
      我看到有篇外文文章在附录中给出的stata程序如下:
xi: xtabond2   roa 1.roa    12.roa   bsize  indep dual risk  debt i.year, gmm(roa bsize indep dual risk debt, lag(3 4) collapse) iv(i.year) twostep   robust small
说明:1.roa、12.roa分别表示roa的一阶滞后和二阶滞后。

我觉得作者把roa放在gmm中是错误的,应该替换成1.roa和12.roa才对,我的理解是gmm中不能放因变量(即使roa是内生变量),只能放自变量,不知我的理解是否正确?(我正在写类似的论文,我发现放与不放roa的结果差别很大)
A: 你理解的没错,但这位作者处理的也没错。原因在于他附加了 lag(3,4) 选项,即滞后 3 期以后的变量才作为工具变量。因此,你们两个意思是一样的。

      还有,lag(3 4) 后collapse不知起什么作用,在什么情况下需要加上这个选项?(我试了下,发现加上后检验指标发生了大幅度变化,有些原先能够通过检验但加上后无法通过,有些则正好相反)尽管看了stata上的说明,但感觉还不是很明白,恳请给予指点,谢谢!
A: xtabond2 的帮助文件中对此进行了详细的说明,并指出增加 collapse 选项主要是为了防止工具变量构成的矩阵过大导致运算速度降低,以及在矩阵尺寸超出stata限定后无法运算等问题。但在大样本下,该选项会降低估计结果的效率。
The collapse suboption of gmmstyle() specifies that xtabond2 should create
        one instrument for each variable and lag distance, rather than one for each
        time period, variable, and lag distance.  In large samples, collapse reduces
        statistical efficiency.  But in small samples it can avoid the bias that
        arises as the number of instruments climbs toward the number of
        observations.  (When instruments are many, they tend to overfit the
        instrumented variables and bias the results toward those of OLS/GLS.)
        collapse also greatly curtails computational demands by reducing the width
        of the instrument matrix, and (relevant for the ado version of the program)
        helps keep the matrix within Stata's size limit.

        For example, if a model assumes that E[w_is*D.e_it] = 0 for all s<t, this is
        expressed in standard Arellano-Bond estimation as:

            sum_i (w_is * D.e_it) = 0 for each s and t, s<t.
        This translates into columns in the instrument matrix of the form:
            w_i1  0    0    0    0    0   ...
             0   w_i1 w_i2  0    0    0   ...
             0    0    0   w_i1 w_i2 w_i3 ...
             .    .    .    .    .    .   ...
             .    .    .    .    .    .   ...

        collapse divides the "GMM-style" moment conditions into groups and sums the
        conditions in each group to form a smaller set of conditions of the form:

            sum_i,t (w_i,t-j * D.e_it)= 0 for each j>0.
        This is equivalent to combining columns of the instrument matrix by
        addition, yielding:

            w_i1  0    0   ...
            w_i2 w_i1  0   ...
            w_i3 w_i2 w_i1 ...
             .    .    .   ...
             .    .    .   ...

        Similarly, the standard instruments for the levels equation (in system GMM)
        collapse from:

            D.w_i2    0      0   ...
               0   D.w_i3    0   ...
               0      0   D.w_i4 ...
               .      .      .   ...

        To the single column:
            D.w_i2
            D.w_i3
            D.w_i4

               .  
               .

另外,2SLS和GMM是不是只对线性函数形式适用,对非线性的不适合?
A: 2SLS还是在OLS的框架下进行估计和分析。然而,GMM已经不是了,它构造统计量时只有一个标准:E(Z'u) = 0,即只要满足矩条件即可。stata11增加了一个重要的新命令:gmm。你可以看看stata11手册中对gmm这个命令的介绍,写得非常清楚。



藤椅
wxyrocky 发表于 2010-2-8 13:20:12
谢谢连老师的回答,对第一点我还是有些费解, 为何加了lag(3,4) 选项后就可以在gmm中放上因变量roa,如果既加上lag(3 4)又放上1.roa、12.roa不知道是否可以?
附:对lag(3 4)表达的意思我的理解是用roa的1阶、2阶滞后作为水平方程的工具变量,3阶、4阶滞后作为差分方程的工具变量。这样的理解不知是否正确?

板凳
arlionn 在职认证  发表于 2010-2-8 14:35:56
wxyrocky 发表于 2010-2-8 13:20
谢谢连老师的回答,对第一点我还是有些费解, 为何加了lag(3,4) 选项后就可以在gmm中放上因变量roa,如果既加上lag(3 4)又放上1.roa、12.roa不知道是否可以?
附:对lag(3 4)表达的意思我的理解是用roa的1阶、2阶滞后作为水平方程的工具变量,3阶、4阶滞后作为差分方程的工具变量。这样的理解不知是否正确?
不能随意猜测每个选项的含义,要看看帮助文件。

报纸
wxyrocky 发表于 2010-2-9 08:49:34
好的,谢谢!

地板
arlionn 在职认证  发表于 2010-2-9 08:51:09
你的签名照里,是不是周笔畅?呵呵

7
wxyrocky 发表于 2010-2-9 13:00:42
呵呵,好像是的!

8
peyzf 发表于 2013-7-13 04:40:04
learning.

9
赵安豆 发表于 2025-9-1 11:46:18
关于`xtabond2`命令中的gmm选项设置问题,你的理解并不完全正确。在动态面板模型中,通常我们将被解释变量的滞后项(即内生变量)也作为工具变量放入gmm()选项里。这是因为被解释变量的滞后项可能与当期误差项相关,从而导致估计偏误,通过GMM方法将其作为工具变量可以克服这种内生性问题。

在你提供的命令中:

- `xi: xtabond2 roa 1.roa 12.roa bsize indep dual risk debt i.year,`
  - 这里`roa`, `bsize`, `indep`, `dual`, `risk`, `debt` 和虚拟变量`i.year`是模型中的自变量。而`1.roa`和`12.roa`是被解释变量的滞后项,通常作为内生变量处理。
- `gmm(roa bsize indep dual risk debt, lag(3 4) collapse)`
  - gmm()选项中包含了被解释变量的一阶滞后`roa`(尽管直觉上似乎应为`1.roa`,但这里的表述可能是作者的简化表示),以及其它自变量。这意呀着使用它们从第3期到第4期的滞后作为工具变量。
  - `lag(3 4)`指定工具变量来自第3期和第4期的滞后项。
  - `collapse`选项用于处理重复的时间序列数据,如果存在同一年的数据点超过一次的情况,它会先进行汇总。但在动态面板模型估计中通常不需要使用该选项,除非你的数据确实有此类问题。

- 其他命令参数如`twostep`, `robust`, 和 `small`分别代表两步GMM估计法、稳健标准误和小样本修正。

关于“lag(3 4) 后collapse”的作用:

- 在某些情况下,如果面板数据中有同一年内多个观测值的情况(例如因为有季度或者月度数据被汇总到年度级别),使用`collapse`选项可以先对这些重复的年度数据进行汇总处理,避免估计时出现混淆。然而,在标准的动态面板模型分析中,通常每个个体每年只有一个观察值,所以这个选项并不常用。

至于2SLS和GMM的关系:

- 2SLS(两阶段最小二乘法)是GMM的一个特殊情况,主要应用于截面数据或固定时间点的数据估计内生性问题。而GMM是一个更广泛的方法框架,可以应用在面板数据中,并且通过不同的选择来处理各种复杂的情况。
  
最后,关于放置被解释变量的滞后项作为工具变量是否必要:理论上讲,在动态面板模型中,将滞后项包含进gmm()选项是合理的,因为这有助于克服内生性问题。然而实际结果可能受多种因素影响(如样本大小、数据特性等),导致不同设置下估计效果有差异。

希望这些解释能够帮助你更好地理解`xtabond2`命令及其选项的使用!

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-5 12:50