请选择 进入手机版 | 继续访问电脑版
楼主: peyzf
27135 43

请问,在stata中能否实现G•Fields分解、与Oaxaca-Blinder分解操作? [推广有奖]

peyzf 发表于 2009-8-16 11:55:30 |显示全部楼层 |坛友微信交流群
进一步提问:gfields命令适合于哪种类型的回归模型?

使用道具

peyzf 发表于 2009-8-16 12:01:44 |显示全部楼层 |坛友微信交流群
[quote]peyzf 发表于 2009-8-16 11:53
而一般的reg模型可以直接用gfields命令。
如 xi:reg employer  age i.sex i.status   i.area
. xi:reg employer  age i.sex i.status   i.area
i.sex             _Isex_1-2           (naturally coded; _Isex_1 omitted)
i.status          _Istatus_1-3        (naturally coded; _Istatus_1 omitted)
i.area            _Iarea_0-2          (naturally coded; _Iarea_0 omitted)

      Source |       SS       df       MS              Number of obs =    1571
-------------+------------------------------           F(  5,  1565) =   14.25
       Model |   269521194     5  53904238.8           Prob > F      =  0.0000
    Residual |  5.9198e+09  1565  3782605.38           R-squared     =  0.0435
-------------+------------------------------           Adj R-squared =  0.0405
       Total |  6.1893e+09  1570  3942228.42           Root MSE      =  1944.9

------------------------------------------------------------------------------
    employer |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |  -19.11043   5.665632    -3.37   0.001    -30.22346   -7.997401
     _Isex_2 |  -424.8835   100.6651    -4.22   0.000    -622.3361   -227.4308
  _Istatus_2 |  -346.1651   135.7591    -2.55   0.011    -612.4539   -79.87627
  _Istatus_3 |  (dropped)
    _Iarea_1 |   -142.215   170.2102    -0.84   0.404     -476.079     191.649
    _Iarea_2 |   487.5856   180.0431     2.71   0.007     134.4344    840.7368
       _cons |   2761.409   272.2159    10.14   0.000     2227.463    3295.355
------------------------------------------------------------------------------

. gfields

  Fields' decomposition of factor contributions

  Factor |  Share of SS
---------+---------------
     age |     0.0075
_Isex_2 |     0.0098
_Istatus_2|     0.0046
_Istatus_3|     0.0000
_Iarea_1 |     0.0048
_Iarea_2 |     0.0169
residual |     0.9564


个人理解,以上系数反映的是各个变量对因变量影响的大小,这样一来,它与我们的标准化的系数回归方程参数有何差别?

另外,我想考查变量status对因变量的影响,能不能把Istatus_2前面的系数 0.0046与_Istatus_3的系数 0.0000简单相加?因为status为一离散变量,分为Istatus_2|、_Istatus_3两个虚拟变量。

使用道具

peyzf 发表于 2009-8-16 12:06:31 |显示全部楼层 |坛友微信交流群
Factor |  Share of SS
---------+---------------
     age |     0.0075
_Isex_2 |     0.0098
_Istatus_2|     0.0046
_Istatus_3|     0.0000
_Iarea_1 |     0.0048
_Iarea_2 |     0.0169
residual |     0.9564
从理论上来说,由于是各个因素的对变量差异的贡献,应该可以直接加总。

使用道具

peyzf 发表于 2009-8-16 12:07:36 |显示全部楼层 |坛友微信交流群
但这和R2等统计量一样,并不具有统计意义。统计推广意义不大。

使用道具

peyzf 发表于 2009-8-16 12:14:40 |显示全部楼层 |坛友微信交流群
peyzf 发表于 2009-8-16 11:53
而一般的reg模型可以直接用gfields命令。
如 xi:reg employer  age i.sex i.status   i.area
. xi:reg employer  age i.sex i.status   i.area
i.sex             _Isex_1-2           (naturally coded; _Isex_1 omitted)
i.status          _Istatus_1-3        (naturally coded; _Istatus_1 omitted)
i.area            _Iarea_0-2          (naturally coded; _Iarea_0 omitted)

      Source |       SS       df       MS              Number of obs =    1571
-------------+------------------------------           F(  5,  1565) =   14.25
       Model |   269521194     5  53904238.8           Prob > F      =  0.0000
    Residual |  5.9198e+09  1565  3782605.38           R-squared     =  0.0435
-------------+------------------------------           Adj R-squared =  0.0405
       Total |  6.1893e+09  1570  3942228.42           Root MSE      =  1944.9

------------------------------------------------------------------------------
    employer |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |  -19.11043   5.665632    -3.37   0.001    -30.22346   -7.997401
     _Isex_2 |  -424.8835   100.6651    -4.22   0.000    -622.3361   -227.4308
  _Istatus_2 |  -346.1651   135.7591    -2.55   0.011    -612.4539   -79.87627
  _Istatus_3 |  (dropped)
    _Iarea_1 |   -142.215   170.2102    -0.84   0.404     -476.079     191.649
    _Iarea_2 |   487.5856   180.0431     2.71   0.007     134.4344    840.7368
       _cons |   2761.409   272.2159    10.14   0.000     2227.463    3295.355
------------------------------------------------------------------------------

. gfields

  Fields' decomposition of factor contributions

  Factor |  Share of SS
---------+---------------
     age |     0.0075
_Isex_2 |     0.0098
_Istatus_2|     0.0046
_Istatus_3|     0.0000
_Iarea_1 |     0.0048
_Iarea_2 |     0.0169
residual |     0.9564


为何heckman模型不行,两者不兼容??还是因为存在inverse mill's ration,及潜在变量的回归方程?
一种理论上可行的方法是,用手动的二阶段回归方法。由第一步估算出inverse mill's ratio,第二部就是一个普通的ols.但问题是,手动情况不能得到有效的估计,但对于gfields分解应该是可适用的。

如何进行tradeoff?

如何既保证估算的有效性,同时使gfields命令可用。

注:gfields命令可以估算各个变量对因变量变动解释的贡献率。

使用道具

peyzf 发表于 2009-8-16 13:22:02 |显示全部楼层 |坛友微信交流群
初步结论,可以用probit+reg ,robust 来手工进行two-step reg .
并且与gfields兼容。。

使用道具

peyzf 发表于 2009-8-17 11:35:20 |显示全部楼层 |坛友微信交流群
执行 oaxaca命令后为何老出现这样的错误提示?如下。


oaxaca lwagecom age sqage,by(dummy)
Mata run-time error

使用道具

peyzf 发表于 2009-8-17 11:46:28 |显示全部楼层 |坛友微信交流群
进一步提问:如何查到stata中错误提示的解释??

使用道具

arlionn 在职认证  发表于 2009-8-17 14:38:33 |显示全部楼层 |坛友微信交流群
stata手册11 [Programming] error, p.118

使用道具

lilynnn 发表于 2010-4-9 10:10:10 |显示全部楼层 |坛友微信交流群
也想学习Oaxaca-Blinder分解的操作,peyzf ,愿意帮忙加我
qq276852334.谢谢!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-18 16:31