楼主: xhw88184004
52713 64

[回归分析求助] 求助,做SFA时用超越对数生产函数,为何STATA和frontier4.1估计结果差异非常大?   [推广有奖]

11
fysh1113 发表于 2009-11-10 09:26:00
发错了,见下个帖子!

12
fysh1113 发表于 2009-11-10 09:29:06
跟你介绍一下我的检查过程,顺便帮你分析问题。

我首先检查你的设定,发现没有问题。核心三点:(1)Battese and Coelli(1992)设定;(2)截断正态;(3)技术无效项时变。对吧?这三点也是STATA中“xtfrontier ... ,vcd”命令默认的设定。我按你给的数据分别在两种软件上跑,确实存在你说的问题!

比较两组估计值,Frontier存在明显问题:估计值的标准差全是1,技术无效项的期望是零,方差也是零(我的估计结果是这样的,不知道你的是不是)。减少一个变量,Frontier的异常结果没有了,但是两组估计结果仍不一样。在这一过程中,Frontier给计算的似然函数值要小于STATA,说明至少Frontier没有实现全局最优。不过当我去掉投入项与时间的乘积项后,两组结果有了一致的结果,见最后。

我估计,变量多,两组结果差异就大;变量少,两组结果就一致。但这一结论是否稳定,我没有进一步验证,你可以再通过增删其他变量试试。

这样我就想可能是两个方面的问题:运算能力和算法。

Frontier的运算能力的确有限,虽然我不确定Frontier到底在哪些设定下会遇到运算能力瓶颈,但上面的问题很可能就是一种。此外,你要是使用Battese and Coelli(1995)设定的话(“INS”中的第一行先TE),你会发现最多只能加4个解释技术无效项期望的变量。呵呵,很无奈吧,因为你有5个!这也是一种。尽管如此,Frontier至少还能做BC95的设定,而STATA却没有Routine的东西,除非自己编程。

Frontier的默认算法是DFP,该算法的好处是不用计算二阶导矩阵,不过STATA在调用这一算法时会提示不连续区域,从而无法给出DFP算法下的估计值。我也很纳闷,为什么Frontier就能做出来?还得考虑。

问题很有意思,但我工作太忙,没法拿出更多时间了。东西放在这里,抛砖引玉,供大家讨论。找出更深层次的原因,共同进步。

STATA估计结果
Time-varying decay inefficiency model           Number of obs      =       522
Group variable: id                              Number of groups   =        29

Time variable: t                                Obs per group: min =        18
                                                               avg =        18
                                                               max =        18

                                                Wald chi2(7)       =  12117.83
Log likelihood  =  676.85007                    Prob > chi2        =    0.0000

------------------------------------------------------------------------------
        logy |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        logk |   .8581681   .0702359    12.22   0.000     .7205082     .995828
        logl |   .2901866   .2385308     1.22   0.224    -.1773251    .7576984
        lnk2 |  -.0081341   .0051661    -1.57   0.115    -.0182594    .0019913
        lnl2 |   .0176866   .0189523     0.93   0.351    -.0194593    .0548325
        lnkl |  -.0416083    .009661    -4.31   0.000    -.0605435   -.0226731
           t |   .0738904   .0032325    22.86   0.000     .0675548     .080226
          t2 |  -.0001099   .0001371    -0.80   0.423    -.0003786    .0001588
       _cons |  -.1303931   .8066209    -0.16   0.872    -1.711341    1.450555
-------------+----------------------------------------------------------------
         /mu |   .8076558   .1711175     4.72   0.000     .4722717     1.14304
        /eta |  -.0249487   .0019134   -13.04   0.000    -.0286988   -.0211985
   /lnsigma2 |  -.9871312   .4119958    -2.40   0.017    -1.794628   -.1796343
  /ilgtgamma |   4.819252   .4215303    11.43   0.000     3.993067    5.645436
-------------+----------------------------------------------------------------
      sigma2 |   .3726442   .1535278                      .1661893    .8355757
       gamma |   .9919918   .0033487                      .9818909    .9964788
    sigma_u2 |     .36966   .1535317                      .0687434    .6705766
    sigma_v2 |   .0029842   .0001906                      .0026106    .0033578
------------------------------------------------------------------------------

Frontier估计结果:
the final mle estimates are :

                 coefficient     standard-error    t-ratio

  beta 0        -0.13009123E+00  0.81300234E+00 -0.16001335E+00
  beta 1         0.85813963E+00  0.68369803E-01  0.12551442E+02
  beta 2         0.29013755E+00  0.24348149E+00  0.11916205E+01
  beta 3        -0.81321979E-02  0.51092938E-02 -0.15916481E+01
  beta 4         0.17690571E-01  0.19216669E-01  0.92058467E+00
  beta 5        -0.41609162E-01  0.96804559E-02 -0.42982647E+01
  beta 6         0.73891171E-01  0.32161358E-02  0.22975140E+02
  beta 7        -0.10989187E-03  0.13951797E-03 -0.78765383E+00
  sigma-squared  0.37270236E+00  0.15138674E+00  0.24619220E+01
  gamma          0.99199309E+00  0.32595184E-02  0.30433732E+03
  mu             0.80763401E+00  0.17292280E+00  0.46704889E+01
  eta           -0.24947633E-01  0.17774413E-02 -0.14035700E+02

log likelihood function =   0.67685005E+03

LR test of the one-sided error =   0.14167786E+04
with number of restrictions = 3
[note that this statistic has a mixed chi-square distribution]
已有 3 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
葫芦娃大王 + 20 + 10 + 1 + 1 精彩帖子
rhapsodyr + 2 + 2 观点有启发
crystal8832 + 24 + 2 + 2 + 2 热心帮助其他会员

总评分: 经验 + 20  论坛币 + 34  学术水平 + 5  热心指数 + 5  信用等级 + 2   查看全部评分

13
面板数据 发表于 2009-11-10 10:02:30
zhaowill 发表于 2009-11-9 22:56
根据楼主提供的数据在stata上跑了一下,发现根本就不收敛呵。
我也发现STATA和frontier4.1估计结果有差异,估计应该从算法上找原因。楼主可查一下xtfrontier的命令详解和frontier4.1的使用手册。
另有一问题顺便请教:在技术无效方程中,因变量是否就是无效项 u_it ?能否对效率值te回归?还有技术无效方程的影响变量是取原值呢还是取对数值?
呵呵,没帮助解决问题,倒是提了一对问题。先谢了!
感谢zhaowill的大方赐教和帮忙,期待更多关于这个问题的解决方法。我想论坛中做SFA的能人应该不少,期待您的答复,谢谢!!

14
goodegggg 发表于 2009-11-17 19:33:15
fysh1113 发表于 2009-11-10 09:29
跟你介绍一下我的检查过程,顺便帮你分析问题。

我首先检查你的设定,发现没有问题。核心三点:(1)Battese and Coelli(1992)设定;(2)截断正态;(3)技术无效项时变。对吧?这三点也是STATA中“xtfrontier ... ,vcd”命令默认的设定。我按你给的数据分别在两种软件上跑,确实存在你说的问题!

比较两组估计值,Frontier存在明显问题:估计值的标准差全是1,技术无效项的期望是零,方差也是零(我的估计结果是这样的,不知道你的是不是)。减少一个变量,Frontier的异常结果没有了,但是两组估计结果仍不一样。在这一过程中,Frontier给计算的似然函数值要小于STATA,说明至少Frontier没有实现全局最优。不过当我去掉投入项与时间的乘积项后,两组结果有了一致的结果,见最后。

我估计,变量多,两组结果差异就大;变量少,两组结果就一致。但这一结论是否稳定,我没有进一步验证,你可以再通过增删其他变量试试。

这样我就想可能是两个方面的问题:运算能力和算法。

Frontier的运算能力的确有限,虽然我不确定Frontier到底在哪些设定下会遇到运算能力瓶颈,但上面的问题很可能就是一种。此外,你要是使用Battese and Coelli(1995)设定的话(“INS”中的第一行先TE),你会发现最多只能加4个解释技术无效项期望的变量。呵呵,很无奈吧,因为你有5个!这也是一种。尽管如此,Frontier至少还能做BC95的设定,而STATA却没有Routine的东西,除非自己编程。

Frontier的默认算法是DFP,该算法的好处是不用计算二阶导矩阵,不过STATA在调用这一算法时会提示不连续区域,从而无法给出DFP算法下的估计值。我也很纳闷,为什么Frontier就能做出来?还得考虑。

问题很有意思,但我工作太忙,没法拿出更多时间了。东西放在这里,抛砖引玉,供大家讨论。找出更深层次的原因,共同进步。

STATA估计结果
Time-varying decay inefficiency model           Number of obs      =       522
Group variable: id                              Number of groups   =        29

Time variable: t                                Obs per group: min =        18
                                                               avg =        18
                                                               max =        18

                                                Wald chi2(7)       =  12117.83
Log likelihood  =  676.85007                    Prob > chi2        =    0.0000

------------------------------------------------------------------------------
        logy |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        logk |   .8581681   .0702359    12.22   0.000     .7205082     .995828
        logl |   .2901866   .2385308     1.22   0.224    -.1773251    .7576984
        lnk2 |  -.0081341   .0051661    -1.57   0.115    -.0182594    .0019913
        lnl2 |   .0176866   .0189523     0.93   0.351    -.0194593    .0548325
        lnkl |  -.0416083    .009661    -4.31   0.000    -.0605435   -.0226731
           t |   .0738904   .0032325    22.86   0.000     .0675548     .080226
          t2 |  -.0001099   .0001371    -0.80   0.423    -.0003786    .0001588
       _cons |  -.1303931   .8066209    -0.16   0.872    -1.711341    1.450555
-------------+----------------------------------------------------------------
         /mu |   .8076558   .1711175     4.72   0.000     .4722717     1.14304
        /eta |  -.0249487   .0019134   -13.04   0.000    -.0286988   -.0211985
   /lnsigma2 |  -.9871312   .4119958    -2.40   0.017    -1.794628   -.1796343
  /ilgtgamma |   4.819252   .4215303    11.43   0.000     3.993067    5.645436
-------------+----------------------------------------------------------------
      sigma2 |   .3726442   .1535278                      .1661893    .8355757
       gamma |   .9919918   .0033487                      .9818909    .9964788
    sigma_u2 |     .36966   .1535317                      .0687434    .6705766
    sigma_v2 |   .0029842   .0001906                      .0026106    .0033578
------------------------------------------------------------------------------

Frontier估计结果:
the final mle estimates are :

                 coefficient     standard-error    t-ratio

  beta 0        -0.13009123E+00  0.81300234E+00 -0.16001335E+00
  beta 1         0.85813963E+00  0.68369803E-01  0.12551442E+02
  beta 2         0.29013755E+00  0.24348149E+00  0.11916205E+01
  beta 3        -0.81321979E-02  0.51092938E-02 -0.15916481E+01
  beta 4         0.17690571E-01  0.19216669E-01  0.92058467E+00
  beta 5        -0.41609162E-01  0.96804559E-02 -0.42982647E+01
  beta 6         0.73891171E-01  0.32161358E-02  0.22975140E+02
  beta 7        -0.10989187E-03  0.13951797E-03 -0.78765383E+00
  sigma-squared  0.37270236E+00  0.15138674E+00  0.24619220E+01
  gamma          0.99199309E+00  0.32595184E-02  0.30433732E+03
  mu             0.80763401E+00  0.17292280E+00  0.46704889E+01
  eta           -0.24947633E-01  0.17774413E-02 -0.14035700E+02

log likelihood function =   0.67685005E+03

LR test of the one-sided error =   0.14167786E+04
with number of restrictions = 3
[note that this statistic has a mixed chi-square distribution]
分析得有道理,但我看二者的估计结果是一样的啊?所有的算法都是迭代的,有误差是不可避免的。
已有 1 人评分学术水平 热心指数 收起 理由
kerrydu + 1 + 1 观点有启发

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

Everything is meaningless.

15
yanglj2010 发表于 2010-1-15 02:24:53
B&c,1992 模型用stata做好,b&c 1995模型用frontier4.1較好
又您這是探討什麼方面的相關問題呢?
已有 1 人评分学术水平 热心指数 收起 理由
rhapsodyr + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

16
sunrain75 在职认证  发表于 2010-4-13 16:39:23
就这个问题我请教过FRONTIER的泰斗级人物。他也注意到这个情况。但是,也没有合理的解释。他的建议是用FRONTEIR 4.1
已有 1 人评分经验 论坛币 收起 理由
葫芦娃大王 + 10 + 5 精彩帖子

总评分: 经验 + 10  论坛币 + 5   查看全部评分

17
caseyqianjj11 发表于 2010-5-4 21:56:20
很高深啊~~~学习学习~~

18
zwa222 发表于 2010-9-4 19:54:42
学习一下!!

19
水寒198911 发表于 2011-2-22 15:25:27
又没有用stata来进行SFA回归分析的详细步骤之类的呀,我是初学者,一点都不知道怎么做,马上要写论文了,很急。谢谢!

20
jiangbogz 发表于 2011-8-16 22:07:25
学习了!!!
看庭前花开花落;
望天上云卷云舒。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 12:26