楼主: qofeliae
616 4

[面板数据求助] heckman两阶段的解释变量不显著 [推广有奖]

  • 0关注
  • 0粉丝

大专生

8%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.8271
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
101 点
帖子
12
精华
0
在线时间
65 小时
注册时间
2025-3-19
最后登录
2025-11-28

楼主
qofeliae 发表于 2025-4-20 21:44:07 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,楼主在做heckman两阶段模型,第一阶段做probit模型,同时考虑了多个控制变量,probit提示解释变量是显著的,同时提示0 failures and 2 successes completely determined.第二阶段纳入imr再次进行回归分析讨论,发现整体显著,解释变量不显著了,请问哪位能帮忙解释吗?
probit above Size Lev ROA ROE ATO Cashflow INV FIXED Growth Loss Board Indep Dual Top1 Top5 Top1
> 0 Balance1 Balance2 TobinQ SOE ListAge FirmAge INST Mshare Mfee Occupy Big4 AgC1_2 AgC1_3 Employ
>  Cap1 Cap2 Pay CalculationDT


Iteration 0:  Log likelihood = -14414.749  
Iteration 1:  Log likelihood = -12869.995  
Iteration 2:  Log likelihood = -12853.224  
Iteration 3:  Log likelihood = -12851.721  
Iteration 4:  Log likelihood =  -12851.72  


Probit regression                                      Number of obs =  26,331
                                                       LR chi2(34)   = 3126.06
                                                       Prob > chi2   =  0.0000
Log likelihood = -12851.72                             Pseudo R2     =  0.1084


-------------------------------------------------------------------------------
        above | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
--------------+----------------------------------------------------------------
         Size |   .1570332   .0168764     9.30   0.000     .1239561    .1901104
          Lev |   -1.05333   .0611365   -17.23   0.000    -1.173155   -.9335042
          ROA |   1.739876   .3321383     5.24   0.000     1.088897    2.390856
          ROE |  -.0621376    .144948    -0.43   0.668    -.3462304    .2219553
          ATO |   .4284014   .2556459     1.68   0.094    -.0726553    .9294581
     Cashflow |  -.2570344   .1559462    -1.65   0.099    -.5626834    .0486147
          INV |     .70097   .0819419     8.55   0.000     .5403668    .8615732
        FIXED |  -.2816166   .0698934    -4.03   0.000     -.418605   -.1446281
       Growth |  -.1327403   .0239865    -5.53   0.000     -.179753   -.0857275
         Loss |  -.0210294   .0364224    -0.58   0.564     -.092416    .0503572
        Board |   .1035501   .0617998     1.68   0.094    -.0175753    .2246756
        Indep |   .0163759   .0021456     7.63   0.000     .0121706    .0205811
         Dual |  -.0134734   .0210299    -0.64   0.522    -.0546912    .0277443
         Top1 |  -.3834886   .2265078    -1.69   0.090    -.8274357    .0604585
         Top5 |    .489558    .403795     1.21   0.225    -.3018656    1.280982
        Top10 |  -.7711052   .3591233    -2.15   0.032    -1.474974   -.0672364
     Balance1 |  -.0206905   .0845104    -0.24   0.807    -.1863278    .1449469
     Balance2 |  -.0953239   .0401706    -2.37   0.018    -.1740568    -.016591
       TobinQ |  -.0286694   .0075922    -3.78   0.000      -.04355   -.0137889
          SOE |   .2149929   .0227138     9.47   0.000     .1704747    .2595111
      ListAge |  -.2837084    .018836   -15.06   0.000    -.3206263   -.2467905
      FirmAge |   .2231494   .0372014     6.00   0.000     .1502359    .2960628
         INST |   .4640298   .0878368     5.28   0.000     .2918729    .6361867
       Mshare |   .0094986   .0009976     9.52   0.000     .0075433    .0114539
         Mfee |  -.9656789    .225463    -4.28   0.000    -1.407578   -.5237796
       Occupy |  -2.942264   .3878973    -7.59   0.000    -3.702529   -2.181999
         Big4 |    .121401   .0477624     2.54   0.011     .0277884    .2150137
       AgC1_2 |   .0684515   .1027984     0.67   0.505    -.1330296    .2699327
       AgC1_3 |  -.5145142   .2527633    -2.04   0.042    -1.009921   -.0191073
       Employ |   4.60e-06   1.77e-06     2.59   0.009     1.12e-06    8.07e-06
         Cap1 |  -.0147438    .016163    -0.91   0.362    -.0464227    .0169352
         Cap2 |  -.0093894   .0070369    -1.33   0.182    -.0231815    .0044027
          Pay |   .2265595   .0164325    13.79   0.000     .1943525    .2587665
CalculationDT |   .7331782   .1691526     4.33   0.000     .4016453    1.064711
        _cons |  -6.293125   .3801261   -16.56   0.000    -7.038158   -5.548091
-------------------------------------------------------------------------------
Note: 0 failures and 2 successes completely determined.


reg  综合评级 CalculationDT imr if above == 1


      Source |       SS           df       MS      Number of obs   =    20,094
-------------+----------------------------------   F(2, 20091)     =    572.11
       Model |   509.52435         2  254.762175   Prob > F        =    0.0000
    Residual |  8946.60504    20,091  .445304118   R-squared       =    0.0539
-------------+----------------------------------   Adj R-squared   =    0.0538
       Total |  9456.12939    20,093  .470618095   Root MSE        =    .66731


-------------------------------------------------------------------------------
     综合评级 | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
--------------+----------------------------------------------------------------
CalculationDT |   .0131623   .0168186     0.78   0.434    -.0198036    .0461282
          imr |  -.8267431   .0244867   -33.76   0.000    -.8747391   -.7787471
        _cons |   4.862166   .0099978   486.32   0.000      4.84257    4.881763
-------------------------------------------------------------------------------





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:heckman 解释变量 Man HEC 两阶段 heckman Heckman procedure heckman两步法 stata Heckman Stata;heckman

沙发
wdlbcj 学生认证  发表于 2025-4-22 13:18:42
用官方的heckman来做试试  别自己手动修正

藤椅
赵安豆 发表于 2025-6-3 19:25:04
在 Heckman 的两阶段模型中,第一阶段(通常是 Probit 模型)用于估计样本选择概率,而第二阶段则对感兴趣的模型进行调整以校正由样本选择偏误带来的影响。你提到的第一阶段得到的解释变量显著的结果是好的迹象,这意味着模型能够较好地预测样本的选择过程。

然而,在第二阶段回归中发现解释变量不显著可能有以下几个原因:

1. **信息丢失**:第一阶段估计的选择方程与第二阶段感兴趣的回归模型之间的相关性较弱。虽然选择方程中的变量对样本选择具有预测力,但它们对于第二阶段的回归目标变量的影响可能并不强。

2. **模型设定问题**:可能是模型中遗漏了重要的解释变量,或者是存在某些形式的非线性关系没有被正确捕捉到。这可能导致了变量间的关系未能在回归结果中体现出来。

3. **样本选择偏误未完全纠正**:即使使用了 Heckman 矫正方法,但可能由于数据特性或模型设定的原因,样本选择偏误并未得到充分的校正。

4. **控制变量过多**:你列出了一系列控制变量。有时候,过多的控制变量会分散模型对核心解释变量的关注,导致后者的显著性降低。

5. **多重共线性问题**:如果多个解释变量之间存在高度相关性,这可能会影响回归系数估计的稳定性和精确度,从而影响显著性测试的结果。

建议你可以尝试以下步骤来解决这个问题:

- 检查模型设定是否合理,包括考虑是否需要加入非线性的形式或交互项。
- 确认第一阶段和第二阶段之间的联系(即逆米尔斯比IMR的作用)是否有效,检查IMR与结果变量的关系。
- 调整控制变量的使用,可能减少一些相关性较高的控制变量以避免多重共线性问题。
- 进行模型稳健性检验,比如改变样本范围或进行子样本分析,看看结果是否稳定。

此外,对于你提到的“0 failures and 2 successes completely determined”信息,这通常意味着在你的样本中,有一部分观测值的选择概率是完全确定的(即100%),这可能是数据分布的问题。需要确保模型设定能够处理这种特殊情况,并且对回归结果的影响进行适当的解释和讨论。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



板凳
qofeliae 发表于 2025-10-5 17:55:13
wdlbcj 发表于 2025-4-22 13:18
用官方的heckman来做试试  别自己手动修正
您好,请问第二阶段的代码写的正确吗?regress D lnDT imr i.industry1 i.year if above==1,vce(robust)  我查了很多网上材料,有的说需要有控制变量,有的说不需要,如果加入了其他控制变量,这个回归分析结果不显著,不加入其他控制变量,结果显著。还有一个问题想请教您,加入了if above==1后,数据量降低了很多,F值不显示,请问您有什么建议吗?

报纸
wdlbcj 学生认证  发表于 2025-10-6 14:07:53
qofeliae 发表于 2025-10-5 17:55
您好,请问第二阶段的代码写的正确吗?regress D lnDT imr i.industry1 i.year if above==1,vce(robust)  ...
1. 需要加控制变量
2. 需要加if  如果不显示F统计量  你可以单独把这一部分数据取出来进行回归分析

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-6 00:00