楼主: 76feibang
6344 3

[一般统计问题] heckman模型使用的是否整体样本 [推广有奖]

  • 4关注
  • 2粉丝

本科生

59%

还不是VIP/贵宾

-

威望
0
论坛币
1121 个
通用积分
0
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
1416 点
帖子
59
精华
0
在线时间
73 小时
注册时间
2012-6-7
最后登录
2022-5-2

楼主
76feibang 在职认证  发表于 2012-11-12 15:07:02 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
假设总体人群的样本为N,生病的人群为n,n<N,
1、logistic回归的样本应该是n,heckman模型中的样本是n还是N?
2、在stata中heckman命令中两步代入的变量能否一样?

我搜了之前发的帖子,能力有限,没看懂,这个帖子可能重了,希望版主不要再警告了。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:heckman模型 heckman Man HEC 模型 样本

本帖被以下文库推荐

沙发
fgleric 发表于 2012-11-18 06:01:19
your question:
假设总体人群的样本为N,生病的人群为n,n<N,
1、logistic回归的样本应该是n,heckman模型中的样本是n还是N?
2、在stata中heckman命令中两步代入的变量能否一样?

我的理解
首先第一步应该是probit回归;
第二,在第一步回归中,用的是全部样本N;在第二步回归中,用的是n。

参考实例:

webuse school,clear
heckprob private pub5 school,select( vote =loginc logptax)

结果如下
Probit model with sample selection             Number of obs      =        95
                                                Censored obs       =        36
                                                Uncensored obs     =        59


                                                Wald chi2(2)       =      0.00
Log likelihood = -74.98448                      Prob > chi2        =    1.0000

------------------------------------------------------------------------------
             |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
private      |
        pub5 |  -4.851684   18195.19    -0.00   1.000    -35666.76    35657.06
      school |  -4.180223   573.9764    -0.01   0.994    -1129.153    1120.793
       _cons |  -.9723302   .8691612    -1.12   0.263    -2.675855    .7311943
-------------+----------------------------------------------------------------
vote         |
      loginc |   1.095287    .439451     2.49   0.013      .233979    1.956595
     logptax |  -1.139577   .5603804    -2.03   0.042    -2.237903   -.0412519
       _cons |  -2.691405   3.672407    -0.73   0.464     -9.88919     4.50638
-------------+----------------------------------------------------------------
     /athrho |  -.4130508   1.168952    -0.35   0.724    -2.704154    1.878053
-------------+----------------------------------------------------------------
         rho |    -.39106   .9901864                     -.9910815    .9543186
------------------------------------------------------------------------------
LR test of indep. eqns. (rho = 0):   chi2(1) =     0.11   Prob > chi2 = 0.7436


看一下黑体部分
总样本为95,在第一步的probit model用的是95个样本;
censored部分为36,即这36个没有出现在第二步的主回归里,因为他们的dependent var是缺失值(或无法观察到)
第二步的回归样本值为59.

关于你的第二个问题:
在stata输入里,两步的解释变量可以完全一样。如果讲理论模型,第二步实际上还增加了一个变量,这个变量是根据第一步的选择模型得出(具体可以放狗搜索无数的heckman模型)。

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
SpencerMeng + 40 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 40  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
蓝色 发表于 2012-11-18 09:10:40
heckman.jpg

板凳
zhj2011 发表于 2015-5-19 20:46:35
非常好,谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-4 13:07