楼主: lizhewenbei
17387 19

[一般统计问题] 请教大神,Treatment effect model 和 Heckman 2SLS的区别 [推广有奖]

11
lizhewenbei 学生认证  发表于 2017-6-28 08:35:15
lihoujian 发表于 2017-6-25 12:42
一个简单的理解,heckman通常是如果不选择,你就没有办法观测到因变量,如果选择就可以观察到因变量。而处理 ...
能得到李老师的回复,非常高兴!您的大名,我早已久仰!

12
白杨九 发表于 2017-9-19 23:32:30
Treatment effect model的内容,陈强的书里面有吗?在哪一章呀?谢谢

13
未来,你好吗 学生认证  发表于 2017-12-28 23:14:03
我觉得heckman 两阶段解决的是样本选择偏差。何为样本选择偏差,比如我们要研究女性学历与工资之间的关系,自变量是女性比例,因变量是工资,最终我们有2000个样本。但是问题来了,没有工作的女性没有工资,那没有工作的女性这一部分样本怎么办?也就是说,你取的样本根本就不全,因为样本不包含没有工作的女性。你可能会说,我们用上面有工作的2000个样本就能代替总样本,但是你再想,学历会不会影响工作与否的可能呢?在我们日常的认知中,它是会影响的。因为学历越高的女性可能更容易找到工作。最终导致的结果就是,在你的2000个样本中,有高学历的女性占多数,因为只有高学历的人才找得到工作。显然,这样的回归是有偏差的,也就是我们通常说的样本选择偏差(有一部分y观测不到,本例中为没有工作的女性的工资观测不到)。
接着说,何为处理效应?我们再来思考另外一个问题,比如要探究一项工作培训能不能提高收入,好了,现在有1000个人参加了培训,其参加后的收入为y1,1000个人没有参加培训,其收入是y2。我们通常的做法是直接将y1-y2,如果结果大于0,表明培训提升了收入。但是,事实呢?我们通常发现结果小于0,也就是参加了培训反而收入较低,很奇怪吧?其实细想一下,还是很容易理解的。就是什么样的人会选择参加培训呢?毫无疑问,是那些自身能力就不高的人,会选择参加。现在假设一种极端情况,参加培训的1000个人都是低能力者,其未参加培训前收入为5000,参加后收入为6000;不参加培训的1000个人都是高能力者,其收入一直是10000。按照以往的做法,我们会拿6000-10000,但结果是-4000,也就是负数,即参加了工作培训员工的收入反而低于未参加工作培训员工的收入,于是我们得出结论,培训对员工收入毫无帮助,结果显然是不对的。为什么不对?也就是我们通常所说的自选择偏差,也就是能力低者自己选择参加培训,造成了样本的不合理。其与heckman的样本选择偏差最大的区别在于,处理效应总样本的y值都可观测。
已有 2 人评分经验 学术水平 热心指数 信用等级 收起 理由
钟声还与鼓声齐1 + 1 + 1 + 1 精彩帖子
zcl6062 + 10 + 4 + 5 + 1 精彩帖子

总评分: 经验 + 10  学术水平 + 5  热心指数 + 6  信用等级 + 2   查看全部评分

14
孟珏 发表于 2019-1-8 17:54:39
未来,你好吗 发表于 2017-12-28 23:14
我觉得heckman 两阶段解决的是样本选择偏差。何为样本选择偏差,比如我们要研究女性学历与工资之间的关系, ...
你好,请教下,还是类似研究某个变量X对工资的影响。
1.这个变量X对是否有工作会有显著的影响。此时应该是存在样本选择偏差问题,用heckman两步法的吧?
2.使用完heckman两步法,校正样本偏差后。再用有工作的人的样本去衡量变量x对工资的影响,此时还需要继续用heckman两步法吗?还是可以改用处理效应了?或者能否用工具变量法?

15
SYSU-LJY 发表于 2019-3-5 17:15:39
mark,此贴有用

16
xuanxind0204 发表于 2019-3-28 12:29:34
mark,学习了

17
yuneiji 发表于 2019-11-27 14:42:53
孟珏 发表于 2019-1-8 17:54
你好,请教下,还是类似研究某个变量X对工资的影响。
1.这个变量X对是否有工作会有显著的影响。此时应该 ...
第2个不必再用heckman了,heckman不就是帮你处理有工作和没工作混在一起导致选择偏差带来的有偏估计嘛,全都有工作的样本就是全都有工资了,直接回归即可。

18
新人小梁 发表于 2022-3-22 22:27:42
mark一下 明天看看

19
hiLeBron 发表于 2022-5-17 10:04:17
未来,你好吗 发表于 2017-12-28 23:14
我觉得heckman 两阶段解决的是样本选择偏差。何为样本选择偏差,比如我们要研究女性学历与工资之间的关系, ...
也就是heckman两阶段解决的是样本选择偏差问题,而处理效应模型解决的是样本自选择偏差。那二者各自的stata命令可以说一下吗

20
zsa4908750 发表于 2022-5-18 00:43:00
mark 受益良多

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 14:10