楼主: 965415574
6353 6

[其他] 求助:heckman两步法第一步虚拟变量如何设置 [推广有奖]

  • 0关注
  • 0粉丝

高中生

75%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
0.7259
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
421 点
帖子
9
精华
0
在线时间
61 小时
注册时间
2021-8-24
最后登录
2025-7-12

楼主
965415574 发表于 2022-4-14 08:45:13 |AI写论文
5论坛币
本人计量小白,在处理数据时发现了样本选择偏误,我的Y是就业水平,用劳动报酬衡量,然而失业人员并不在我研究样本的考察之内,所以查阅资料需要用heckman两步法做稳健性检验。

但是我的问题是,我的样本全部是就业样本,没有包含失业人员,所以第一步设置虚拟变量时都设置成1(inlf=1),这样的话结果就报错了(Dependent variable never censored because of selection: model would simplify to OLS regression)


所以请教大家该怎么做?是我理解有问题吗?

最佳答案

18383810951 查看完整内容

因变量都是1确实不太行,若想设置成虚拟变量。 可以把因变量按照年度行业均值(或年度行业中位数)设置为二元变量,即高于年度行业均值(中位数)设置为1,否则为0。 步骤(以年度行业均值为例): bys industry year:egen mean就业水平=mean(就业水平) gen 就业水平虚拟变量=1 if 就业水平> mean就业水平 replace 就业水平虚拟变量=0 if 就业水平虚拟变量==.
关键词:heckman两步法 heckman 虚拟变量 两步法 Man

沙发
18383810951 学生认证  发表于 2022-4-14 08:45:14
因变量都是1确实不太行,若想设置成虚拟变量。
可以把因变量按照年度行业均值(或年度行业中位数)设置为二元变量,即高于年度行业均值(中位数)设置为1,否则为0。
步骤(以年度行业均值为例):
bys industry year:egen mean就业水平=mean(就业水平)
gen 就业水平虚拟变量=1 if 就业水平> mean就业水平
replace 就业水平虚拟变量=0 if 就业水平虚拟变量==.

藤椅
965415574 发表于 2022-4-14 11:20:29
因为查阅资料没法看到其他人的数据结构,实在不知道这个虚拟变量如何设置,按照我的理解,因为样本选择偏误所以导致那些失业人员是不在样本中的,理所当然这个变量就都为1了,但是第一步直接报错,意思是说我没有设置0吗?可是正因为没有0变量才存在的选择偏误呀,陷进去了。。。。求大佬帮忙解答,不胜感激
outcome does not vary; remember:
                                  0 = negative outcome,
        all other nonmissing values = positive outcome

板凳
anm10493 发表于 2022-4-14 18:19:46
heckman两步法的第一步的Y必须是1,0的虚拟变量。你把数据全做成就业样本,也就是虚拟变量的1,而没有包含失业人员,也就是虚拟变量的0,的处理是你出现错误的根本所在。

报纸
965415574 发表于 2022-4-14 18:26:49
anm10493 发表于 2022-4-14 18:19
heckman两步法的第一步的Y必须是1,0的虚拟变量。你把数据全做成就业样本,也就是虚拟变量的1,而没有包含 ...
谢谢您的解答,我已经认识到这个问题了,所以现在不知道如何处理,还是说我这个问题用PSM已经可以解决了

地板
965415574 发表于 2022-4-14 18:34:28
18383810951 发表于 2022-4-14 16:34
因变量都是1确实不太行,若想设置成虚拟变量。
可以把因变量按照年度行业均值(或年度行业中位数)设置为 ...
谢谢您的解答,还想请教一下是否有文献有类似的处理方法,因为这样虽然能出结果,但是我不知道这样设置到底有没有道理,因为这样设置出来的0的那些样本说明了什么呢?跟失业好像也没什么关系。。。如果我理解错了还请您赐教

7
18383810951 学生认证  发表于 2022-4-15 15:45:03
965415574 发表于 2022-4-14 18:34
谢谢您的解答,还想请教一下是否有文献有类似的处理方法,因为这样虽然能出结果,但是我不知道这样设置到 ...
我当时在做研究的时候,也没有在论文中看到过,并且heckman在很多文章中都不会写明具体的方法。这个方法是我在一次开会的时候(我老师他们的研究团队开会的时候,老师叫我进会议听听)听到有一个教授这么说过,当时我的内生性检验都通不过,导师让我试试,我就试了,但是我有两个因变量,有一个成立一个不成立,所以最后那个教授就说一个成了一个不成立不好解释,就别写了。我就再没用过那个方法,需要说的就是那个教授是国外的专家,他说的检验方法有很多我在国内期刊中没有见过,所以这个我也不太明确。
其次就是样本自选择的话可以用heckman,通过寻找工具变量(一般是通过自变量来计算)来解决,不一定要通过因变量,你可以跟导师商量一下你的研究是否可行。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 23:24