楼主: 独孤浪人
22548 8

[论文写作规范] 学术福利分享:Heckman二阶段模型详细解读! [推广有奖]

  • 8关注
  • 33粉丝

副教授

40%

还不是VIP/贵宾

-

威望
0
论坛币
1436 个
通用积分
28.3427
学术水平
58 点
热心指数
54 点
信用等级
41 点
经验
16755 点
帖子
648
精华
0
在线时间
826 小时
注册时间
2012-11-2
最后登录
2025-7-2

楼主
独孤浪人 发表于 2020-4-20 14:52:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

方法论重要性,不言而喻!在学术研究中,掌握方法论有助于指导科研实践工作。复杂的劳动包含着需要耗费或多或少的辛劳、时间和金钱去获得的技巧和知识的运用。我们的手无法抓住流金岁月,也挡不住年华似水,但它却能把握住最重要的命运。我们在这样一个黄金般的岁月里,就要争分夺秒地与时间赛跑!

文/杯中鸟911



在学术问题研究中,我们在考察因果关系时,经常会遇到因果关系考察中的内生性问题。一般而言,内生性问题主要来源于以下几个方面:(1)反向因果关系,即自变量影响因变量,因变量反过来也影响自变量,从而导致内生性。(2) 测量误差;(3)遗漏变量,遗漏的该变量与自变量相关并进入误差项,从而导致自变量与误差项相关,出现内生性问题;(4)样本自选择。然而,实证研究中所产生的内生性问题,容易导致的后果是所研究结论有偏且不一致性,使得所得结论不具有稳健性。在实证研究中,我们将有多种解决方面予以处理和解决内生性问题。

为此,本期文章将从“样本自选择”导致的内生性问题出发,来阐述其解决的办法——Heckman二阶段分析模型的操作方法。Heckman两步法主要用于解决实证研究中所获得的数据不能代表研究总体而导致的样本选择问题。样本选择偏差既可能是由非随机抽样所导致的,也可能是由自选择问题所导致的。

1、方法一:Heckman 因变量控制变量, select (自变量哑变量 =工具变量其他影响因素-控制变量) twostep

   

2、方法二:先在第一阶段中计算出除逆米尔斯比率IMR,再在第二阶段中将逆米尔斯比率imr作为控制变量,予以考察。基本步骤如下:

步骤1: 通过运用probit模型计算影响所考察变量的哑变量(0-1)的影响因素(即“第一阶段”),

步骤2: 在上述一步基础上,计算预测:predict w,xb,

步骤3: 再次,计算生成:gen IMR=normalden(w)/normal(w),

步骤4: 最后,将所生成的逆米尔斯比率IMR引入主要考察模型,并予以控制(即“第二阶段”)。

或者,将Heckman两步法解读为:

第一阶段,建立Probit选择模型。用以估计存在选择偏差变量发生的可能性,并计算逆米尔斯比率(Inverse Mills Ratio,简称IMR)。IMR的作用是为每一个样本计算出一个用于修正样本选择偏差的值。如果IMR大于0,表明样本存在选择性偏差,此时采用Heckman两步法选择模型估计是恰当的修正。

第二阶段,利用选择性样本观测值,将第一阶段估计的IMR与其他变量一起放入第二阶段的回归模型中。自选择问题已经通过第一阶段的选择模型得以修正,并在第二阶段由IMR反映出来。

3、一方面,该模型的运用需要一个工具变量,需要引起作者的重视,但不知为何有的文献作者在运用该模型时并没有引入工具变量,但笔者认为,该方法的运用需要在第一阶段中引入工具变量。另一方面,在第一阶段中,因变量为0-1哑变量,所以第一阶段一般都是运用Probit分析模型。此外,在第二阶段分析中,当引入IMR予以控制后,选择偏误调整项IMR系数如果通过显著性检验,这表明虚拟变量选择的内生性偏误一定程度是存在的,这表明采取文章分析样本自选择问题是必要的,这将进一步提升文章研究结论的稳健性。

4、需要注意的是,方法一中Heckman直接命令代码的运用具有明显的局限性,这里的因变量一般要求为“连续性变量”,而当因变量为哑变量(0-1)或其他非连续性变量时,上述方法一的直接运用将存在明显的统计偏误。为此,当在实证研究过程中,遇到因变量为非连续性变量时,方法一不再适用,可借鉴方法二,将Heckman二阶段分析进行拆分。

5、当然,如有需要,笔者将推荐阅读两篇有关Heckman二阶段分析模型运用的实证文献,以加深对该方法的熟悉和运用。如果需要下载这两篇文献的读者,请关注笔者推荐的微信公众号,发送关键词“Heckman方法运用的样板文献”至公众号对话框,可获得百度网盘下载。过程不复杂,欢迎下载!


文作者:杯中鸟911,经管学院Ph.D,现清华学习;

微信公众号:社经研究社;

知乎用户名:络腮胡点经;

个人专注学术心得感想、社会与经济。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


回帖推荐

qgmyysj 发表于2楼  查看完整内容

该模型的运用需要一个工具变量,需要引起作者的重视,但不知为何有的文献作者在运用该模型时并没有引入工具变量,但笔者认为,该方法的运用需要在第一阶段中引入工具变量。 这个说的非常好,典型的案例--妇女收入那个就有,但我看了几个文章,没有,包括国外的,不知道为什么。 我现在做中国企业对外投资模式选择问题,以投资模型为01因变量,自变量包括东道国的GDP、制度环境等,还有公司的规模、国际化经验等。这个问题应该涉及 ...
已有 2 人评分经验 学术水平 热心指数 信用等级 收起 理由
primmxz + 5 + 5 + 5 精彩帖子
qgmyysj + 100 + 5 + 5 + 5 精彩帖子

总评分: 经验 + 100  学术水平 + 10  热心指数 + 10  信用等级 + 10   查看全部评分

公号:经管定量笔记。经管学院Ph.D,现清华学习。

沙发
qgmyysj 在职认证  发表于 2020-8-10 23:00:25
该模型的运用需要一个工具变量,需要引起作者的重视,但不知为何有的文献作者在运用该模型时并没有引入工具变量,但笔者认为,该方法的运用需要在第一阶段中引入工具变量。
这个说的非常好,典型的案例--妇女收入那个就有,但我看了几个文章,没有,包括国外的,不知道为什么。
我现在做中国企业对外投资模式选择问题,以投资模型为01因变量,自变量包括东道国的GDP、制度环境等,还有公司的规模、国际化经验等。这个问题应该涉及自选择问题,因为不是所有公司都对外投资,所以第一阶段为是否投资,第二阶段为投资模式。
请问,这种情况,用什么作为工具变量好呢。多谢!

藤椅
yuenaodao13609 发表于 2021-1-3 09:43:01
qgmyysj 发表于 2020-8-10 23:00
该模型的运用需要一个工具变量,需要引起作者的重视,但不知为何有的文献作者在运用该模型时并没有引入工具 ...
请问您解决了么?我现在也遇到类似的问题 想请教您

板凳
回忆de沙漏 学生认证  发表于 2021-1-3 16:22:09
提示: 作者被禁止或删除 内容自动屏蔽

报纸
bellman2010 发表于 2021-11-20 21:07:18
qgmyysj 发表于 2020-8-10 23:00
该模型的运用需要一个工具变量,需要引起作者的重视,但不知为何有的文献作者在运用该模型时并没有引入工具 ...
可是,如果有工具变量就直接用工具变量就好了,还用什么亨克曼(手动狗头)

地板
微观计量小白白 学生认证  发表于 2021-12-17 09:40:17
说的很好,可我还是不会

7
readerW 发表于 2022-5-18 16:25:25
请问第二阶段回归要加if wage ==1吗

8
星星在唱歌~ 发表于 2024-4-19 20:35:52
qgmyysj 发表于 2020-8-10 23:00
该模型的运用需要一个工具变量,需要引起作者的重视,但不知为何有的文献作者在运用该模型时并没有引入工具 ...
请问解决了吗?遇到了相同的问题,想请教您一下

9
赵安豆 发表于 2024-5-6 15:32:55
... 自选择问题。Heckman二阶段模型由经济学家James Heckman提出,主要用于处理在劳动经济学领域常见的样本选择偏误。

第一阶段:在这一阶段,建立一个样本选择模型,预测个体是否被选入研究样本的可能性。通常使用Logistic回归或Probit回归来估计这个选择过程,并考虑可能影响样本选择的控制变量(如个人特征、社会经济状态等)。

第二阶段:在确定了样本选择的概率之后,将第一阶段的预测结果作为解释变量,与原模型中的自变量一起纳入线性回归方程中,对因变量进行估计。这样可以调整因变量估计值,以纠正由样本选择偏误导致的内生性问题。

Heckman模型的关键在于,它通过引入样本选择机制来校正估计偏差,提供更准确的因果效应估计。然而,该方法也有其局限性,如对模型假设的严格要求、参数估计的复杂性以及解释结果时需要谨慎等。

在实际操作中,使用Stata、R或Eviews等统计软件可以方便地实现Heckman二阶段模型的计算。同时,为了确保结果的有效性和可靠性,研究者还需结合其他方法(如工具变量法、倾向得分匹配等)进行实证检验和对比分析,以增强研究结论的稳健性。

总之,掌握并运用Heckman二阶段模型对于解决样本自选择问题、提高因果推断的准确性具有重要意义。在实证研究中,我们应该根据具体问题灵活选择和综合运用各种统计方法,以期得出更可靠的研究成果。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注ddjd
拉您入交流群
GMT+8, 2025-12-25 11:20