人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版 › Heckman两阶段模型

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: 郝冬梅

522 3

[回归分析求助] Heckman两阶段模型 [推广有奖]

2关注
0粉丝

高中生

77%

还不是VIP/贵宾

威望: 0 级
论坛币: 0 个
通用积分: 11.1988
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 327 点
帖子: 29
精华: 0
在线时间: 18 小时
注册时间: 2023-11-11
最后登录: 2024-6-8

楼主

郝冬梅 发表于 2024-5-20 20:21:47 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

在使用Heckman两阶段模型检验内生性时，选择方程的被解释变量是要用原模型的被解释变量是否取值来构造吗？选择方程的解释变量要怎么选取呀（相关文献找不到有讲到这个解释变量选哪个的，没得参考和引用）？急

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：heckman HEC Man 两阶段解释变量

相关帖子

使用道具举报

沙发

att006 发表于 2024-5-22 19:43:52 |只看作者 |坛友微信交流群

用Heckman两阶段模型（Heckman Selection Model）时，选择方程（selection equation）的被解释变量和解释变量的选取是一个关键问题。Heckman两阶段模型用于纠正选择偏差，通常包括两个方程：选择方程和结果方程。
选择方程的被解释变量（dependent variable）通常是一个二值变量，表示个体是否进入某个样本或者是否选择某个选项，变量通常取值为1或0。例如在劳动经济学中，可表示一个人是否参与劳动市场（1表示参与，0表示不参与）。如果原模型的被解释变量是一个连续变量，例如收入或消费，选择方程的被解释变量可以是这个连续变量是否大于零的二值变量。例如，如果原模型的被解释变量是收入，选择方程的被解释变量可以是 "是否有收入"（即收入是否大于零）。
选择方程的解释变量（independent variables）应该包括影响样本选择或决策选择的因素。选择这些变量时，有几个关键点需要考虑：
相关性。选择方程的解释变量应该与选择决策高度相关，应该能够很好地预测个体是否进入样本或做出某个选择。
排除限制。在理想情况下，选择方程中应该包含一些变量，变量对选择有影响，但对结果方程中的被解释变量没有直接影响（即这些变量在结果方程中是无效的）。这就是所谓的排除限制（exclusion restriction），有助于识别模型，例如在一个劳动市场参与的模型中，选择方程的解释变量可能包括家庭责任、配偶收入、是否有幼儿等，而这些变量可能不会直接影响劳动市场中的工资水平。
理论基础和先验知识。使用理论基础和先验知识来选择解释变量。即使有时具体的变量选择可能没有明确指出，相关文献中的理论讨论和经验研究可以提供有用的指导。以下是一个在Stata中设定Heckman两阶段模型示例。
假设有一个数据集，包含以下变量：
income（收入，结果方程的被解释变量）
education（教育水平，结果方程的解释变量之一）
experience（工作经验，结果方程的解释变量之一）
married（是否已婚，选择方程的解释变量之一）
children（是否有小孩，选择方程的解释变量之一）
用Heckman两阶段模型来纠正选择偏差。选择方程的被解释变量可以是income > 0（即是否有收入）。
可在Stata中设定模型：
// 生成选择方程的被解释变量
gen has_income = (income > 0)
// 运行Heckman两阶段模型
heckman income education experience, select(has_income = education experience married children) twostep
其中，has_income 是选择方程的被解释变量，表示是否有收入。选择方程的解释变量包括 education, experience, married, 和 children。结果方程的解释变量包括 education 和 experience。
这种方法可用Heckman两阶段模型来纠正选择偏差，并且确保选择方程和结果方程的设定合理。

使用道具举报

藤椅

钰裴然然333 发表于 2024-5-24 08:32:03 |只看作者 |坛友微信交流群

att006 发表于 2024-5-22 19:43
用Heckman两阶段模型（Heckman Selection Model）时，选择方程（selection equation）的被解释变量和解释变 ...

解释很清晰。

使用道具举报

板凳

赵安豆 发表于 2024-6-12 23:15:01 |只看作者 |坛友微信交流群

Heckman两阶段模型主要用于处理样本选择偏差问题。在构建模型时，确实需要区分两个不同的方程：一是选择方程，二是结果方程。

1. **选择方程**（Selection Equation）:
- 被解释变量通常是虚拟变量（0 或 1），指示个体或单位是否被选入样本中，即原研究中的观察值是否有效。例如，在劳动经济学的研究中，这可能是一个指示个人是否参与劳动力市场的变量。
- 解释变量应包含影响选择过程的因素，这些因素可以与结果方程中的解释变量不同（为了保证选择的独立性）。通常会包括一些仅影响选择而不直接影响结果的变量，以帮助识别模型。例如，在研究就业情况时，可能将教育水平、年龄等视为对就业有影响但不一定直接反映工资的因素。

2. **结果方程**（Outcome Equation）:
- 被解释变量是研究的主要关注点，如个人收入。
- 解释变量可以包括各种与被解释变量相关的因素。关键在于其中的某些变量也出现在选择方程中，并且在选择方程和结果方程之间存在相关性，以保证Heckman模型的有效性。

**如何选取选择方程中的解释变量？**

- **寻找“外生”变量**：这些是仅影响被选入样本的概率而不直接对结果产生影响的变量。
- **考虑理论依据**：基于研究问题和领域知识来判断哪些因素会影响样本的选择。例如，如果研究的是教育回报率，在选择方程中可以包括与入学决策相关的变量，如家庭背景、地区经济状况等。
- **检查相关文献**：尽管您提到相关文献中可能没有明确说明如何选择这些变量，但阅读其他类似研究中的方法和选择的变量能提供一定的指导。

在实际应用Heckman模型时，理解其原理并正确构建两个方程对于获得有效的结果至关重要。这通常需要结合领域知识、理论假设以及对数据特性的深入了解来完成。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用