人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版 › Stata学习：内生性处理新命令eregress

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 下一页

发帖

楼主: 698348

7806 12

[stata资源分享] Stata学习：内生性处理新命令eregress [推广有奖]

0关注
110
粉丝

副教授

38%

还不是VIP/贵宾

威望: 0 级
论坛币: 53 个
通用积分: 6.5568
学术水平: 67 点
热心指数: 82 点
信用等级: 30 点
经验: 8631 点
帖子: 451
精华: 1
在线时间: 155 小时
注册时间: 2017-2-7
最后登录: 2021-1-29

楼主

698348

发表于 2017-9-21 21:24:17 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

Stata学习：内生性处理新命令eregress

内生性问题几乎是研究过程中不可避免的，然而，这一问题的解决历来是一大难题。致力于服务经验研究者的Stata公司也关注到了这方面的强大的需求，并在Stata15中增加了一个专门处理内生性问题的命令模块——Extended regression models (ERMs)，包括eregress,eintreg, eprobit 以及eoprobit等命令。我们将通过一个推文系列对这一模块中涉及的命令逐个进行介绍。

一、语法介绍
在Stata15中输入helperegress命令可知，eregress主要用于处理线性回归中导致内生性的以下三种情况：内生协通过变量，非随机对照试验，以及内生样本选择问题。今天我们主要关注如何使用eregress命令处理线性模型中存在内生协变量的问题，即使用eregress命令进行工具变量回归。

eregress的基本语法如下：

eregress depvar [indepvars],endogenous(depvars_en = varlist_en) [options]

其中，depvar为被解释变量；indepvars为外生控制变量；depvars_en为内生协变量；varlist_en则包括工具变量和影响内生变量的其它控制变量。遵行工具变量法的计量原理，eregress命令会根据用户输入的变量，构建主回归方程（main）和辅助（auxiliary）回归方程，并使用最大似然法对模型进行估计。

二、案例介绍
【小案例】：某项目欲探究学生的高中平均成绩（hsgpa）对大学平均成绩（gpa）的影响（为了使研究更加简化，忽略退学等因素的影响）。因此，这里的被解释变量就是大学平均成绩（gpa），解释变量就是高中平均成绩（hsgpa）。考虑到家庭因素，如家庭收入（income），也可能会对学生的成绩产生影响，也需要对其进行控制。

这里首先构造基本的OLS回归，程序如下：
clear
webuse class10
reg gpa hsgpa income

QQ图片20170921210821.png

回归结果显示，hsgpa的系数为1.61，且在1%的水平上显著，表明高中平均成绩会对大学成绩产生显著影响。

然而，此处的OLS回归存在严重的内生性问题——遗漏变量。因为存在一些不可观测因素既会影响高中平均成绩（hsgpa）也会影响大学平均成绩(gpa)。比如高中成绩好的学生可能本身智商(IQ)就很高，其大学成绩好很可能是由智商导致的，而非高中平均成绩。

研究人员通过分析认为一所高中的竞争力会影响学生的成绩，而一旦高中平均成绩(hsgpa)得到控制，高中的竞争力对大学平均成绩(gpa)的影响就可以忽略。因此他们选择高中的排名（hscomp）作为高中GPA的工具变量(IV)。这一IV的选择符合工具变量的筛选标准，首先高中的排名是学生所不能控制的，是独立于学生系统的外生因素，因此排除了其他因素的影响，满足外生性要求。第二是因为高中竞争力和高中生的平均成绩是（hsgpa）高度相关的，一般情况下，排名靠前的高中，学生的成绩也更好。实际操作中，把高中竞争力（hscomp）分为低水平高中（low）、普通高中（moderate）和高水平高中（high）。下面运用eregress命令，进行拓展的线性回归：

eregress gpa income, endogenous(hsgpa = income i.hscomp)

QQ图片20170921210831.png

回归结果表格的上部分，报告了主回归方程的估计结果，被解释变量为gpa；回归结果表格的下部分报告了辅助回归方程的估计结果，被解释变量为hsgpa。在辅助回归方程中，我们通过引入外生变量hscomp作为hsgpa的工具变量，同时控制income，来控制内生性带来的影响。主回归方程的估计类似于regress命令，根据回归结果发现高中gpa的不同会导致大学gpa存在1.24的差异。

需要注意的是，虽然eregress回归中，hsgpa的系数相较于OLS回归有所降低，但是其标准误却上升了。如果选择的IV外生性比较差，或者与内生变量之间的相关性较低（弱工具变量），eregress估计的误差也会更大。

三、eregress vs ivreg2
部分童鞋可能会好奇这里的eregress和ivreg2有什么区别呢？这里我们做一个简单的对比。首先，对比eregress，我们生成两个虚拟变量作为hsgpa的工具变量：
tab hscomp, gen(hscomp)
然后使用ivreg2进行估计：
ivreg2 gpa income (hsgpa = hscomp2 hscomp3), liml savefirst

考虑到eregress命令使用的估计方法为最大似然估计，在使用ivreg2时我们也通过加入liml选项将估计方法设置为最大似然估计。一些文献研究发现：（1）在大样本的情况下，liml估计量和两阶段最小二乘是渐进等价的，而在非大样本的情况下，liml估计量比两阶段最小二乘法具有更好的小样本估计性质，因为在有限样本之中两者对工具变量赋予的权重不同；（2）在工具变量并不十分有效的情况下，尤其是在有限样本中，相对于两阶段最小二乘和广义矩估计，liml的偏误较小。估计结果如下图：

QQ图片20170921210840.png

通过对比可以发现，使用ivreg2命令和eregress命令得到的估计结果是相同的。因此，eregress命令包的主要亮点可能在于将处理内生性问题的命令进行了整合，使得code写起来更加简洁。

本文旨在介绍eregress命令的相关用法，对于所选工具变量的有效性并未进行评估；关于计量上的表述错误或者技术上的错误，还请读者不吝指出。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏44 回帖

关键词：内生性处理 Stata学习 Stata eregress命令

本帖被以下文库推荐

· 日新文库：Stata入门及进阶|主题: 1226, 订阅: 457

使用道具举报

沙发

qchangcheng

发表于 2018-11-13 23:38:57 |只看作者 |坛友微信交流群

谢谢楼主啊

使用道具举报

藤椅

超能小墨 发表于 2018-12-9 19:53:33 |只看作者 |坛友微信交流群

楼主，你好，请问工具变量的有效性怎么评估呢，是eregress输出结果最后的工具变量的误差项和被解释变量误差项的相关系数是否显著吗吗，也就是你那个图里的0.002

使用道具举报

板凳

whutiger 发表于 2018-12-25 15:41:21 |只看作者 |坛友微信交流群

谢谢

使用道具举报

报纸

楚天江南客

发表于 2019-1-2 13:20:28 |只看作者 |坛友微信交流群

楼上是武大的吗？

使用道具举报

地板

xiaozhiliu999 发表于 2019-1-14 11:26:14 |只看作者 |坛友微信交流群

请问楼主，该命令只能在stata15中使用吗？

使用道具举报

7楼

小明jill 发表于 2020-1-8 15:30:17 |只看作者 |坛友微信交流群

请问有eoprobit 命令介绍吗

使用道具举报

8楼

shaoqiwen5 发表于 2020-3-20 18:36:02 |只看作者 |坛友微信交流群

是只有stata15有eregress么，stata14安装不了？

使用道具举报

9楼

jfm_scu 发表于 2020-4-30 19:56:22 |只看作者 |坛友微信交流群

小明jill 发表于 2020-1-8 15:30
请问有eoprobit 命令介绍吗

eoprobit道理同eprobit，可同时解决内生性(工具变量)，非随机分配，样本选择性偏差；可以自行选择内生变量的类型，支持内生虚拟变量、内生有序变量等

使用道具举报

10楼

18765571369 发表于 2021-5-5 20:20:18 |只看作者 |坛友微信交流群

jfm_scu 发表于 2020-4-30 19:56
eoprobit道理同eprobit，可同时解决内生性(工具变量)，非随机分配，样本选择性偏差；可以自行选择内生变量 ...

请教：eprobit的命令是啥，谢谢

使用道具举报

返回列表

12 下一页

发帖

本版微信群

加好友,备注jltj
拉您入交流群

手机版 |

意见反馈 |

帮助 |

新手入门 |

用户手册 |

友情链接 |

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[stata资源分享] Stata学习：内生性处理新命令eregress [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本帖被以下文库推荐

本版微信群

扫码加我拉你入群