内生性(Endogeneity)是实证研究中经常被质疑,不能回避的难题。
究竟什么是内生性?为什么一定要揪住内生性不放?
换言之,忽略内生性将导致什么后果?为什么会产生内生性?内生性来源于哪里?如何判断是否存在内生性?如何检验内生性?
我们经常听到多种不同的“内生”,如内生变量 (Endogenous covariates)、内生样本选择(Endogenous sample selection)、内生处理指派(Endogenous treatment assignment)等,这些概念之间有什么区别和联系?
仅以内生变量为例,我们还会面临以下困惑:内生变量可否取离散形式?可否包含内生变量的二次项或更高次项?如何应对多个内生变量?多个内生变量是否允许交互?内生变量是否可与外生变量交互?内生变量的决定方程中若又包含内生变量,又该如何处理?
如果存在内生性,怎么应对内生性?若一项研究同时涉及到多种内生性时,又该怎么办?针对不同的内生性是否要采取不同的应对方法?这些不同的方法如何整合?当不同的内生性同时出现并且相互交织在一起时,又该怎么办?
!!!
STATA的扩展回归模型(ERM,EXTENDED REGRESSION MODELS),用一条命令同时处理内生变量、内生样本选择、内生处理指派和随机效应。ERM适用于连续变量、0-1变量和有序多元离散的因变量、自变量和工具变量,也允许变量取高次项以及变量之间的交互,还可用于面板数据和层次模型。
ERM在单独应对某类内生性时,等价于以下传统的十多种STATA命令:regress,ivregress,gmm(广义矩估计), heckman, tobit, intereress, probit,oprobit, teffects, etregress(内生处理回归), movestay(内生转换模型,endogenous switching regression),ivtobit,xtregress, xtprobit,xtoprobit, xtivreg, 等等。
更重要的是,ERM可以同时应对多种内生性问题。
ERM虽然名为扩展回归模型,但却基于多元正态分布和极大似然估计。
Stata宝典——《Stata十八讲》作者陈传波专题直播丨内生性来源好评如潮: