2SLS 是一类估计方法的统称,也即我们平时所言的两阶段最小二乘法,我想细节和过程不必赘述。
Treatment Effect Model 可以视为一个特殊的内生性问题,其特征是内生变量为 0/1 变量。因此,第一阶段的回归不能再用 OLS,而是使用了 Logit 或 Probit,并以此为基础得到所谓的 hazard ratio;在第二步的回归中,在原有模型设定的基础上,加入 Hazard ratio 来调整内生性导致的偏误(详情 help treatreg,查看电子说明书中有关 Method 部分的说明)。
所以,你提到的文献中的处理方法,从严格意义上来讲,是不对的。至于二者之间的偏差有多大,由于没有做过相关的模拟,也没有看到相关的文献,目前还不得而知。
*==============Appendix===================
*--------
*-4.2.1.2 处理效应 Treatment effect
*- Y = X*b1 + D*b2 + U
* D is 0/1 变量, 内生
*
*-本质:一个内生的 0/1 变量 (一个特殊的 IV 问题)
* 例 1:Y=ROA, D=是否实施股权激励(Yes=1, No=0)
* 例 2:Y=Wage,D=是否大学毕业(Yes=1, No=0)
*
* 内生性问题的根源:业绩好的公司更倾向于实施股权激励
* 能力强的人更可能顺利读完大学
*-其它例子:
*- 是否读博士?
*- 是否建立政治关联?(游说, 贿赂, 当选人大代表等)
*- 是否实施多元化经营, 交叉上市, 兼并收购?
*-------------------
*-4.2.3 处理效应模型 Treatment Effect Model
*--------
*-4.2.3.1 二元模型设定
help treatreg // Also see | Manual: [R] treatreg
shellout "$R\Stata_Treatreg.pdf"
*-Primary regression equation:
*
* y_j = X_j*b1 + T_j*b2 + e_j (1) e_j~N(0,sigma^2)
*
*-Treatment equation
*
* T_j* = W_j*gamma + u_j (2) Latent variable
* u_j~N(0,1)
*-Decision rule:
*
* { 1 if (T_j*>0)
* T_j = { Note: T_j 是可以观察到的
* { 0 otherwise
*
* Corr(e_j, u_j) = rho // 内生性的根源
*
*- rho<0,表明 OLS 低估了 T_j 对 y_j 的边际影响;
*- rho>0,表明 OLS 高估了 T_j 对 y_j 的边际影响;
*--------
*-4.2.3.2 估计方法
*-最大似然估计 (Maxlikelihood Estimation, MLE)
*-基于二元联合正态分布函数
*-两步法 (Two-step Estimation)
*-Step1: Probit (Treat Equation) --> Prob(Z=1)
* probit T w
* { H = normden(wb)/normal(wb) if T=1
* Hazard: {
* { H = -normalden(wb)/(1-normal(wb)) if T=0
*-Step2: reg y X z H // regression Equation 中加入 hazard
|