这个问题讨论了那么久还是云里雾里,能不能爽快一点啊,直接说出答案呢?下面我说说我的理解,欢迎大家一起讨论!
我们知道,这篇文章的模型(1)为:Yst =a +b*Dst + c*Xst + As + Bt + e。其中,Yst 为收入分配;Dst为虚拟变量,即s州放松管制当年及以后年度取1,否则取0,(Dst, a dummy variable that equals one in the years after state s deregulates and equals zero otherwise);Xst应该是控制变量(Xst is a set of timevarying, state-level variables);As和Bt分别代表州固定效应和年固定效应。
这里的系数b是作者真正关心的变量,代表放松管制对收入分配的影响。但是,按照常规DID模型,Dst应该等于treated*time。其实这里也代表了。为什么?因为 s 就是treated,t 就是time。根据作者数据macro_workfile中的变量_intra,确实是放松管制当年及以后年度取1,否则取0,满足了time的定义。我们真正的困惑可能是treated,treated怎么不定义呢?只能理解成没有对照组,所以treated这一列向量全是1,就没有必要单列出来了。
结论:
1、Yst =a +b*Dst + c*Xst + As + Bt + e其实还是DID,只是DID模型的特例罢了(treated全部等于1,即 s 等于1);
2、如果有对照组,把对照组的treated定义为0即可;
3、如果有对照组,还是把模型写成Yst =a + f*Ds + g*Dt + b*Dst + c*Xst + As + Bt + e吧。
4、总之,本文对此DID持怀疑态度,只是他发表的期刊比较牛罢了。