DID中的balance问题
目前练习考察某一政策对企业投资的影响。数据结构如下:政策在省份层面,即2省(A,B省)在1990年实施了该政策,2个省(c,d省)直到1992年才实施该政策。数据为企业层面的面板数据。采用DID方法,即1992年A,B省中的企业为treat,其余企业为control.
使用DID的前提是被试省份与控制省份的企业在政策实施前具有可比性,即主要变量的均值大致相同(可以通过tt均值检验)。但我发现,1990年,(A,B)省中的企业与(C,D)省中的企业在关键变量(y,x1,x2,x3)的均值上具有很大差异。
此时,
1.应该如何处理?
2.是不是不能用DID方法?
3.是否可以进行样本筛选,即为那些被试组企业在控制省份中寻找类似的企业?即只选择那些匹配成功的企业?
4.在匹配时,需要对(y,x1,x2,x3)同时进行匹配,还是只需要(y,x1,x2,x3)中的几个变量满足匹配就可以了?
这种匹配与ps-score匹配不同。我只需要(y,x1,x2,x3)匹配成功了即可。
5.有没有这样的匹配方法及其命令?
谢谢。