|
一、synth对数据的要求
synth用到的数据可以有部分缺失值,但是有些值是必要的。
1.处理组(treated unit)
处理单元的被预测变量不能有缺失值,否则会有这样的提示:treated unit: for 1 of out 1 units outcome variable y is missing in 2000 pre-intervention MSPE period - check mspeperiod()
2.控制组(UNtreated unit)
控制组中部分变量有缺失值时,synth在计算时会有这样的过程:
control units: for 13 of out 270 units missing obs for predictor x in period 2012 -ignored for averaging
即预测变量x 2012年的270个个体中,有13个缺失值。通过平均来忽略。
但是某一变量不能出现某一年数据都缺失的情况,否则会有这样的提示:
control units: for at least one unit predictor x is missing for ALL periods specified
比如预测变量x在2000年数据全部缺失,计算也是没有办法进行的。可以选择换其他的预测变量。如果缺失值前后的数据完整,可以用插值法补齐。
控制组的被预测变量也不能有缺失值,否则会有这样的提示:
control units: for 1 of out 29 units outcome variable y is missing in 2000 pre-intervention MSPE period - check mspeperiod()
二、Synth前的数据处理
其实在进行合成控制之前,理论上讲没有很大的必要做季节调整、趋势分解之类的处理,因为合成控制的因子模型已经将数据的时变因素考虑在内。
不过,在处理期前能否成功合成,和被预测变量本身的数值有很大关系。尤其对于自行计算的被预测变量,比如各种指数、效率值等等变量,合成的效果与数据的质量优很大关系。被预测变量的数据过于波折、不同面板之间差异过大的被预测变量可能会不好合成。
|