双重差分法(Difference-in-Differences,DID)是一种用于评估政策或处理效应(treatment effect)的准自然实验方法,通过比较处理组和对照组在政策实施前后的变化差异来识别因果效应。以下是DID的基本步骤和详细说明:
1. 数据准备
- 数据结构:需要面板数据(Panel Data)或重复横截面数据(Repeated Cross-Sectional Data),包含:
- 处理组(Treatment Group):受政策影响的个体/地区。
- 对照组(Control Group):未受政策影响的个体/地区。
- 时间信息:政策实施前(Pre-treatment)和实施后(Post-treatment)的数据。
- 核心变量:
- 结果变量(Outcome Variable):如GDP、就业率等。
- 处理虚拟变量(Treat):处理组=1,对照组=0。
- 时间虚拟变量(Post):政策后=1,政策前=0。
2. 构建双重差分模型
基本模型形式为:[Y_{it} = \beta_0 + \beta_1 \cdot \text{Treat}_i + \beta_2 \cdot \text{Post}_t + \beta_3 \cdot (\text{Treat}_i \times \text{Post}t) + \epsilon{it}]
- 系数解释:
- (\beta_0):对照组的基线均值。
- (\beta_1):处理组与对照组的固有差异(时间不变)。
- (\beta_2):时间趋势(政策实施后对照组的平均变化)。
- (\beta_3):双重差分估计量(核心政策效应)。
3. 计算双重差分估计量
通过四类均值差异计算:
- 处理组前后差异:( (Y_{\text{Treat, Post}} - Y_{\text{Treat, Pre}}) )
- 对照组前后差异:( (Y_{\text{Control, Post}} - Y_{\text{Control, Pre}}) )
- 双重差分:
[\hat{\beta}3 = (Y{\text{Treat, Post}} - Y_{\text{Treat, Pre}}) - (Y_{\text{Control, Post}} - Y_{\text{Control, Pre}})]
4. 模型扩展与控制变量
加入控制变量:减少遗漏变量偏差,模型扩展为:
[Y_{it} = \beta_0 + \beta_1 \cdot \text{Treat}_i + \beta_2 \cdot \text{Post}_t + \beta_3 \cdot (\text{Treat}i \times \text{Post}t) + \gamma X{it} + \epsilon{it}]
- (X_{it})为控制变量(如个体特征、地区经济水平等)。
- (X_{it})为控制变量(如个体特征、地区经济水平等)。
时间趋势控制:加入个体或时间固定效应(如双向固定效应模型)。
5. 稳健性检验
平行趋势检验:验证处理组和对照组在政策前的趋势是否一致。可通过以下方法:
- 画趋势图:比较两组政策前的走势。
- 动态DID:加入政策前的时间虚拟变量交互项,检验其系数是否显著(应不显著)。
安慰剂检验:
- 虚构处理时间或处理组,验证(\beta_3)是否为零。
- 置换检验(Permutation Test):随机分配处理组,重复估计系数分布。
其他检验:
- 处理组和对照组的协变量平衡性。
- 排除同期其他政策干扰。
6. 结果解释
- (\beta_3)显著为正/负:政策有效/无效。
- 需结合经济意义和统计显著性分析,注意置信区间。
示例(简化)
假设评估“最低工资政策”对就业的影响:
- 处理组:实施政策的地区;对照组:未实施政策的地区。
- 结果变量:就业率。
- 回归结果:若(\beta_3 = -0.05)(显著),说明政策使就业率降低5%。
注意事项
- 平行趋势假设:DID的核心前提,需严格验证。
- 样本选择:对照组需与处理组具有可比性。
- 时间跨度:政策前后需有足够时间段。
- 异质性处理效应:考虑动态效应或分组异质性(如事件研究法)。
通过以上步骤,DID能够有效控制不可观测的固定效应和时间趋势,从而更准确地识别政策效果。实际应用中需结合Stata/R等软件实现(如did、fixest等包)。


雷达卡




京公网安备 11010802022788号







