|
反向因果推断(Reverse Causal Inference)是一种统计学方法,用于从观察数据中估计因果效应,尤其是在存在潜在或未观察到的混淆变量(confounding variables)的情况下。DID(Difference in Difference)是其中一种常见的反向因果推断方法,通常用于评估政策或治疗的效果,在此基础上,可以通过引入平行趋势假设来进行分析。本文将介绍如何编写DID和平行趋势的代码。
DID
设有一个二元指示器D,表示一个个体是否接受了政策/治疗,在t时刻之前(即t-1时刻)和之后(即t时刻)分别测量了一个感兴趣的结果变量Y。这里我们假设有一个混淆变量X,它可能对Y产生影响,就是说,X可能同时影响D和Y。然而,在接受政策/治疗的那些个体中,我们预期X的分布不会随着时间发生显著变化。这意味着,如果我们比较接受政策/治疗的个体和不接受政策/治疗的个体在t-1时刻到t时刻之间Y的变化,我们就可以得到政策/治疗对Y的因果效应。
我们可以用以下公式来估计政策/治疗对Y的效应:
�
(
�
1
,
�
−
�
1
,
�
−
1
−
�
0
,
�
+
�
0
,
�
−
1
∣
�
=
1
)
−
�
(
�
1
,
�
−
�
1
,
�
−
1
−
�
0
,
�
+
�
0
,
�
−
1
∣
�
=
0
)
E(Y
1,t
−Y
1,t−1
−Y
0,t
+Y
0,t−1
∣D=1)−E(Y
1,t
−Y
1,t−1
−Y
0,t
+Y
0,t−1
∣D=0)
其中,Y1和Y0分别代表接受政策/治疗和不接受政策/治疗的结果变量。这里我们假设政策/治疗只有在t时刻才会影响Y,而不会在之前的任何时刻产生作用。通常情况下,上述公式是无法直接计算的,需要使用统计软件进行计算。
在R语言中,我们可以使用“lm”函数来进行DID分析。具体实现代码如下:
|