在双重差分(DID)模型中引入交互固定效应以及单独的时间固定效应是为了更好地控制不可观测的异质性和时间趋势的影响。但当您尝试将模型转换并包含个体×时间的交互固定效应时,确实需要谨慎处理控制变量,以防止它们被固定效应吸收。
在标准的DID设置下,我们通常有:
\[ Y_{it} = \beta_0 + \delta Post_t + \gamma Treatment_i + \tau (Post_t \times Treatment_i) + \epsilon_{it} \]
其中:
- \(Y_{it}\) 是被解释变量
- \(Post_t\) 是政策实施后的指示变量(如果年份在政策实施后则为1,否则为0)
- \(Treatment_i\) 是处理组的指示变量(如果个体i属于处理组,则为1;否则为0)
加入交互固定效应,您实际上是在控制每一个个体每年的独特效果。在这种情况下,模型可以写作:
\[ Y_{it} = \beta_0 + \sum_{i}\sum_{t} \alpha_{it} + \tau (Post_t \times Treatment_i) + X'_{it} \gamma + \epsilon_{it} \]
其中:
- \(\sum_{i}\sum_{t} \alpha_{it}\) 代表个体×时间的交互固定效应
为了防止控制变量 \(X'_{it}\) 被这些固定效应吸收,通常的做法是将它们中心化(centering),即从每个变量中减去其平均值。这样做的原因是,通过中心化,您实际上是在控制每个变量在个体和时间维度上的平均趋势,而交互固定效应可以捕捉到超出这个平均趋势的特定于个体和时间的影响。
但基于您的模型设定:
\[ Y_{it} = \beta_0 + Regulation_t + X'_{it}\gamma + \epsilon_{it} \]
其中 \(Regulation\) 是一个表示政策变化(政策开始年份之后为1)的变量,您直接使用 \(X'_{it}\) 而非将其与 \(Post_t\) 交互可能是更合适的选择。这背后的想法是,控制变量 \(X'_{it}\) 应该反映的是那些不随政策改变而变化的影响因素。
然而,在一些情况下,如果您的控制变量在实施政策前后具有不同的效应,那么将它们乘以 \(Regulation\)(或者在一个更传统的DID设置中使用 \(Post_t \times Treatment_i\))可以捕捉到这种差异。但是正如您所经历的那样,这样做可能会导致模型中的其他变量(如核心解释变量)因为共线性而被omitted。
因此,我的建议是:
1. 确保您的控制变量在理论上不会随政策变化有根本性的不同。
2. 如果确信某些控制变量效应会改变,则可以考虑与 \(Regulation\) 进行交互,并且进行适当的模型诊断(如检查多重共线性)来确保模型的稳健性。
希望这能对您有所帮助!
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用