连玉君老师在知乎专栏中提供的是面板数据中对不同子样本(或分组)的回归系数进行比较的方法。当您提到使用三种方法得到的结果差异很大时,这通常是因为每种方法都在控制不同的偏差源,并且假设了关于数据结构的不同前提。
1. **组内去心法**:这种方法通过去除个体固定效应来控制不可观测的异质性。它适用于当你认为不同分组(如大学与非大学毕业)之间的差异主要源于个体层面的固定特性,而你关心的是这些固定特性去除了之后的系数变化。
2. **其他可能的方法包括使用交互项**:在模型中加入一个表示分组的虚拟变量及其与核心解释变量的交互项。这样可以直接估计不同子样本之间系数的差异。
3. **双重差分法(Difference-in-Differences, DID)或类似设计**:这通常用于分析政策影响等,通过比较干预前后的变化来评估效果。这种方法更侧重于时间点上的变化而非组间固定效应。
当结果显著不同时,应当回顾每种方法的假设和适用场景:
- **数据结构**(是否存在个体固定效应、时变效应)
- **研究目标**(关注长期影响还是特定干预的影响)
- **模型规格**(是否正确处理了异方差性、自相关等)
建议先检查数据的质量,确保没有明显的遗漏变量或测量误差。然后,基于理论和前期文献选择最合适的方法。如果可能,尝试解释不同方法下结果差异的原因,并在报告中讨论这些敏感性分析的结果。
最后,如果您对某个特定方法的实施细节有疑问(例如在Stata中的具体命令行),可以提供更具体的上下文或代码片段,以便进一步帮助理解您的问题。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用