在使用`regife`命令进行交互固定效应模型估计时遇到稳定性问题可能是由多种因素导致的。根据你的描述,主要关注点在于引入省份与年份的交叉固定效应后结果不一致,而城市-年份交互没有出现类似情况。
这可能涉及到几个方面:
1. **数据处理**:检查省份变量(`pro`)是否正确设置。确保它是一个分类变量,并且在所有观察值中都正确编码。如果存在缺失值或者错误的编码,可能导致结果不准确或不稳定。
2. **吸收固定效应的能力**:`regife`命令通过特征分解等方法处理固定效应,但当吸收的类别数非常大时(如省份-年份交互),可能会遇到计算问题,导致结果波动。尤其是如果省份数量多于城市数量,且跨年度数据集较大,则更易出现此类现象。
3. **样本量与分组**:每个省份在不同年份可能的数据点较少,这会影响模型的估计稳定性。尤其当某个组合下的观测值过少时(如某些省份某年的数据缺失),可能导致显著性检验或系数估计结果大幅变动。
4. **模型设定**:考虑是否真的需要同时控制城市和省份-年份交互效应。如果两者在概念上有重叠(比如,不同城市的特征很可能与其所在省份有高度相关性),则可能引发多重共线性问题。
解决策略:
- **数据清理与检查**:再次核对数据处理过程,确保没有异常值或缺失信息。
- **模型简化**:考虑是否可以合理地仅使用城市固定效应或探索其它模型设定(如面板分位数回归、混合效应模型等),以避免吸收过多的交互固定效应带来的计算负担。
- **增加数据量**:如果可能,尝试获取更多观测值,特别是那些省份与年份组合中数据较少的部分。
- **稳健性检验**:使用不同方法估计相同模型(如普通最小二乘法、随机效应或混合效应回归),并比较结果的一致性和稳定性。
此外,考虑到`regife`命令的特殊性质和计算复杂度,在遇到问题时寻求专业统计软件的支持或者尝试其他具备高级固定效应处理能力的命令/函数可能也是个不错的选择。例如在Stata中可以考虑`reghdfe`等插件,它们在处理大量吸收项方面可能更加稳健。
最后,保持对模型设定和结果解释的审慎态度是非常重要的,确保理论与数据分析方法相契合。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用