楼主: kenjicx
25165 13

[其他] 时间虚拟变量因为多重共线性被删除!求教! [推广有奖]

11
japt 在职认证  发表于 2017-8-2 00:02:37
楼主请问你最后怎么解决的。。。我也是这个问题,去掉时间后,就不共线了。。。

12
zhangdoubleqing 发表于 2018-1-11 19:52:23
请问楼主最后这个问题怎么解决的?

13
钱恬楠 发表于 2019-3-11 16:45:52
同问啊楼主

14
赵安豆 发表于 2024-10-17 18:14:25
在使用面板数据模型(如Tobit模型)并引入年份和行业虚拟变量时,遇到Stata自动删除部分虚拟变量提示“多重共线性”的情况通常是由以下几种原因造成的:

1. **完全多重共线性**:如果某个年份或行业的样本全部缺失,或者所有样本点在该年份/行业内都具有相同的特征(例如,在进行分析的某些年份里,你的数据集中没有包含特定行业的情况),Stata会认为这种变量不能提供额外的信息,因此将其从回归中删除。这是为了避免模型不识别问题。

2. **线性组合**:当虚拟变量构成一个线性关系时,比如所有年份和行业的组合构成了完全覆盖的网格(无缺失情况),那么其中一个虚拟变量可以由其余的变量预测出来。例如,如果你有year1-year8 和industry1-industry39,而没有包括最后一年或行业,Stata会自动将最后一个省略作为基准组,以避免多重共线性。

解决办法:

- **调整模型**:你可以手动指定一个年份和行业作为参考组(即不包含这些虚拟变量),这样就可以避免完全共线性问题。例如,在回归命令中使用`i.year##i.industry`(对于Stata)可以自动处理交互项的多重共线性。

- **检查数据完整性**:确保你的样本在所有年份和行业中都有数据,不存在完全缺失的情况。如果有缺失,考虑是否需要填充这些数据或者对模型进行调整以适应实际情况。

- **逐步回归或特征选择**:如果存在大量虚拟变量,并且可能存在部分多重共线性而非完全共线性,可以尝试使用逐步回归(stepwise regression)或其他特征选择方法来减少模型中的变量数量,从而降低共线性的程度。

在具体操作时,请确保理解每一步对结果的潜在影响,以免引入偏差或错误解释。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-17 07:02