楼主: sunglax
1483 5

[面板数据求助] 面板数据的多重共线性问题 [推广有奖]

  • 0关注
  • 0粉丝

高中生

2%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
72 点
帖子
6
精华
0
在线时间
58 小时
注册时间
2023-10-24
最后登录
2025-5-14

楼主
sunglax 发表于 2023-10-24 17:31:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  请问各位老师和同学,在做短面板固定效应模型时,需要考虑多重共线性问题吗?我将面板数据看作pooled data处理来检验多重共线性,有两个变量vif高达25,这两个变量又是显著的,而且基于研究不能剔除或增加变量,是否有其他解决方法?或者可以不做共线性检验吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多重共线性问题 多重共线性 面板数据 多重共线 共线性

沙发
Cohen_houston 学生认证  发表于 2023-10-25 23:48:00
首先我觉得有一点需要强调一下,一个变量的VIF 高意味着这个变量作为一个predictor对你dependent variable(因变量)的贡献可以很大程度上被回归中其他变量所解释。因为变量D 的 VIF 归根结底就是个 1/(1-R-square[d]), 这个R-square[d]就是你用你回归中其他控制变量对d 进行回归得到的R-square。正因如此,高VIF意味着:变量D并不是影响你dependent variable(因变量)的新因素,是可以被舍弃的,所以我对你说的“基于研究不能剔除或增加变量” 表示不理解。你基本上是在说:”基于研究,我不能删除一个在回归上显得冗余的变量。“ 作为一个审稿人,我不接受这样的论述。

可能存在问题和解决方式:
(1) 数据问题: 是不是自己处理数据时候出现了问题,有code或者逻辑上的错误,这会导致不必要的变量相关性。包括但不限于,数据拟合中出现的问题,缺失值处理不当。
(2)前置研究论断有误:如果前置研究一致肯定你的这个冗余变量是必须的,那么你也可能可以勇敢去质疑他们(但是必须基于你数据处理过程的严谨性和完备性)
(3)raw data 中不同变量间 covariance太高:针对这个问题,你可以尝试 centerizing 所有参与回归的变量。一般来说,这都会显著降低变量之间的covariance,但是因为你控制了固定效应,所以对回归系数的影响应该不大。

希望上面的个人看法对你的研究有帮助。建议以严谨研究为前提,按照(1) -> (2) -> (3) 的步骤来审视你的问题。祝科研顺利。

藤椅
oliyiyi 发表于 2023-10-26 09:08:33
如果个体内部存在高度共线性,可以考虑以下方法:
删除共线性严重的变量之一
构建正交化的交叉项,取代原始交叉项
使用主成分分析等方法构建正交变量
采用整体化方法,如脊回归等
容忍一定程度共线性,因为固定效应模型可以部分缓解这个问题

板凳
einskang 发表于 2023-11-1 09:59:00
实践中,多重共线性多模型拟合的伤害不算大,但是对特征的参数影响较大,或者说变量的解释能力影响较大,如果你想用这个变量去解释对目标标签的拟合能力,那踢出相关性较大的变量是前提。如果只是考虑模型拟合的好坏,可以加下正则等处理措施保证模型效果就行。多重共线性在机器学习中很少单独、专门去检验。

报纸
sunglax 发表于 2023-12-4 16:43:27
Cohen_houston 发表于 2023-10-25 23:48
首先我觉得有一点需要强调一下,一个变量的VIF 高意味着这个变量作为一个predictor对你dependent variable ...
感谢您!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-29 20:04