楼主: Stanfordddd
9179 8

[回归分析求助] reghdfe运行后提示与固定效应存在共线性 [推广有奖]

  • 0关注
  • 0粉丝

大专生

45%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
0.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
668 点
帖子
12
精华
0
在线时间
82 小时
注册时间
2019-10-10
最后登录
2024-4-4

楼主
Stanfordddd 发表于 2022-8-11 14:06:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
刚进入stata实操阶段,理论知识不够到位,望各位大神指点指点。自变量是一个关于时间的虚拟变量(2015年后取1,否则取0)
reghdfe y x, a(year code)回归后提示:x is probably collinear with the fixed effects (all partialled-out values are close to zero; tol = 1.0e-09),回归系数为0,标准差缺失;
reghdfe y x , a(code) 回归结果正常且显著

请问如何解决x与year存在共线性的问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:固定效应 共线性 REG GHD fixed effect stata reghdfe 会计 计量经济学

沙发
insomnia_U 学生认证  发表于 2022-8-11 14:25:56
这儿的共线性应该是讲的X与year的。因为对于某一年的数据,存在α与β不同时为0,使得αX+βyear=0。
但是如果你利用reghdfe y x , a(code) ,不加入year变量,当然不会存在多重共线性。

感觉你似乎想要探究某一变量在某个时间点变化前后对Y的影响。你可以尝试看看DID方法。

藤椅
小杨慢慢学 发表于 2022-8-11 15:36:13
赞同楼上的回复。
楼主可能需要结合待分析问题的现实意义。根据楼主的描述,设置时间虚拟变量作为自变量,自然是希望探究2015年某项干预的实施对被解释变量的影响。这种情况,如果有对照组,可以才有楼上推荐的双重差分法,有成熟的stata代码可以使用;如果没有合适的对照组,也可以采用中断时间序列法(同样有成熟的代码使用),能够反映出被解释变量在干预后的即时变化和趋势变化。

板凳
Stanfordddd 发表于 2022-8-11 15:51:42
insomnia_U 发表于 2022-8-11 14:25
这儿的共线性应该是讲的X与year的。因为对于某一年的数据,存在α与β不同时为0,使得αX+βyear=0。
但是 ...
感谢感谢!!!!!

报纸
Stanfordddd 发表于 2022-8-11 15:51:58
小杨慢慢学 发表于 2022-8-11 15:36
赞同楼上的回复。
楼主可能需要结合待分析问题的现实意义。根据楼主的描述,设置时间虚拟变量作为自变量, ...
感谢感谢!!!

地板
有机骆驼/sun 在职认证  发表于 2022-8-14 11:48:40
根据您的描述,自变量是year做出来的变量,大于2015为1,否则为0,这不是天然的会有共线性吗?如果要用回归,只能二者取一,看你想研究的问题是什么问题。

7
nolonger123 发表于 2022-8-14 18:11:54 来自手机
Stanfordddd 发表于 2022-8-11 14:06
刚进入stata实操阶段,理论知识不够到位,望各位大神指点指点。自变量是一个关于时间的虚拟变量(2015年后取 ...
好帖

8
Capm杀我 发表于 2022-11-29 10:53:23
小杨慢慢学 发表于 2022-8-11 15:36
赞同楼上的回复。
楼主可能需要结合待分析问题的现实意义。根据楼主的描述,设置时间虚拟变量作为自变量, ...
如果我是面板数据呢,有没有类似于中断时间序列这种方法的推荐。或者以时间虚拟变量作为自变量回归方面的论文?谢谢

9
赵安豆 发表于 2024-9-13 19:19:20
在你的模型中出现"x is probably collinear with the fixed effects"的提示信息,这通常意味着自变量x(在这里是时间虚拟变量)与你已经包含在内的固定效应(这里是year和code)高度相关。这是因为当你使用`reghdfe`命令并以年份为一个固定效应时,实际上你正在控制每一年的时间效应,而你的自变量恰好是一个基于2015年之后取值的变量,这自然与你试图控制的时间固定效应有很高的相关性。

解决这个问题的方法通常有两种:

### 1. 检查并修改模型

- **调整自变量**:如果你的x是单纯表示某个时间点后的状态改变(比如政策实施后),考虑是否可以将它重新定义为一个更具体的事件发生后的虚拟变量,而不仅仅是基于年份。例如,“2015年某月某日之后取值1”,这样可能能够减少与year固定效应之间的共线性。

- **简化模型**:如果x确实就是时间点的一个指示器,并且你认为它是分析的关键部分,那么可能需要重新考虑是否需要同时控制year固定效应。在某些情况下,使用code作为唯一固定效应(如你的第二个命令)可能是足够的。

### 2. 使用`collgen` 或 `collin` 检查共线性

- 在Stata中,你可以使用`collin`或者`collgen`等命令来检查模型中的多重共线性问题。这能帮助你更直观地看到哪些变量之间存在高度相关关系。

### 3. 使用其他回归方法

如果自变量x与固定效应的year之间确实存在不可忽略的共线性,且理论和实证研究都要求同时控制这两项,那么可能需要考虑使用其他的回归方法或模型设定来处理这个问题。例如:

- **差分GMM(Generalized Method of Moments)**:这在面板数据分析中是一个常用的方法,可以用来处理时间固定效应与自变量的共线性问题。

- **混合效应模型** 或 **随机效应模型**:这些模型允许对固定和随机效应进行更灵活的建模,可能能够更好地适应你的数据结构。

最终选择哪种方法取决于你的研究目的、数据特性以及理论假设。在实证分析中,往往需要根据具体情况灵活调整模型设定,以获得最合理的结果解释。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-7 14:59