楼主: 13991133962
11143 10

[编程问题求助] 在进行固定效应时为什么显示共线性,该怎么解决,马上要交了,大家快救救我! [推广有奖]

  • 0关注
  • 0粉丝

小学生

21%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
53 点
帖子
2
精华
0
在线时间
8 小时
注册时间
2020-12-5
最后登录
2021-4-7

楼主
13991133962 发表于 2020-12-5 00:34:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
xtreg ln研发投入 ZF补贴 ln企业规模 资产负债率 总资产收益率 流动比率 state 现金流量水平 存货周转率A 资本密集度 i.y
> ear 股权集中度,fe
note: ZF补贴 omitted because of collinearity
note: ln企业规模 omitted because of collinearity
note: 资产负债率 omitted because of collinearity
note: 总资产收益率 omitted because of collinearity
note: 流动比率 omitted because of collinearity
note: state omitted because of collinearity
note: 现金流量水平 omitted because of collinearity
note: 存货周转率A omitted because of collinearity
note: 资本密集度 omitted because of collinearity
note: 2010.year omitted because of collinearity
note: 2011.year omitted because of collinearity
note: 2012.year omitted because of collinearity
note: 2013.year omitted because of collinearity
note: 2014.year omitted because of collinearity
note: 2015.year omitted because of collinearity
note: 2016.year omitted because of collinearity
note: 2017.year omitted because of collinearity
note: 2018.year omitted because of collinearity
note: 2019.year omitted because of collinearity
note: 股权集中度 omitted because of collinearity

Fixed-effects (within) regression               Number of obs     =      7,841
Group variable: code                            Number of groups  =      7,841

R-sq:                                           Obs per group:
     within  =      .                                         min =          1
     between =      .                                         avg =        1.0
     overall =      .                                         max =          1

                                                F(0,0)            =       0.00
corr(u_i, Xb)  =      .                         Prob > F          =          .



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:固定效应 共线性 Collinearity fixed-effect regression

沙发
黃河泉 在职认证  发表于 2020-12-5 09:15:32
因为你每年只有一笔资料,是横断面资料,所以不能用 xtreg。

藤椅
13991133962 发表于 2020-12-7 21:53:38
黃河泉 发表于 2020-12-5 09:15
因为你每年只有一笔资料,是横断面资料,所以不能用 xtreg。
那应该用什么

板凳
zdlspace 学生认证  发表于 2020-12-18 18:28:29
13991133962 发表于 2020-12-7 21:53
那应该用什么
横截面数据做不了固定效应啊,用reg呗

报纸
武小宙111 在职认证  发表于 2023-4-20 14:56:54
黃河泉 发表于 2020-12-5 09:15
因为你每年只有一笔资料,是横断面资料,所以不能用 xtreg。
黄老师,请问在一个企业面板数据回归中,企业年龄和企业固定效应存在共线性,导致企业年龄变量被ommitted,但企业年龄和企业固定效应通常都需要被控制,这种情况该怎么办?

地板
黃河泉 在职认证  发表于 2023-4-20 18:47:21
武小宙111 发表于 2023-4-20 14:56
黄老师,请问在一个企业面板数据回归中,企业年龄和企业固定效应存在共线性,导致企业年龄变量被ommitted ...
不太可能吧?你的资料是否有误?

7
武小宙111 在职认证  发表于 2023-4-20 21:26:51
黃河泉 发表于 2023-4-20 18:47
不太可能吧?你的资料是否有误?
我的资料就是2000-2020年的A股制造业上市公司非平衡面板数据,回归代码如下。BA即为企业年龄,提示我BA is probably collinear with the fixed effects。id是企业代码,hid是行业代码,如果不控制企业固定效应的话,企业年龄就没有被omitted。很奇怪!


reghdfe  TFP_LP ytreat BA N O P Q R size ownership,absorb(id hid year year_hid) vce(cluster id)
(dropped 149 singleton observations)
note: BA is probably collinear with the fixed effects (all partialled-out values are close to zero; tol = 1.0e-09)
(MWFE estimator converged in 50 iterations)
note: BA omitted because of collinearity

HDFE Linear regression                            Number of obs   =     21,143
Absorbing 4 HDFE groups                           F(   8,   1995) =     123.96
Statistics robust to heteroskedasticity           Prob > F        =     0.0000
                                                  R-squared       =     0.9064
                                                  Adj R-squared   =     0.8926
                                                  Within R-sq.    =     0.3624
Number of clusters (id)      =      1,996         Root MSE        =     0.3251

                                  (Std. Err. adjusted for 1996 clusters in id)
------------------------------------------------------------------------------
             |               Robust
      TFP_LP |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      ytreat |   .0692199   .0227731     3.04   0.002     .0245583    .1138814
          BA |          0  (omitted)
           N |   .7149225   .0634778    11.26   0.000     .5904328    .8394121
           O |   1.439384   .1055132    13.64   0.000     1.232457    1.646312
           P |   .0144146   .0071223     2.02   0.043     .0004467    .0283824
           Q |   .7562673   .0563977    13.41   0.000     .6456627    .8668718
           R |   .1207034   .0646236     1.87   0.062    -.0060334    .2474402
        size |   .1496874   .0550831     2.72   0.007      .041661    .2577138
   ownership |  -.0059335   .0070947    -0.84   0.403    -.0198474    .0079804
       _cons |   7.143902   .0460337   155.19   0.000     7.053623    7.234181
------------------------------------------------------------------------------

Absorbed degrees of freedom:
-----------------------------------------------------+
Absorbed FE | Categories  - Redundant  = Num. Coefs |
-------------+---------------------------------------|
          id |      1996        1996           0    *|
         hid |        49           0          49     |
        year |        21           1          20     |
    year_hid |       695          49         646    ?|
-----------------------------------------------------+
? = number of redundant parameters may be higher
* = FE nested within cluster; treated as redundant for DoF computation

8
wawiii 发表于 2023-6-9 09:48:58
遇到了同样的问题。

9
三野九纵33 发表于 2023-10-23 22:19:07
wawiii 发表于 2023-6-9 09:48
遇到了同样的问题。
请问如何解决的,谢谢

10
赵安豆 发表于 2024-6-29 21:32:31
在使用面板数据模型(如固定效应模型)进行回归分析时,如果出现“因为多重共线性而被省略”的提示信息,这通常意味着你的自变量之间存在高度相关性。这可能是由于以下几种情况:

1. **完全的线性依赖**:某些自变量可能直接是其他自变量的倍数或直接计算得出。

2. **数据预处理问题**:例如,使用了未经标准化的数据,导致数值大的变量主导模型;或者在数据清洗过程中引入了错误(如遗漏值处理不当)。

3. **过多的控制变量**:你可能包括了太多相似的自变量,它们之间高度相关,导致信息冗余。

为了解决这个问题:

### 1. 检查并移除完全相关的自变量
- 使用`correlate`命令检查自变量之间的相关性。如果某些自变量的相关系数接近1或-1,则应考虑删除其中一个。
- 可以使用VIF(方差膨胀因子)来量化多重共线性的严重程度,VIF > 10通常被视为严重的多重共线性。

### 2. 数据预处理
- 确保所有自变量都被适当标准化或变换。例如,可以将所有数值型自变量转换为对数形式,以减少数量级差异的影响。
  
### 3. 模型简化
- 考虑逐步回归、LASSO等方法来识别关键的预测变量。
- 简化模型,只保留最核心或最相关的几个自变量。

### 4. 特征工程
- 尝试构建新的特征,比如使用主成分分析(PCA)或者因子分析减少维度的同时保持信息量。

在你提供的命令中,几乎所有的自变量都被标记为共线性而被省略。这表明问题可能非常严重,你需要重新审视你的模型设计和数据预处理步骤。首先从移除高度相关的自变量开始,并检查每个变量的合理性与必要性。

希望这些信息对你有帮助!如果需要更详细的指导或具体代码示例,请进一步说明你的需求。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 22:04