楼主: 寒武纪
9774 9

[其他] 回归时变量被自动删除的问题 [推广有奖]

  • 0关注
  • 0粉丝

VIP

硕士生

21%

还不是VIP/贵宾

-

威望
0
论坛币
961 个
通用积分
0
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
4716 点
帖子
93
精华
0
在线时间
159 小时
注册时间
2005-10-13
最后登录
2023-5-1

楼主
寒武纪 发表于 2010-3-1 16:42:55 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
reg income gender age2 age3 ........
age2,age3 均为0 1变量,reg后在回归结果前出现了如下note,有好几个变量都被自动删除了,600多个观察值最后只剩下110个。
note: gender != 0 predicts success perfectly
      gender dropped and 110 obs not used
note: age2 != 0 predicts success perfectly
      age2 dropped and 48 obs not used
...
而且,在回归结果中,有的变量的标准误、z值、p值都显示的是.    例如:
      ------------------------------------------------------------------------------
         m30 |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      gender |  -.0301966          .        .       .            .           .

我检查了这些变量无缺失值,与因变量之间相关性很小, 不知道这是怎么回事?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:perfectly predicts Interval predict dropped

沙发
sungmoo 发表于 2010-3-1 17:28:54
可否把数据贴一下(片段即可)?

藤椅
寒武纪 发表于 2010-3-1 17:52:53
income  gender  age1  age2 age3.....
2856           1           0          1        0
4900           1           1          0        0
3781           0           0          1        0
5600           1            1         1        1
3572           0            0         0        0
........

数据好像也没有什么规律
    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
              inc |      602    4075.209    4518.862  -1567.657   60137.46
      gender |      602    .4950033    .5000583          0          1
        age1 |      602    .6625583    .4729157          0          1
        age2 |      602    .2318454    .4220811          0          1
        age3 |      602    .1055963    .3073714          0          1

板凳
sungmoo 发表于 2010-3-1 18:09:25
寒武纪 发表于 2010-3-1 16:42 在回归结果中,有的变量的标准误、z值、p值都显示的是.
http://www.pinggu.org/bbs/thread-720208-1-1.html

报纸
sungmoo 发表于 2010-3-1 18:13:18
寒武纪 发表于 2010-3-1 17:52
income  gender  age1  age2 age3.....
2856           1           0          1        0
4900           1           1          0        0
3781           0           0          1        0
5600           1            1         1        1
3572           0            0         0        0
........

数据好像也没有什么规律
最好能把这五个变量的所有观测值都贴出来。

地板
寒武纪 发表于 2010-3-1 18:24:43
是的,我的拟R2=1

7
蓝色 发表于 2010-3-1 19:11:51
把数据都贴出来就容易判断了

8
寒武纪 发表于 2010-3-1 19:41:14
谢谢,刚才跟室友讨论出结果了,我后面还有个交互项。是交互项导致前面的变量出了问题。

9
精彩在我啊 学生认证  发表于 2021-12-23 21:33:05
蓝色 发表于 2010-3-1 19:11
把数据都贴出来就容易判断了
想问下老师,我也出现了类似的情况,能不能帮忙解释下?
note: gender != 0 predicts success perfectly
      gender dropped and 2 obs not used

note: 0.industry1 != 1 predicts success perfectly
      0.industry1 dropped and 1 obs not used

note: 0.industry10 != 1 predicts success perfectly
      0.industry10 dropped and 1 obs not used

note: 0.industry11 != 1 predicts failure perfectly
      0.industry11 dropped and 2 obs not used

note: fc1 != 1 predicts success perfectly
      fc1 dropped and 5 obs not used

note: outcome = compet < 1 predicts data perfectly except for
      compet == 1 subsample:
      compet dropped and 5 obs not used

Example generated by -dataex-. To install: ssc install dataex
clear
input double gender byte(industry1 industry10 industry11) double fc1
0 1 0 0 0
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 0
0 1 0 0 0
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 0
0 1 0 0 1
0 1 0 0 0
0 1 0 0 0
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 0
0 1 0 0 0
0 1 0 0 0
0 1 0 0 0
0 1 0 0 0
0 1 0 0 1
1 1 0 0 0
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
1 1 0 0 0
1 1 0 0 0
0 1 0 0 0
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 1 0 0 1
0 0 0 0 1
0 0 0 0 0
0 0 0 0 1
1 0 0 0 1
1 0 0 0 1
1 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 0
0 0 0 0 0
1 0 0 0 1
0 0 0 0 0
1 0 0 0 1
0 0 0 0 1
0 0 0 0 1
0 0 0 0 0
0 0 0 0 0
0 0 0 0 1
0 0 0 0 0
0 0 0 0 1
1 0 0 0 1
0 0 0 0 1
end
[/CODE]

10
赵安豆 发表于 2024-5-7 16:19:58
在你的回归分析中,出现了“predicts success perfectly”的note,这表明某些变量(如gender、age2)与因变量(可能这里指的是income)存在完全相关性。这意味着当你包含这些变量时,它们的系数将变为无穷大,标准误为零,导致Stata自动删除这些变量以避免出现统计问题。

关于观察值减少的问题,每次有变量被删除,所有该变量取值为0的观测值也会被排除,因为它们无法提供信息。所以从600多个观察值减到110个,可能是由于这些完全预测因变量的变量在数据集中存在大量为0的情况。

对于显示“.”的情况,这通常表示Stata无法计算标准误、z值和p值,可能是因为剩余的观测数量太少,或者模型中其他问题导致统计量无法估计。

为了解决这些问题,你可以考虑以下步骤:
1. 检查数据:确保没有遗漏或错误的数据输入。
2. 变量选择:重新审视你选择的自变量,看看是否有逻辑上的完全相关性,可能需要剔除一些不必要或者冗余的变量。
3. 分组处理:如果某些变量在特定群体中预测效果完美,可以考虑对不同群体分别进行回归分析。
4. 数据清理:删除那些导致完全预测的异常观测值,但要注意这可能会影响结果的代表性。

最后,建议使用更复杂的模型或方法(如交互项、分段回归等)来处理可能存在的复杂关系。如果问题依然存在,可能需要咨询统计专家或者进一步学习相关理论。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-7 06:56