楼主: a089
7001 9

[问答] 二分类变量logit回归分类自变量共线性的问题 [推广有奖]

  • 0关注
  • 0粉丝

已卖:72份资源

博士生

32%

还不是VIP/贵宾

-

威望
0
论坛币
5562 个
通用积分
25.5029
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1339 点
帖子
73
精华
0
在线时间
399 小时
注册时间
2013-12-26
最后登录
2024-9-2

楼主
a089 发表于 2015-1-31 14:46:22 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我做了一个二分类变量的logit回归
分类变量例如年龄,收入这些转为了哑变量,按照10岁,或者1000为一个梯度来进行重新编码
回归出来的correlation matrix里面年龄之间出现了相关性,例如20-30岁的与30-40岁的相关,因为一个是1,一个是0;一个人是20多岁肯定就不是30多岁
同样的,收入也出现了相关,相关性系数0.7左右,这估计不行把

该怎么解决呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logit 二分类变量 分类变量 共线性 二分类 自变量

沙发
zlgsx 学生认证  发表于 2015-1-31 18:04:09
不明白你说的啥,哑变量编码?编码有问题?编码共线性问题?
哑变量共线,可以尝试中心化

藤椅
gxnnhsd 发表于 2015-1-31 23:36:00
用forward  LR 结果就是排除共线性后的结果
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

板凳
a089 发表于 2015-2-1 09:39:06
zlgsx 发表于 2015-1-31 18:04
不明白你说的啥,哑变量编码?编码有问题?编码共线性问题?
哑变量共线,可以尝试中心化
多谢回答指点!
哑变量比如:年龄,20-30,;30-40;40-50;50-60发生共线,20-30与30-40相关系数是0.7
这个该怎么处理?也是中心化吗?

报纸
a089 发表于 2015-2-1 09:52:32
gxnnhsd 发表于 2015-1-31 23:36
用forward  LR 结果就是排除共线性后的结果
果然LR比Wald出来的结果共线性小,不过Wald的结果更好怎么办呢?

地板
asonghappy 发表于 2015-2-1 10:11:46
自变量哑变量化后变成k-1个哑变量,这K-1个哑变量间的相关性没有意义  因为他们实际上还是表示同一个变量


拙见仅供参考哈

7
a089 发表于 2015-2-1 10:20:21
asonghappy 发表于 2015-2-1 10:11
自变量哑变量化后变成k-1个哑变量,这K-1个哑变量间的相关性没有意义  因为他们实际上还是表示同一个变量
...
我感觉也是,多谢!

8
xddlovejiao1314 学生认证  发表于 2015-2-2 16:40:32
楼主可能想探究的是不同收入水平和不同收入水平个体在XX因素(因变量)上差异是否显著。其实我个人认为没必要分太多段,直接分为高中低三组即可,然后以两个哑变量的方式引入模型。即可探究高中低三组间的差异。
已有 1 人评分论坛币 收起 理由
admin_kefu + 30 热心帮助其他会员

总评分: 论坛币 + 30   查看全部评分

9
snoppy1205 发表于 2016-5-6 10:19:33
最近也在做二分变量逻辑回归 想问楼主自变量中的连续变量出现共线性的诊断及处理应该怎么操作?

10
statsman 发表于 2016-5-7 00:31:33
分类为k,则dummy的个数为k-1,就解决了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-6 06:47