楼主: yuneiji
13860 9

[问答] 做回归分析自变量太多怎么办 [推广有奖]

  • 1关注
  • 2粉丝

讲师

82%

还不是VIP/贵宾

-

威望
0
论坛币
5373 个
通用积分
6.0695
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
155 点
帖子
117
精华
0
在线时间
1110 小时
注册时间
2009-5-26
最后登录
2023-5-4

楼主
yuneiji 发表于 2017-8-31 12:48:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近在做多分类logistic回归,遇到自变量太多的问题(30个自变量),自变量大多都是离散型变量,自变量之间的相关关系也不是很强,没法用主成分分析或因子分析降维,请问这个时候还有没有其他的降维办法?还是说可以不用降维直接做模型?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归分析 自变量 怎么办 logistic回归 logistic

回帖推荐

嘉哥丶有点忙 发表于2楼  查看完整内容

一般的话变量分别先做一下检验吧,自变量是分类的话做卡方,连续的做t-test,先筛去绝对没有相关性的,其他的一起做logstic,后面的话只能慢慢调试,用模型里面的自动筛选选项都做一次,试出最佳的组合后,如果继续做交叉检验的话可以用树模型试出交叉项,最后整合起来就差不多OK

沙发
嘉哥丶有点忙 学生认证  发表于 2017-8-31 16:02:59 来自手机
一般的话变量分别先做一下检验吧,自变量是分类的话做卡方,连续的做t-test,先筛去绝对没有相关性的,其他的一起做logstic,后面的话只能慢慢调试,用模型里面的自动筛选选项都做一次,试出最佳的组合后,如果继续做交叉检验的话可以用树模型试出交叉项,最后整合起来就差不多OK

藤椅
Genieliu 发表于 2017-8-31 19:11:22
coursera上面的Andrew Ng机器学习课程里面有一节Dimensionality Reduction,讲的就是降维的方法。对变量之间的关系也并没有要求。

板凳
xddlovejiao1314 学生认证  发表于 2017-9-1 09:35:52
如果模型不是做预测,那么分别将这些自变量单独与因变量做回归分析,不显著的在最后的模型中不纳入就行了。祝好运~

报纸
jin216 发表于 2017-9-1 11:24:49
通过逐步回归自动选择也是个办法

地板
yuneiji 发表于 2017-9-1 13:48:01
xddlovejiao1314 发表于 2017-9-1 09:35
如果模型不是做预测,那么分别将这些自变量单独与因变量做回归分析,不显著的在最后的模型中不纳入就行了。 ...
谢谢!因为是mlogit模型,有些变量在第一个模型中不显著,但在其他模型中显著,请问这种情况是保留还是剔除呢?

7
xddlovejiao1314 学生认证  发表于 2017-9-1 15:41:36
yuneiji 发表于 2017-9-1 13:48
谢谢!因为是mlogit模型,有些变量在第一个模型中不显著,但在其他模型中显著,请问这种情况是保留还是剔 ...
建议保留的。出现你这种情况,建议用步进法吧。祝好运~

8
hildegardvon 发表于 2017-9-1 16:37:24 来自手机
yuneiji 发表于 2017-8-31 12:48
最近在做多分类logistic回归,遇到自变量太多的问题(30个自变量),自变量大多都是离散型变量,自变量之间 ...
删掉可以吗??

9
mumutang 学生认证  发表于 2017-9-2 20:07:38
先看一下共线性检验吧。有没有存在共线性的问题。。。之后再做回归的时候,采用向后或者向前吧,把不显著的变量剔除

10
Lasia-Zhou 发表于 2017-9-2 20:34:10
T检验,降维筛选

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-6 09:10