楼主: 木鱼流沙
7666 22

求助:克服多重共线性,因变量是离散型数据 [推广有奖]

  • 1关注
  • 0粉丝

初中生

52%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
50 点
帖子
3
精华
0
在线时间
23 小时
注册时间
2011-3-8
最后登录
2015-1-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
因变量是离散型数据,分别为1到8,自变量有四个,但是两两显著相关。。。试过逐步回归,筛出两个自变量,仍然有多重共线性的啊。。。还试过主成分分析,按照特征根大于1只提出了一个主成分,并且累积方差贡献率只有61%,计算出的主成分回归后还不显著。。。愁死了,请教各位大神有什么其他方法吗?不想换数据啊。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多重共线性 多重共线 因变量 离散型 共线性 因变量 自变量

本帖被以下文库推荐

沙发
beiluo08 学生认证  发表于 2014-5-19 09:14:50 来自手机 |只看作者 |坛友微信交流群
岭回归
已有 1 人评分论坛币 收起 理由
admin_kefu + 5 热心帮助其他会员

总评分: 论坛币 + 5   查看全部评分

使用道具

藤椅
1029812370 学生认证  发表于 2015-6-25 21:05:16 |只看作者 |坛友微信交流群
岭回归stata怎么做啊?

使用道具

板凳
bingshijiang 发表于 2015-9-25 15:41:05 |只看作者 |坛友微信交流群
请问您,因变量是离散型的1-8,自变量如果也是离散型的,能用回归?请问用什么方法,能教给我吗?

使用道具

报纸
xddlovejiao1314 学生认证  发表于 2015-9-28 17:52:07 |只看作者 |坛友微信交流群
bingshijiang 发表于 2015-9-25 15:41
请问您,因变量是离散型的1-8,自变量如果也是离散型的,能用回归?请问用什么方法,能教给我吗?
   需要用什么模型,一般是通过因变量的类型来判断的。你的因变量是离散型的(1-8),如果是有序的,则可以用有序多分类logistic回归;如果是无序的,则用无序多分类logistic回归。不知道你的样本量大不大,因为感觉1-8这种分类太大了,如果样本量不大,可能有几个小类样本数会比较少,可能会影响模型的拟合。如果是这样,可考虑将1-8中的某些类别合并,减少类别数,然后再构建模型。
    自变量是离散型的,如果是二分类的,直接纳入模型即可;如果是多分类的,则需要处理为哑变量/虚拟变量,然后再纳入模型。祝好运~
已有 2 人评分论坛币 收起 理由
admin_kefu + 30 热心帮助其他会员
bingshijiang + 5 观点有启发

总评分: 论坛币 + 35   查看全部评分

使用道具

地板
bingshijiang 发表于 2015-9-29 09:05:37 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-9-28 17:52
需要用什么模型,一般是通过因变量的类型来判断的。你的因变量是离散型的(1-8),如果是有序的,则可 ...
多谢指教。
听您说的,我应该将自变量变为虚拟变量,然后用logistic回归。
具体情况是这样的:因变量 是有序的表示程度大小的,我查找网上的评论,有人说,级别较多,可以当做连续变量处理,请问您是怎么看待的?(如果可以,我想用单变量方差分析,因为自变量都是离散的多级的,且有好几个)用单变量方差分析,是否有漏洞?
我的样本量也比较大。

使用道具

7
xddlovejiao1314 学生认证  发表于 2015-9-29 09:26:51 |只看作者 |坛友微信交流群
bingshijiang 发表于 2015-9-29 09:05
多谢指教。
听您说的,我应该将自变量变为虚拟变量,然后用logistic回归。
具体情况是这样 ...
    有序多分类的变量是可以近似的看做连续性的变量来处理,不过不建议这样,毕竟只是“近似”,在可以选择适当的方法情况下又为什么要“近似”处理呢?
    由于你的样本量比较大,我建议还是将因变量合并一下,现在8类太多。将其合并为4-5类为好。然后构建有序多分类Logistic回归模型就好。由于你的样本量比较大,即使自变量有很多类别变量也消耗不了几个自由度啊,完全没问题的。
    至于你说的想所用单变量方差分析,这是针对因变量是连续性变量时使用的方法,因变量是有序的类别变量时,应该对应着有秩和检验的方法。同时,即使是单变量方差分析的方法,也只是在类别自变量不多的情况下(2-3个),如果太多你想想要制成几维表才能分下去了。这时还是构建模型为好~
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

使用道具

8
bingshijiang 发表于 2015-10-8 15:39:26 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-9-29 09:26
有序多分类的变量是可以近似的看做连续性的变量来处理,不过不建议这样,毕竟只是“近似”,在可以选 ...
谢谢。
我的样本,分为10个地点,又分性别,其他2个,是表示频率(如1~3次,4~6次,也可理解为有序)、时间(如,1~5年)的分类变量。但因变量,就只有1个分级表示程度的有序变量。这么多类别,样本量较大,但按照分类变量分,每个小组里面,估计也没太多。
鉴于以上详情,再看您的回复和指点,还是觉得比较难。
所以我才想用的单变量方差分析。
另外:单变量方差分析(多个分类变量)的结果,要看性别的差别,与只有“因变量和性别两个”做单因素方差分析,结果有何区别与联系?我有些疑惑。

使用道具

9
bingshijiang 发表于 2015-10-8 15:42:40 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-9-29 09:26
有序多分类的变量是可以近似的看做连续性的变量来处理,不过不建议这样,毕竟只是“近似”,在可以选 ...
额,国庆前,还看到您发的帖子了,关于自己学习统计学方面的。太长,还没看完,但确实挺励志,也很实在。在此赞一个。

使用道具

10
xddlovejiao1314 学生认证  发表于 2015-10-8 16:13:52 |只看作者 |坛友微信交流群
bingshijiang 发表于 2015-10-8 15:39
谢谢。
我的样本,分为10个地点,又分性别,其他2个,是表示频率(如1~3次,4~6次,也可理解为有序)、时 ...
    还是我上面说的话额:“至于你说的想所用单变量方差分析,这是针对因变量是连续性变量时使用的方法,因变量是有序的类别变量时,应该对应着有秩和检验的方法”。所以即使你要单独做各个类别自变量在因变量各个类别上的差异,应该用秩和检验的方法而非单变量方差分析。此为其一。
    其二,我没看懂你想表达的具体意思呢。就这句话:“单变量方差分析(多个分类变量)的结果,要看性别的差别,与只有“因变量和性别两个”做单因素方差分析,结果有何区别与联系?”
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
nuomin + 100 + 40 + 5 + 5 + 5 观点有启发

总评分: 经验 + 100  论坛币 + 40  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 14:48