楼主: 我是谁2005
8630 18

[问答] 聚类分析的输入变量要用原始指标还是各个主成分还是综合得分 [推广有奖]

11
602dxz 发表于 2012-12-14 19:39:21 |只看作者 |坛友微信交流群
一个变量分类的话也可以,你也不要用聚类分析了直接用单变量拉个频数图肉眼看看来得快。一定要用聚类的话会有一个问题,就是信息损失太大,可能误差很大。你对10个变量进行因子分析提取主成分的时候有一次信息损失(三个因子的累计方差贡献率不会100%,如果70%的话已经算不错了,这样也表示损失掉了30%的信息),然后从三个因子计算出综合变量又要损失一次信息(不知道你是不是用回归分析来做的),最后再用聚类分析又损失了一次信息,经过三次数据的转换处理误差累计很大很大。
你的综合变量我个人觉得还是有用的,比如你分了三类,然后用综合变量来观测这三类的差异,就一下子一览众山小了。

使用道具

12
我是谁2005 发表于 2012-12-14 19:55:28 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 17:36
因子得分一般用k-mean和系统聚类,但是因子分析+k均值已经是很标准的一套方法了,我在实践中(企业)没有看 ...
我刚才根据自己的聚类结果用判别测了一下,归类准确率好像很高,我只是想问一下,中间有个预测组成员的,就是把我原来归类错的成员类别给出了它自己认为正确的类别,我要用它给出的这些修改的类别来替换我原来做的聚类吗

使用道具

13
我是谁2005 发表于 2012-12-14 20:06:22 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 19:39
一个变量分类的话也可以,你也不要用聚类分析了直接用单变量拉个频数图肉眼看看来得快。一定要用聚类的话会 ...
恩,好,那我就用三个主成分做聚类,分完类后用综合得分来分析个类别的情况

使用道具

14
602dxz 发表于 2012-12-14 20:17:04 |只看作者 |坛友微信交流群
我刚才根据自己的聚类结果用判别测了一下,归类准确率好像很高,我只是想问一下,中间有个预测组成员的,就是把我原来归类错的成员类别给出了它自己认为正确的类别,我要用它给出的这些修改的类别来替换我原来做的聚类吗
不用了,有一点归类错是正常的。判别方程函数是根据变量与类别号来建立的,你自己修改了类别编号那么判别方程也变了呀。所以不用改
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
我是谁2005 + 100 + 1 + 1 + 1 再次感谢帮助

总评分: 经验 + 100  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

15
我是谁2005 发表于 2012-12-14 21:03:17 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 20:17
不用了,有一点归类错是正常的。判别方程函数是根据变量与类别号来建立的,你自己修改了类别编号那么判别 ...
哈哈,十分感谢,那我就只用这个判别概率来说明我的聚类准确率就好了,

使用道具

16
whxaitpc 发表于 2012-12-15 17:09:28 |只看作者 |坛友微信交流群
我是谁2005 发表于 2012-12-14 18:55
恩,谢谢,不过我忍不住还想问一下,如果只用综合得分一个变量进行聚类是不是也可以的,否则就感觉综合得 ...
前几天 看到有人发帖讨论说用综合得分聚类,我感觉那有点画蛇添足了,还是用主成分提取的三个变量做比较合适

使用道具

17
whxaitpc 发表于 2012-12-15 17:10:12 |只看作者 |坛友微信交流群
我是谁2005 发表于 2012-12-14 18:55
恩,谢谢,不过我忍不住还想问一下,如果只用综合得分一个变量进行聚类是不是也可以的,否则就感觉综合得 ...
那你可以用主成分啊 那就不用因子啊,不就好了

使用道具

18
凉酱 发表于 2016-5-9 11:07:56 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 17:36
因子得分一般用k-mean和系统聚类,但是因子分析+k均值已经是很标准的一套方法了,我在实践中(企业)没有看 ...
想请问一下数据量很大情况下可以用k-均值聚类分析对变量进行聚类吗?好像对变量的聚类最好用层次聚类法,但是层次聚类是适合数据量比较少的,并且是事先不知道分成几类的。

使用道具

19
huanghuiqun 发表于 2017-5-23 15:49:42 |只看作者 |坛友微信交流群
学习了谢谢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 06:18