楼主: 我是谁2005
8628 18

[问答] 聚类分析的输入变量要用原始指标还是各个主成分还是综合得分 [推广有奖]

  • 0关注
  • 17粉丝

VIP

浙江工业大学经贸学院

院士

33%

还不是VIP/贵宾

-

威望
6
论坛币
12101054 个
通用积分
11527.1529
学术水平
24 点
热心指数
38 点
信用等级
18 点
经验
56380 点
帖子
1729
精华
0
在线时间
1688 小时
注册时间
2005-12-8
最后登录
2024-4-23

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我先用10个原始变量得出3个主成分,现在要做聚类分析,请问到底要用10个原始变量聚类,还是用3个主成分做变量,还是用最后的综合得分做变量呀,请大家帮助我
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:聚类分析 综合得分 主成分

回帖推荐

602dxz 发表于6楼  查看完整内容

因子得分一般用k-mean和系统聚类,但是因子分析+k均值已经是很标准的一套方法了,我在实践中(企业)没有看到过用系统聚类来处理因子得分的。至于聚几类这个问题没有标准答案的,需要先验理论支持。一般在定量分析前大概心里有数聚多少个类别。当然你也可以看统计量(比如用判别分析来检验归类的准确率,以及对类别间以及类别内做F检验),如果你样本量小于500个,那么K-mean聚类的最小类别百分尽量比不少于5%,然后每个类别都有明 ...

本帖被以下文库推荐

沙发
602dxz 发表于 2012-12-14 13:46:46 |只看作者 |坛友微信交流群
当然用因子得分咯,你做因子分析不就是因为变量太多且变量间存在相关性所以想压缩成2、3个便于处理与说明么

使用道具

藤椅
我是谁2005 发表于 2012-12-14 14:01:51 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 13:46
当然用因子得分咯,你做因子分析不就是因为变量太多且变量间存在相关性所以想压缩成2、3个便于处理与说明么
就是用三个因子的得分是吗,那最后计算的因子综合得分呢,这个要用吗

使用道具

板凳
602dxz 发表于 2012-12-14 16:50:37 |只看作者 |坛友微信交流群
不是很明白你的综合变量的意思,如果综合变量是基于三个因子得出来的那就不要了,不然就有重复了。另外,对因子得分进行聚类的话建议用k-mean聚类。

使用道具

报纸
我是谁2005 发表于 2012-12-14 17:22:17 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 16:50
不是很明白你的综合变量的意思,如果综合变量是基于三个因子得出来的那就不要了,不然就有重复了。另外,对 ...
对的,综合变量就是用三个因子算出来的综合得分,所以我才会问到底用三个因子当聚类分析的输入变量好,还是就用一个综合变量当聚类分析的输入变量好,但是K均值的聚类不是要自己主观的制定聚类的个数了吗,这样合理吗

使用道具

地板
602dxz 发表于 2012-12-14 17:36:49 |只看作者 |坛友微信交流群
因子得分一般用k-mean和系统聚类,但是因子分析+k均值已经是很标准的一套方法了,我在实践中(企业)没有看到过用系统聚类来处理因子得分的。至于聚几类这个问题没有标准答案的,需要先验理论支持。一般在定量分析前大概心里有数聚多少个类别。当然你也可以看统计量(比如用判别分析来检验归类的准确率,以及对类别间以及类别内做F检验),如果你样本量小于500个,那么K-mean聚类的最小类别百分尽量比不少于5%,然后每个类别都有明显的差异(可以用语言很简练地说明其区别),判别分析的准备率至少90%以上。当然如果你纯粹是探索性的研究,做前心里根本不知道该聚几类,那你可以先系统聚类作为参考,最后还是还用k-meam聚类来进行“精细化”操作的。聚类分析中聚几类一直是一个定性分析为主,定量辅助的问题。
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
bakoll + 3 + 3 精彩帖子
我是谁2005 + 100 + 2 + 2 + 2 跟鞋热心帮助

总评分: 经验 + 103  论坛币 + 3  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

使用道具

7
我是谁2005 发表于 2012-12-14 18:03:30 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 17:36
因子得分一般用k-mean和系统聚类,但是因子分析+k均值已经是很标准的一套方法了,我在实践中(企业)没有看 ...
那是不是我就用三个主成分或因子作为聚类分析的输入变量了,不去管那个综合得分了,还有我的样本是130个,是不是用K均值聚类自己就定个3类或4类就可以了

使用道具

8
我是谁2005 发表于 2012-12-14 18:04:23 |只看作者 |坛友微信交流群
不过我也是边学边用,所以还不是太清楚,看那个判别分析来验证归类的正确性什么的还真是不会诶

使用道具

9
602dxz 发表于 2012-12-14 18:41:28 |只看作者 |坛友微信交流群
那是不是我就用三个主成分或因子作为聚类分析的输入变量了,不去管那个综合得分了,还有我的样本是130个,是不是用K均值聚类自己就定个3类或4类就可以了
是的,用因子来聚类。你样本少估计聚个3,4类差不多了,不然聚太多有时候一类才几个样本这个没有可信度。判别分析SPSS里面有,操作很方便你可以弄个SPSS用户手册,照着做就行了。

使用道具

10
我是谁2005 发表于 2012-12-14 18:55:31 |只看作者 |坛友微信交流群
602dxz 发表于 2012-12-14 18:41
是的,用因子来聚类。你样本少估计聚个3,4类差不多了,不然聚太多有时候一类才几个样本这个没有可信度。判 ...
恩,谢谢,不过我忍不住还想问一下,如果只用综合得分一个变量进行聚类是不是也可以的,否则就感觉综合得分算不出来没地方用了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 11:36