楼主: adrian-cts
1119 1

[实际应用] 大家好,关于聚类和主成分分析上有些问题希望能得到大家的一点帮助,谢谢了! [推广有奖]

  • 0关注
  • 0粉丝

小学生

64%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
103 点
帖子
3
精华
0
在线时间
10 小时
注册时间
2015-8-3
最后登录
2016-4-2

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
目前我在做用户细分,采取kmeans来聚类,由于变量有20个,数据也有5w。(不算也大的数据)我尝试了不少方法,希望可以有较好的聚类结果,但不是特别理想,所以我想通过主成分分析进行降维。
我用R语言,碎石图给出的建议是分成5个主成分。(pc1至pc5) 下图是各个主成分对应变量的系数
微信截图_20160401184512.png

我的做法是将每一个主成分的系数与每一行数据对应相乘,这样pc1到pc5每一列都有5w条数据。拿这五个特征值进行聚类,
得到的效果不错。
我的问题是这么聚类是否合适,主成分+聚类?
再就是这里面我们看到,如pc1中有些变量值权重挺大,两者之间的相关性也比较高,不知道是否有影响,是否需要筛选还是使用每一个系数。  

非常感谢!希望可以得到大家的指导!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:主成分分析 主成分 大家好 kmeans means 用户

沙发
920978196 发表于 2016-4-1 23:48:08 来自手机 |只看作者 |坛友微信交流群
(个人观点)主成分不适合和聚类一起做。你可以尝试用因子分析+聚类。因为主成分pc1-pc5没有具体的含义,而因子分析可以克服这一点。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-21 07:29