关于参与k-means聚类的变量是否必须排除强相关性变量的讨论？ - SPSS论坛

4关注
1粉丝

博士生

8%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 2876 个
通用积分: 5.6096
学术水平: 0 点
热心指数: 2 点
信用等级: 0 点
经验: 2168 点
帖子: 136
精华: 0
在线时间: 195 小时
注册时间: 2014-10-20
最后登录: 2021-4-12

楼主

万木青 发表于 2018-12-13 16:15:40 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

不少书籍在介绍K-means算法时强调到变量会对结果有较大影响，而有一些案例中却直接使用于强相关性的变量，个人理解，引入强相关性变量对变量的重要性的确会有影响，但对聚类效果应该是能强化区分度的作用
在实际业务场景中有不少变量是有较强相关性，而一旦将它们排除，所剩的变量特征却很少，关于这个算法的应用，业界是否有硬性要求参与聚类的变量不能有强相关性？请专家解答一下这种情况，如果有书籍论刊比较全面讲到该问题，不防推荐推荐！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：相关性变量强相关性实际业务硬性要求聚类效果

相关帖子

使用道具举报

沙发

kuangsir6 发表于 2018-12-16 14:23:11 |只看作者 |坛友微信交流群

k-means聚类的变量是需要独立的，强相关当然不满足其条件。
通过主成分分析可消除变量间相关性。

使用道具举报

藤椅

万木青 发表于 2018-12-16 14:43:09 |只看作者 |坛友微信交流群

kuangsir6 发表于 2018-12-16 14:23
k-means聚类的变量是需要独立的，强相关当然不满足其条件。
通过主成分分析可消除变量间相关性。

谢谢你的建议！
不知你有没看过张文彤的书，算是比较资深的学者，spss 统计分析高级教程，他在介绍K-means理论时有提到要避免相关性变量，也有说到你所说的处理方法。但他也从中写到强相关变量同时进入聚类分析，有时是人们所需要这样做的，书中的案例也完全没有排除强相关变量，给出了案例的分析的结论。
我就在想，是否在某些分析中，可以不排除强相关变量？

使用道具举报

板凳

kuangsir6 发表于 2018-12-18 18:26:46 |只看作者 |坛友微信交流群

万木青发表于 2018-12-16 14:43
谢谢你的建议！
不知你有没看过张文彤的书，算是比较资深的学者，spss 统计分析高级教程，他在介绍K-mea ...

k-means聚类的条件就是：变量间是独立的。

使用道具举报

[问答] 关于参与k-means聚类的变量是否必须排除强相关性变量的讨论？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

[问答] 关于参与k-means聚类的变量是否必须排除强相关性变量的讨论？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群