楼主: 万木青
1902 0

[问答] 关于参与k-means聚类的变量是否必须排除强相关性变量的讨论? [推广有奖]

  • 4关注
  • 1粉丝

博士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
2876 个
通用积分
5.6096
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
2168 点
帖子
136
精华
0
在线时间
195 小时
注册时间
2014-10-20
最后登录
2021-4-12

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
不少书籍在介绍K-means算法时强调到变量会对结果有较大影响,而有一些案例中却直接使用于强相关性的变量,个人理解,引入强相关性变量对变量的重要性的确会有影响,但对聚类效果应该是能强化区分度的作用
在实际业务场景中有不少变量是有较强相关性,而一旦将它们排除,所剩的变量特征却很少,关于这个算法的应用,业界是否有硬性要求参与聚类的变量不能有强相关性?请专家解答一下这种情况,如果有书籍论刊比较全面讲到该问题,不防推荐推荐!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相关性变量 强相关性 实际业务 硬性要求 聚类效果

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 04:50