不少书籍在介绍K-means算法时强调到变量会对结果有较大影响,而有一些案例中却直接使用于强相关性的变量,个人理解,引入强相关性变量对变量的重要性的确会有影响,但对聚类效果应该是能强化区分度的作用
在实际业务场景中有不少变量是有较强相关性,而一旦将它们排除,所剩的变量特征却很少,关于这个算法的应用,业界是否有硬性要求参与聚类的变量不能有强相关性?请专家解答一下这种情况,如果有书籍论刊比较全面讲到该问题,不防推荐推荐!
|
楼主: 万木青
|
4007
3
[问答] 关于参与k-means聚类的变量是否必须排除强相关性变量的讨论? |
|
已卖:164份资源 博士生 8%
-
|
| ||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


