为了克服输入参数值K与真实值不同的缺陷,可以采取在聚类时,输入几个K值多次聚类,最后分析每种聚类结果,选取较优的输出。选取的原则为同类内的样本之间的离差平方和应尽可能的小,而类间的离差平方和应当较大。
我论文中的要把5万个样本数据聚类,我把他们聚成5——10类,方差表如下所示,不知道那一类的聚类效果最好,麻烦高手给看看!!!不胜感激!!!!!!!
|
楼主: walker21
|
11203
2
[问答] [求助]spss中k均值聚类问题 |
|
学前班 90%
-
|
回帖推荐penguin0606 发表于2楼 查看完整内容 个人观点:聚类分析属于探测性研究,可能形成的分类结果在分析之前是未知的。但是我们可以根据理论和研究的目的,有个预想的分类数。分类数的确定应该可以算是聚类分析的难点之一,有几个方式可以帮助你确定分类数:1、根据已有研究成果和研究的目的确定;2、分类数应该保证在n/30~n/60之间(Lehmann);3、对聚合系数的变化进行分析( agglomeration coefficient ),比较小的聚合系数表示同质性较强的两个小类被合并到一起, 而比较 ...
本帖被以下文库推荐
| ||
|
|
| ||
![]() |
||
| ||
![]() |
||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


