对于大样本量使用K-means聚类分析。自己设定了2-6类,但是不确定分几类最优。
不少说用使用方差分析的显著性检验。
可是我看到一篇文献讲的是用另外一种kappa一致性检验,但是具体如何操作不明白,希望有高手能解释一下!
PS: 文献其中讲的大概内容是将样本随机平均分为A和B, 然后对A进行K-means,好像得到什么距离;
再利用得到的距离对B使用K-means, 以及直接对B使用K-means。将这两种情形下对B得出的分类进行kappa一致性检验。
最有比较2~6类情形下几种kappa系数,最高的对应分类最优