楼主: jonhy
44747 40

[问答] [求助]采用聚类分析时,如何确定聚类的数目? [推广有奖]

21
longjiayong730 发表于 2009-10-27 00:33:26
此贴  好多的信息价值
不错啊
虚心的学习

22
cowboy1106 发表于 2009-10-27 10:24:34
确定聚类个数的方法:
相似系数:指变量或样本间的亲密程度(即阈值),相似系数较大的聚为一类。常用的有夹角余弦、相关系数、指数相似系数。
标尺值:0~25进行分类。
伪F统计量:应该取伪F统计量较大而类数较小的聚类水平。如下图所示,应该分为4类最合适。
统计量R2:应该取R2统计量较大的类数数目。
伪t2统计量:伪t2统计量大说明不应该合并这两类,应该取合并前的水平。
实际意义:根据你做得试验,必须有实际意义。比如我的水稻食味的,那一定是好吃、一般、不好吃。只能是三个类别。
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 10 精彩帖子

总评分: 经验 + 3  论坛币 + 10   查看全部评分

23
方新明 发表于 2009-10-27 20:55:26
首先看系统聚类,再试试K-聚类,确定K的取值

24
xia19831015 发表于 2010-4-26 19:02:40
我也被这个问题困扰。呵呵

25
电力经济 发表于 2010-9-13 20:11:13
很仔细地看完了,受益匪浅
你可以拥有爱,但不要执著,因为分离是必然的。

26
gaoshuai200402 发表于 2010-12-5 16:36:42
好帖子,主要的统计意义和方差检验
点背到不能再背的时候,就应该是时来运转了吧

27
liuqi99 发表于 2011-8-15 13:57:50
将dendrogram勾上

28
tyaer 发表于 2011-9-3 11:07:45
简单的方法,
1.就是先多做几组分类,比如说从5类---8类;
2.并比较这几类之间有无显著差异;
3.从中得到你可以接受的结论;
卖油翁说:“无他,唯熟耳!”

29
lwhks 发表于 2011-11-6 01:26:12
谢谢,楼上这位,解释得很好。

30
龙之九子 发表于 2011-12-3 15:46:49
真实太棒了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-18 08:21