楼主: miaomiaolong
6440 6

[问答] 聚类分析的问题 [推广有奖]

  • 0关注
  • 0粉丝

博士生

78%

还不是VIP/贵宾

-

威望
0
论坛币
2028 个
通用积分
5.5023
学术水平
1 点
热心指数
7 点
信用等级
1 点
经验
1475 点
帖子
224
精华
0
在线时间
174 小时
注册时间
2006-4-27
最后登录
2023-5-23

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
http://www.cfaspace.com/News/view.asp?id=3242


第二节 Hierarchical Cluster过程

10.2.1 主要功能


调用此过程可完成系统聚类分析。在系统聚类分析中,用户事先无法确定类别数,系统将所有例数均调入内存,且可执行不同的聚类算法。系统聚类分析有两种形式,一是对研究对象本身进行分类,称为Q型举类;另一是对研究对象的观察指标进行分类,称为R型聚类。


10.2.2 实例操作


[例10.229名儿童的血红蛋白(g/100ml)与微量元素(μg/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。



  

编号  

N0.

钙  

X1

镁  

X2

铁  

X3

锰  

X4

铜  

X5

血红蛋白  

X6

1  

2  

3  

4  

5  

6  

7  

8  

9  

10  

11  

12  

13  

14  

15  

16  

17  

18  

19  

20  

21  

22  

23  

24  

25  

26  

27  

28  

29

54.89  

72.49  

53.81  

64.74  

58.80  

43.67  

54.89  

86.12  

60.35  

54.04  

61.23  

60.17  

69.69  

72.28  

55.13  

70.08  

63.05  

48.75  

52.28  

52.21  

49.71  

61.02  

53.68  

50.22  

65.34  

56.39  

66.12  

73.89  

47.31

30.86  

42.61  

52.86  

39.18  

37.67  

26.18  

30.86  

43.79  

38.20  

34.23  

37.35  

33.67  

40.01  

40.12  

33.02  

36.81  

35.07  

30.53  

27.14  

36.18  

25.43  

29.27  

28.79  

29.17  

29.99  

29.29  

31.93  

32.94  

28.55

448.70 467.30 425.61 469.80 456.55 395.78 448.70 440.13 394.40 405.60 446.00 383.20 416.70 430.80 445.80  

409.80  

384.10  

342.90  

326.29  

388.54  

331.10  

258.94  

292.80  

292.60  

312.80  

283.00  

344.20  

312.50  

294.70

0.012  

0.008  

0.004  

0.005  

0.012  

0.001  

0.012  

0.017  

0.001  

0.008  

0.022  

0.001  

0.012  

0.000  

0.012  

0.012  

0.000  

0.018  

0.004  

0.024  

0.012  

0.016  

0.048  

0.006  

0.006  

0.016  

0.000  

0.064  

0.005

1.010  

1.640  

1.220  

1.220  

1.010  

0.594  

1.010  

1.770  

1.140  

1.300  

1.380  

0.914  

1.350  

1.200  

0.918  

1.190  

0.853  

0.924  

0.817  

1.020  

0.897  

1.190  

1.320  

1.040  

1.030  

1.350  

0.689  

1.150  

0.838

13.50  

13.00  

13.75  

14.00  

14.25  

12.75  

12.50  

12.25  

12.00  

11.75  

11.50  

11.25  

11.00  

10.75  

10.50  

10.25  

10.00  

9.75  

9.50  

9.25  

9.00  

8.75  

8.50  

8.25  

8.00  

7.80  

7.50  

7.25  

7.00



  















二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:聚类分析 Hierarchical CFAspace Cluster Space SPSS 聚类分析

本帖被以下文库推荐

关于ICC内在一致性统计:
http://www.pinggu.org/bbs/thread-885830-1-1.html
沙发
miaomiaolong 发表于 2010-7-20 01:30:33 |只看作者 |坛友微信交流群

10.2.2.1
数据准备


激活数据管理窗口,定义变量名:
钙、镁、铁、锰、铜和血红蛋白的变量名分别为x1x2x3x4x5x6,之后输入原始数据。

10.2.2.2
统计分析


激活Statistics菜单选Classify中的Hierarchical Cluster...项,弹出Hierarchical Cluster Analysis对话框(图10.3)。从对话框左侧的变量列表中选x1x2x3x4x5x6,点击Ø钮使之进入Variable(s)框;在Cluster处选择聚类类型,其中Cases表示观察对象聚类,Variables表示变量聚类,本例选择Variables

图10.3
系统聚类分析对话框

  


点击Statistics...钮,弹出Hierarchical Cluster Analysis: Statistics对话框,选择Distance matrix,要求显示距离矩阵,点击Continue钮返回Hierarchical Cluster Analysis对话框(图10.4)。

  

图10.4
系统聚类方法选择对话框

  

关于ICC内在一致性统计:
http://www.pinggu.org/bbs/thread-885830-1-1.html

使用道具

藤椅
miaomiaolong 发表于 2010-7-20 01:30:52 |只看作者 |坛友微信交流群
本例要求系统输出聚类结果的树状关系图,故点击Plots...钮弹出Hierarchical Cluster Analysis:Plots对话框,选择Dendrogram项,点击Continue钮返回Hierarchical Cluster Analysis对话框。


点击Method...钮弹出Hierarchical Cluster Analysis:Method对话框,系统提供7种聚类方法供用户选择:


Between-groups linkage:类间平均链锁法;


Within-groups linkage:类内平均链锁法;


Nearest neighbor:最近邻居法;


Furthest neighbor:最远邻居法;


Centroid clustering:重心法,应与欧氏距离平方法一起使用;


Median clustering:中间距离法,应与欧氏距离平方法一起使用;


Ward's method:离差平方和法,应与欧氏距离平方法一起使用。


本例选择类间平均链锁法(系统默认方法)。在选择距离测量技术上,系统提供8种形式供用户选择:


Euclidean distanceEuclidean距离,即两观察单位间的距离为其值差的平方和的平方根,该技术用于Q型聚类;


Squared Euclidean distanceEuclidean距离平方,即两观察单位间的距离为其值差的平方和,该技术用于Q型聚类;


Cosine:变量矢量的余弦,这是模型相似性的度量;


Pearson correlation:相关系数距离,适用于R型聚类;


ChebychevChebychev距离,即两观察单位间的距离为其任意变量的最大绝对差值,该技术用于Q型聚类;


BlockCity-BlockManhattan距离,即两观察单位间的距离为其值差的绝对值和,适用于Q型聚类;


Minkowski:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的平方根;p由用户指定


Customized:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的第r次根,pr由用户指定。


本例选用Pearson correlation,点击Continue钮返回Hierarchical Cluster Analysis对话框,再点击OK钮即完成分析。

关于ICC内在一致性统计:
http://www.pinggu.org/bbs/thread-885830-1-1.html

使用道具

板凳
miaomiaolong 发表于 2010-7-20 01:33:31 |只看作者 |坛友微信交流群

10.2.2.3结果解释



在结果输出窗口中将看到如下统计数据:


29例样本进入聚类分析,采用相关系数测量技术。先显示各变量间的相关系数,这对于后面选择典型变量是十分有用的。然后显示类间平均链锁法的合并进程,即第一步,X3X6被合并,它们之间的相关系数最大,为0.863431;第二步,X1X5合并,其间相关系数为0.624839;第三步,X2与第一步的合并项被合并,它们之间的相关系数为0.602099;第四步,它们与第二步的合并项再合并,其间相关系数为0.338335;第五步,与最后一个变量X4合并,这个相关系数最小,为-0.054485   

  


Data Information


29 unweighted cases accepted.


0 cases rejected because of missing value.


Correlation measure used.




Correlation Similarity Coefficient Matrix


VariableX1X2X3X4X5


X2.5379


X3.2995.6349


X4.1480-.1212-.2706


X5.6248.5820.2653.2939


X6.0972.5693.8634-.3226.2481




Agglomeration Schedule using Average Linkage (Between Groups)


ClustersCombinedStage Cluster1st AppearsNext


StageCluster 1Cluster 2CoefficientCluster 1Cluster 2Stage


136.863431003


215.624839004


323.602099014


412.338335235


514-.054485400

  

   

按类间平均链锁法,变量合并过程的冰柱图如下。先是X3X6合并,接着X1X5合并,然后X3X6X2合并,接着再与X1X5合并,最后加上X4,六个变量全部合并。



Vertical Icicle Plot using Average Linkage (Between Groups)





(Down) Number of Clusters(Across) Case Label and number







下面用更为直观的聚类树状关系图表示,即X1X2X3X5X6先聚合后与X4再聚合。这表明,在评价儿童营养状态时,可在微量元素钙、镁、铁、铜和血红蛋白5个指标中选择一个,再加上微量元素锰即可,其效果与六个指标都用是基本等价的,但更经济更迅速。



Dendrogram using Average Linkage (Between Groups)





Rescaled Distance Cluster Combine


微量元素钙、镁、铁、铜和血红蛋白聚合成一类,在这5个指标中如何选择一个典型指标呢?先按下式计算类中每一变量与其余变量的相关指数(即相关系数的平方)的均值,而后把该值最大的变量作为典型指标。


= 式中m为类中变量个数)



本例相关指数的均值依次为:



= = 0.1947



== 0.3388



=  = 0.3272



=  = 0.2164



=  = 0.2851



故选择镁(变量X2)典型指标。

关于ICC内在一致性统计:
http://www.pinggu.org/bbs/thread-885830-1-1.html

使用道具

报纸
miaomiaolong 发表于 2010-7-20 01:34:18 |只看作者 |坛友微信交流群
(式中m为类中变量个数)


本例相关指数的均值依次为
我的问题是:这个公式是什么样子的?相关系数的均值是如何算出来的?
关于ICC内在一致性统计:
http://www.pinggu.org/bbs/thread-885830-1-1.html

使用道具

地板
yiguang0929 发表于 2010-9-27 20:38:22 |只看作者 |坛友微信交流群
看起来有点费劲 不过还是要感谢分享

使用道具

7
柒柒小ye 发表于 2013-6-20 22:10:08 |只看作者 |坛友微信交流群
厉害厉害

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 09:46