| 所在主题: | |
| 文件名: 聚类数据.xlsx | |
| 资料下载链接地址: https://bbs.pinggu.org/a-2267808.html | |
| 附件大小: | |
|
各位,现在手头上有中国22个城市的共计122项指标,现在需要根据这些维度对这22个城市进行聚类分析,我使用mds,代码如下:
shenzhen=read.table("clipboard",header = T) library(fpc) min.max.norm <- function(x){ (x-min(x))/(max(x)-min(x)) } norm.data=as.data.frame(lapply(shenzhen,min.max.norm)) K <- 2:8 round <- 30 # 每次迭代30次,避免局部最优 rst <- sapply(K, function(i){ print(paste("K=",i)) mean(sapply(1:round,function(r){ print(paste("Round",r)) result <- kmeans(norm.data, i) stats <- cluster.stats(dist(norm.data), result$cluster) stats$avg.silwidth })) }) plot(K,rst,type='l',main='轮廓系数与K的关系', ylab='轮廓系数') #当k取2时,有最大的轮廓系数 clu <- kmeans(norm.data,2) mds = cmdscale(dist(norm.data,method="euclidean")) plot(mds, col=clu$cluster, main='聚类分析', pch = 19,xlab="",ylab="",xaxt="n",yaxt="n") text(mds[1,1],mds[1,2],"深圳",pos=1) text(mds[11,1],mds[11,2],"北京",pos=1) text(mds[12,1],mds[12,2],"上海",pos=1) text(mds[13,1],mds[13,2],"广州",pos=1) 得到如图所示聚类结果,请问怎么解释这张图的两个坐标轴呢,有实际的经济意义吗? 请问还有其他方法能对这22个城市进行聚类分析吗? 谢谢!! |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明