楼主: grandcc1
2992 1

[问答] 数据多维度降维聚类问题 [推广有奖]

  • 1关注
  • 0粉丝

本科生

30%

还不是VIP/贵宾

-

威望
0
论坛币
7 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
499 点
帖子
23
精华
0
在线时间
127 小时
注册时间
2014-12-1
最后登录
2018-3-25

楼主
grandcc1 学生认证  发表于 2017-6-8 14:27:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  各位,现在手头上有中国22个城市的共计122项指标,现在需要根据这些维度对这22个城市进行聚类分析,我使用mds,代码如下:
   shenzhen=read.table("clipboard",header = T)
library(fpc)
min.max.norm <- function(x){
    (x-min(x))/(max(x)-min(x))
}
norm.data=as.data.frame(lapply(shenzhen,min.max.norm))
K <- 2:8
round <- 30 # 每次迭代30次,避免局部最优
rst <- sapply(K, function(i){
    print(paste("K=",i))
    mean(sapply(1:round,function(r){
        print(paste("Round",r))
        result <- kmeans(norm.data, i)
        stats <- cluster.stats(dist(norm.data), result$cluster)
        stats$avg.silwidth
    }))
})
plot(K,rst,type='l',main='轮廓系数与K的关系', ylab='轮廓系数')

#当k取2时,有最大的轮廓系数
clu <- kmeans(norm.data,2)
mds = cmdscale(dist(norm.data,method="euclidean"))
plot(mds, col=clu$cluster, main='聚类分析', pch = 19,xlab="",ylab="",xaxt="n",yaxt="n")
text(mds[1,1],mds[1,2],"深圳",pos=1)
text(mds[11,1],mds[11,2],"北京",pos=1)
text(mds[12,1],mds[12,2],"上海",pos=1)
text(mds[13,1],mds[13,2],"广州",pos=1)


得到如图所示聚类结果,请问怎么解释这张图的两个坐标轴呢,有实际的经济意义吗?
请问还有其他方法能对这22个城市进行聚类分析吗?
谢谢!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多维度 clipboard Shenzhen Library Board

图片1.png (3.56 KB)

图片1.png

聚类数据.xlsx
下载链接: https://bbs.pinggu.org/a-2267808.html

45.41 KB

沙发
niusnow 发表于 2017-10-11 17:14:29
能加下qq641573672,交流一下吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-5 17:51