楼主: 李小咩
2269 2

[问答] R语言 kmeans聚类如何将结果可视化,以及后续如何分析 [推广有奖]

  • 0关注
  • 0粉丝

高中生

70%

还不是VIP/贵宾

-

威望
0
论坛币
7 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
515 点
帖子
12
精华
0
在线时间
41 小时
注册时间
2017-3-3
最后登录
2024-11-29

楼主
李小咩 发表于 2017-10-23 19:38:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
(非伸手党)应用统计专业大三学生,在学习R的过程中遇到小沟小坎,希望大大们高抬贵手,费心点拨。
拿到的是一份40列,1000行的基因样本数据,预处理完毕,在对其进行k=2,k=3的不同类后,得到了结果,但之后如何对其进行分析,如何做到可视化,就完全没头绪了。
小弟自己做的代码奉上,希望大大看到我的尝试不要笑出声,精心指导一下,谢谢


#组织样本的k-means聚类研究
##一、准备工作
library(stats)
library(ggplot2)
##二、读取数据
data_2<-read.csv(file.choose(),header = FALSE)
##二、对数据进行初步整理观察
dim(data_2)
str(data_2)
summary(data_2)
summary(is.na(data_2))
首先,所有数值并未发现缺失值,也就省去了缺失值处理的步骤
其次,40个样本的最小值比较接近,但最大值存在较大跨度,因此需要对全部数据进行标准化,这里使用Z-score标准化方法
###Z-score标准化方法
data_2_zscore <- as.data.frame(lapply(data_2,scale))

head(data_2_zscore)
set.seed(1)
data_2_zscore<-data_2_zscore[order(runif(1000)),]
###对处理后的数据进行k-means方法计算
data_2_clusters <- kmeans(data_2_zscore, centers = 2)
data_2_clusters$size
data_2_clusters <- kmeans(data_2_zscore, centers = 3)
data_2_clusters$size

源文件下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:kmeans means mean 可视化 R语言

沙发
李小咩 发表于 2017-10-23 19:42:25
http://pan.baidu.com/s/1i5H1sqD  数据.csv 链接在这里放出

藤椅
李小咩 发表于 2017-10-23 19:46:10
http://pan.baidu.com/s/1i5H1sqD 数据链接

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 01:57