发帖

楼主: 6704_1574074070

970 2

[学习笔记] 【学习笔记】回想聚类过程示意图导包 from sklearn.datasets import make_bl ... [推广有奖]

0关注
1粉丝

大专生

33%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 208 个
通用积分: 34.7079
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 220 点
帖子: 42
精华: 0
在线时间: 0 小时
注册时间: 2019-11-18
最后登录: 2019-12-25

楼主

6704_1574074070 发表于 2019-12-25 23:28:30 来自手机 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

回想聚类过程示意图
导包
from sklearn.datasets import make_blobs #导入生成簇状数据的模块
from sklearn.cluster import KMeans #导入KMeans
import matplotlib.pyplot as plt
%matplotlib inline
import pandas as pd
import numpy as np
from sklearn.metrics import silhouette_samples, silhouette_score #导入轮廓系数
import matplotlib.cm as cm #导入colormap模块,图谱

1、创建数据集并查看
X,y = make_blobs(n_samples=500, n_features=2, centers=4, random_state=1)

n_samples设置样本数量,n_features=2设置特征数量是2,方便画图 ,
random_state=1 固定簇中数据的生成方式,方便实验结果可以复现

2、画图查看数据集的分布情况
通过画图查看生成数据集的数据分布为了看可以聚成几类作参考
plt.scatter(X[:,0],X[:,1],s=8); #s =8设置点的大小

3、基于自建的数据集运用K-Means进行聚类
（1）导包
from sklearn.cluster import KMeans #导入KMeans

（2）建模
n_cluster = 3 #设置聚类簇数为3簇

kmeans = KMeans(n_clusters = n_cluster ,random_state= 0)
实例化模型 ,要求模型聚类簇数为n_cluster类 .random_state= 0后续详细讲解

cluster = kmeans.fit(X)
由于聚类数据没有真实标签y,所以训练模型时只用特征矩阵训练
训练特征矩阵,拟合模型,计算K均值的聚类结果,找到质心,聚类完成

（3） labels属性调取聚类结果：重要属性labels_,查看聚类好的结果,每个样本所对应的类别标签
y_pred = cluster.labels_
查看聚类后的标签,因为要求聚类数量是3类,所以预测的标签是0,

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：datasets dataset import Learn DataS

[学习笔记] 【学习笔记】回想聚类过程示意图导包 from sklearn.datasets import make_bl ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级热心勋章

中级热心勋章

高级热心勋章

本版微信群

[学习笔记] 【学习笔记】回想聚类过程示意图 导包 from sklearn.datasets import make_bl ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级热心勋章

中级热心勋章

高级热心勋章

本版微信群

[学习笔记] 【学习笔记】回想聚类过程示意图导包 from sklearn.datasets import make_bl ... [推广有奖]

扫码加我拉你入群