楼主: 6704_1574074070
933 2

[学习笔记] 【学习笔记】回想聚类过程示意图 导包 from sklearn.datasets import make_bl ... [推广有奖]

  • 0关注
  • 1粉丝

大专生

33%

还不是VIP/贵宾

-

威望
0
论坛币
208 个
通用积分
34.7079
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
220 点
帖子
42
精华
0
在线时间
0 小时
注册时间
2019-11-18
最后登录
2019-12-25

楼主
6704_1574074070 发表于 2019-12-25 23:28:30 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
回想聚类过程示意图
导包
from sklearn.datasets import make_blobs #导入生成簇状数据的模块
from sklearn.cluster import KMeans    #导入KMeans
import matplotlib.pyplot as plt
%matplotlib inline
import pandas as pd
import numpy as np
from sklearn.metrics import silhouette_samples, silhouette_score #导入轮廓系数
import matplotlib.cm as cm #导入colormap模块,图谱



1、创建数据集并查看
X,y = make_blobs(n_samples=500, n_features=2, centers=4, random_state=1)

n_samples设置样本数量,n_features=2设置特征数量是2,方便画图 ,
random_state=1 固定簇中数据的生成方式,方便实验结果可以复现

2、画图查看数据集的分布情况
通过画图查看生成数据集的数据分布 为了看可以聚成几类作参考
plt.scatter(X[:,0],X[:,1],s=8); #s =8设置点的大小

3、基于自建的数据集运用K-Means进行聚类
(1)导包
from sklearn.cluster import KMeans    #导入KMeans

(2)建模
n_cluster = 3 #设置聚类簇数为3簇

kmeans = KMeans(n_clusters = n_cluster ,random_state= 0)
实例化模型 ,要求模型聚类簇数为n_cluster类 .random_state= 0后续详细讲解

cluster = kmeans.fit(X)
由于聚类数据没有真实标签y,所以训练模型时只用特征矩阵训练
训练特征矩阵,拟合模型,计算K均值的聚类结果,找到质心,聚类完成

(3) labels属性调取聚类结果:重要属性labels_,查看聚类好的结果,每个样本所对应的类别标签
y_pred = cluster.labels_
查看聚类后的标签,因为要求聚类数量是3类,所以预测的标签是0,
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:datasets dataset import Learn DataS

沙发
512661101 发表于 2019-12-26 01:28:13 来自手机

藤椅
jessie68us 发表于 2019-12-26 04:57:57 来自手机

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-24 16:13