楼主: 时光永痕
3831 0

[数据挖掘新闻] 使用K均值聚类算法计算聚类中质心的步骤 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

4%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2020-12-1 20:39:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
使用K均值聚类算法计算聚类中质心的步骤
在此博客中,我将详细介绍K-means方法,并说明如何计算质心和数据点之间的距离以形成聚类。
考虑下面的数据集,该数据集具有特定图形上的数据点的值。
表格1:
我们可以随机选择两个初始点作为质心,然后从那里开始计算每个点的距离。
现在,我们将D2和D4视为质心。
首先,我们应该借助欧几里得距离来计算距离
                                                           √((x1-y1)2+(x2-y2)2
迭代1:
步骤1: 我们需要计算初始质心点与其他数据点之间的距离。下面,我显示了距数据点D1的初始质心D2和D4的距离的计算。
在计算所有数据点的距离之后,我们得到以下值。
表2:
第2步:接下来,我们需要对距离中心点较近的数据点分组。观察上表,我们可以注意到D1距离D4越近,距离越近。因此我们可以说D1属于D4。同样,D3和D5属于D2。分组后,我们需要从表1计算分组值的平均值。
群集1:(D1,D4)群集2:(D2,D3,D5)
步骤3:现在,我们计算创建的聚类的平均值,新的中心值将这些平均值和质心沿图形移动。
从上表中,我们可以说群集1的新质心是(2.0,1.0),群集2的新质心是(2.67,4.67)
迭代2:  
步骤4:再次根据新的百分位数计算出欧几里得距离的值。下表是数据点和新质心之间的距离表。
现在我们可以注意到群集已经更改了数据点。现在,群集1具有D1,D2和D4数据对象。同样,集群2具有D3和D5
步骤5:根据我们在步骤3中执行的表1计算新聚类组的平均值。下表将显示平均值
现在,我们有了新的质心值,如下所示:
群集1(D1,D2,D4)  -(1.67,1.67)和群集2(D3,D5)-(3.5,5.5)
必须重复此过程,直到找到质心的常数,并且最新的聚类将被视为最终的聚类解决方案。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:聚类算法 k-means means 欧几里得 百分位数

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-23 21:15