楼主: xiaoxiaofei_123
719 2

[数据挖掘工具] 机器学习之聚类 [推广有奖]

  • 0关注
  • 0粉丝

大专生

56%

还不是VIP/贵宾

-

威望
0
论坛币
51 个
通用积分
4.4196
学术水平
31 点
热心指数
40 点
信用等级
21 点
经验
1119 点
帖子
15
精华
0
在线时间
68 小时
注册时间
2017-10-11
最后登录
2020-4-30

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一、        kmeans聚类
无监督学习

输入:样本集D
     聚类簇数k;
1.        从D中随机选取k个样本作为初始均值向量;
2.        遍历所有样本,找出与k个初始值距离最近的,与Ki归为一簇;
3.        得到K个子样本集合;
4.        计算每簇的均值向量;
5.        变量所有样本,距离ki最近的重新调整位置;
6.        重复以上步骤,直至位置不再发生变化。



二、        层次聚类
AGNES是一种采用“自底向上”的聚合策略的层次聚类算法。它先将数据集中的每个样本看作一个初始聚类簇,然后再算法运行的每一步中找出距离最近的两个聚类簇进行合并,该过程不断重复,直至达到预设的聚类簇个数。关键点是计算聚类簇之间的距离。
有三种距离算法:最小距离(由两个簇的最近样本决定),最大距离(由两个簇的最远样本决定),而平均距离则由两个簇的所有样本共同决定。




三、        KNN(k近邻聚类)
K近邻(K-Nearest Neighbor,简称kNN)学习是一种常用的监督学习方法。
原理:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这K个“邻居”的信息来进行预测。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 kmeans means Agnes 均值向量

已有 1 人评分经验 论坛币 学术水平 热心指数 收起 理由
阿扁V5 + 20 + 20 + 2 + 2 精彩帖子

总评分: 经验 + 20  论坛币 + 20  学术水平 + 2  热心指数 + 2   查看全部评分

沙发
阿扁V5 学生认证  发表于 2018-2-1 09:11:37 |只看作者 |坛友微信交流群
下次介绍介绍怎么实现的呗

使用道具

藤椅
epath 发表于 2018-2-7 17:31:00 |只看作者 |坛友微信交流群
怎么实现的??

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 14:45