签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › 数据分析与数据挖掘 › 机器学习之聚类

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

提升主题| 本版置顶| 关闭主题| 变更主题颜色| 抢沙发| 顶贴| 显身卡| 道具中心

楼主: xiaoxiaofei_123

719 2

[数据挖掘工具] 机器学习之聚类 [推广有奖]

已阅图章

0关注
0粉丝

大专生

56%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 51 个
通用积分: 4.4196
学术水平: 31 点
热心指数: 40 点
信用等级: 21 点
经验: 1119 点
帖子: 15
精华: 0
在线时间: 68 小时
注册时间: 2017-10-11
最后登录: 2020-4-30

楼主

xiaoxiaofei_123 发表于 2018-1-29 17:00:08 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

一、 kmeans聚类
无监督学习

输入：样本集D
聚类簇数k;
1. 从D中随机选取k个样本作为初始均值向量；
2. 遍历所有样本，找出与k个初始值距离最近的，与Ki归为一簇；
3. 得到K个子样本集合；
4. 计算每簇的均值向量；
5. 变量所有样本，距离ki最近的重新调整位置；
6. 重复以上步骤，直至位置不再发生变化。

二、层次聚类
AGNES是一种采用“自底向上”的聚合策略的层次聚类算法。它先将数据集中的每个样本看作一个初始聚类簇，然后再算法运行的每一步中找出距离最近的两个聚类簇进行合并，该过程不断重复，直至达到预设的聚类簇个数。关键点是计算聚类簇之间的距离。
有三种距离算法：最小距离（由两个簇的最近样本决定），最大距离（由两个簇的最远样本决定），而平均距离则由两个簇的所有样本共同决定。

三、 KNN（k近邻聚类）
K近邻（K-Nearest Neighbor，简称kNN）学习是一种常用的监督学习方法。
原理：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这K个“邻居”的信息来进行预测。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：机器学习 kmeans means Agnes 均值向量

相关帖子

• CDA数据分析师认证考试

已有 1 人评分	经验	论坛币	学术水平	热心指数	收起理由
阿扁V5	+ 20	+ 20	+ 2	+ 2	精彩帖子

总评分: 经验 + 20 论坛币 + 20 学术水平 + 2 热心指数 + 2 查看全部评分

回复

使用道具举报

沙发

学生认证

发表于 2018-2-1 09:11:37 |只看作者 |坛友微信交流群

下次介绍介绍怎么实现的呗

回复

使用道具举报

藤椅

epath 发表于 2018-2-7 17:31:00 |只看作者 |坛友微信交流群

怎么实现的??

回复

使用道具举报

发帖

本版微信群

加好友,备注cda
拉您进交流群

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明