楼主: 1528428009
1760 3

[实际应用] H-K聚类 [推广有奖]

  • 0关注
  • 0粉丝

大专生

90%

还不是VIP/贵宾

-

威望
0
论坛币
119 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
111 点
帖子
42
精华
0
在线时间
82 小时
注册时间
2015-1-11
最后登录
2018-7-26

楼主
1528428009 发表于 2016-8-11 14:03:11 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近在学习聚类这一块,有一个问题关于H-K(层次聚类-K均值)聚类的问题向大家请教。书上说由于K均值聚类的中心是随机选取的,因此需要多次迭代,而H-K聚类可以先用层次聚类确定聚类中心和数量,再用K-均值聚类。那么请问这两种方法是怎么结合到一起的呢,层次聚类是怎么确定聚类中心的,R代码又是怎么实现的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R代码 中心

沙发
bbslover 在职认证  发表于 2016-8-13 04:52:55
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。

藤椅
1528428009 发表于 2016-8-13 16:51:43
bbslover 发表于 2016-8-13 04:52
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。
我知道用哪些包可以实现,我也知道操作,如果您知道答案请正面回答问题

板凳
bbslover 在职认证  发表于 2016-8-13 23:48:39
正面回答,哈哈~

尝试回答一下:
而H-K聚类可以(1)先用层次聚类确定聚类中心和数量,(2)再用K-均值聚类。

你的问题的核心是:如何确定需要多少个cluster(这也是所有clustering算法最需要解决的问题,但是没有最好的办法)?而(1)说用hclust()帮助你得到所谓的cluster的数量,比如是3。然后你可以用3作为k-mean的输入[kmeans(x, centers = 3)],得到最终的聚类结果。

我想大体就是这样。

其实有很多办法来确定最优的cluster数目,但不能说哪个是最好的,都与你数据本身有关。

Good luck.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 10:48