楼主: jason_huo
2949 6

[Modeler] 求高手解答:IMB Modeler里面的k-means的初始群中心是如何选取的? [推广有奖]

  • 0关注
  • 1粉丝

已卖:104份资源

大专生

65%

还不是VIP/贵宾

-

威望
0
论坛币
203 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
113 点
帖子
78
精华
0
在线时间
25 小时
注册时间
2005-12-30
最后登录
2017-3-26

楼主
jason_huo 发表于 2012-3-27 18:11:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求高手解答:IMB Modeler里面的k-means的初始群中心是如何选取的?在SAS里面叫做seed,可以指定seed=。。。,但是在modeler里面不可以,那至少我想知道它的初始seed是如何选取的?是随机的选取的还是选数据集的最初几个观察?

先谢了!!!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:k-means MODELER modele 求高手解答 means 如何 中心

沙发
jason_huo 发表于 2012-3-27 18:24:21
自己顶!!!!!!!

藤椅
kuangsir6 发表于 2012-3-30 09:11:52
      K-Means 的工作原理是根据数据定义一组起始聚类中心。
然后根据记录的输入字段值,将每个记录分配到与其最相似的聚类中。在分配完所有记录后,
更新聚类中心以反映分配到每个聚类的新记录集。然后再次检查记录,以确定是否应将这些
记录重新分配到不同的聚类中,这个记录分配/聚类迭代过程将一直持续,直到达到最大迭代
次数或一次迭代与下次迭代之间的改变不超过指定阈值为止。

板凳
kuangsir6 发表于 2012-3-30 09:16:27
IBM SPSS Modeler 是上述方法。
IBM SPSS Statistics 是分析者自己指定或者由数据本身结构的中心初步确定。

报纸
jason_huo 发表于 2012-4-10 16:32:11
kuangsir6 发表于 2012-3-30 09:11
K-Means 的工作原理是根据数据定义一组起始聚类中心。
然后根据记录的输入字段值,将每个记录分配到 ...
先谢了,你说的是一般聚类的初始中心确定后的迭代方法。当然能够指定初始中心就最好了,不可以的话,不同工具也有不同的指定方法。研究了一下,找出modeler里面确定初始中心的算法了,在这里给大家分享一下,大家应该能看懂的,就不翻译了:

Selecting Initial Cluster Centers
The user specifes k, the number of clusters in the model. Initial cluster centers are chosen using a
maximin algorithm:
1. Initialize the first cluster center as the values of the input fields for the first data record.
2. For each data record, compute the minimum (Euclidean) distance between the record and each
defined cluster center.
3. Select the record with the largest minimum distance from the defined cluster centers. Add a new
cluster center with values of the input fields for the selected record.
4. Repeat steps 2 and 3 until k cluster centers have been added to the model.
Once initial cluster centers have been chosen, the algorithm begins the iterative assign/update
process.

地板
kuangsir6 发表于 2012-4-10 22:09:46
jason_huo 发表于 2012-4-10 16:32
先谢了,你说的是一般聚类的初始中心确定后的迭代方法。当然能够指定初始中心就最好了,不可以的话,不同 ...
明白你的问题了,谢谢楼主提供的算法。是SPSS公司在Modeler 里面介绍的算法吗?

7
jason_huo 发表于 2012-4-11 17:02:46
kuangsir6 发表于 2012-4-10 22:09
明白你的问题了,谢谢楼主提供的算法。是SPSS公司在Modeler 里面介绍的算法吗?
对的,这是官方的 algorithm guide 里面的东西

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 07:08