k-means
第一步:确定一个超参数k,我想要把数据聚合成几类。
举例:聚合成三类,则k = 3
第二步:在样本空间中随机选择三个样本点。
依次标记为红色,绿色,蓝色
第三步:把这个三个样本点作为聚类的中心,依次计算出每个样本点距离这三个聚类中心的距离。
找出其中最近的一个聚类中心,把该样本归类为这个簇。
则数据会被分为三个簇。
第四步:在生成的三堆数据,分别计算三堆数据的质心。把这个质心当做新的聚类中心点。
第五步:以这三个新的聚类中心,重复第三步和四步
第六步:一直重复迭代,直到所有样本点的聚类情况都不再发生变化,则聚类结束。
或者达到最大迭代次数。『laoshi』


雷达卡


京公网安备 11010802022788号







