一、层次聚类
1、层次聚类的原理及分类
1)层次法(
Hierarchical methods
)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一个类。
其中类与类的距离的计算方法有:最短距离法,最长距离法,中间距离法,类平均法等。比如最短距离法,将类与类的距离定义为类与类之间样本的最短距离。
层次聚类算法根据层次分解的顺序分为:
自下底向上和自上向下,即
凝聚的层次聚类算法和分裂的层次聚类算法(
agglomerative
和divisive
),也可以理解为自下而上法(
bottom-up
)和自上而下法(
top-down
)。自下而上法就是一开始每个个体(
object
)都是一个类,然后根据
linkage
寻找同类,最后形成一个“类”。自上而下法就是反过来,一开始所有个体都属于一个“类”,然后根据
linkage
排除异己,最后每个个体都成为一个“类”。
这两种路方法没有孰优孰劣之分,只是在实际应用的时候要根据数据特点以及你想要的“类”的个数,来考虑是自上而下更快还是自下而上更快。至 ...


雷达卡


京公网安备 11010802022788号







