聚类分析是一种数据划分或分组处理的重要手
段和方法。其操作的目的在于将特征空间中一组没
有类别标记的矢量按某种相似性准则划分到若干个
子集中, 使得每个子集代表整个样本集的某个或者
某些特征和性质。从这个意义上讲, 聚类又称为无
监督的分类。
传统的聚类分析把每个样本严格地划分到某一
类, 属于硬划分的范畴。实际上, 样本并没有严格
的属性, 它们在性态和类属方面存在着中介性。随
着模糊集理论的提出, 硬聚类被推广为模糊聚类。
在模糊聚类中, 每个样本不再仅属于某一类, 而是
以一定的隶属度分属于每一类。换句话说, 通过模
糊聚类分析, 得到了样本属于各个类别的不确定性
程度, 即建立起了样本对于类别的不确定性的描
述, 这样就能更准确地反映现实世界。
|