密度聚类算法报告
密度聚类算法报告 1. 摘要 聚类分析是数据挖掘的重要方法。该文阐述了基于密度聚类分析的基本概念及其经典的算法思想,并提出了一种基于核心点进行聚类的算法。该算法首先对点进行分类,分出核心点、边界点和噪音点。然后采用自下而上的方式对簇进行合并。对所有数据进行分类并合并标记后,给出最后结果图。算法保证了数据处理的完整性。
2. 密度聚类的相关概念 对于构成簇的每个对象,其Eps邻域包含的对象个数必须不小于一个给定值,也就是说其邻域的密度必须不小于某个阈值。下面给出基于密度聚类算法分析中的一些定义。
直接密度可达:设 p是核心点,如果q在p的Eps邻域内,则称从p出发直接可达q。
密度相连:如果样本集合中存在一个对象o ,使得对象p 和q 是从o 关于Eps邻域和MinPts 密度可达的,那么对象p 和q 关于Eps和MinPts 密度相连 。
簇:基于密度可达性的最大的密度相连的点的集合称为簇。
噪音点:不在任何簇中的对象。
3. 原理 考察样本集中的某一点o,若o是核心点,则通过区域查询得到该点的邻域,邻域中的点和o同属于一个簇,这些点将作为下一轮的考察对象,并通过不断 ...


雷达卡


京公网安备 11010802022788号







