KNN翻译的名字很可爱——K近邻,K个nearest neighbors
knn和kmeans的区别
1.KNN算法是分类算法,分类算法肯定是需要有学习语料,然后通过学习语料的学习之后的模板来匹配我们的测试语料集,将测试语料集合进行按照预先学习的语料模板来分
类
2kmeans算法是聚类算法,聚类算法与分类算法最大的区别是聚类算法没有学习语料
集合。
K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k
个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
所谓
统计学上的聚类,是一种无监督学习模型,通俗讲是不需要区分训练和测试数据集的,给到一个数据集扔给聚类算法(如:K-means,Q型聚类、R型聚类),算法可以直接给到分类结果。
所谓KNN的分类算法,是一种有监督的学习模型,类似统计学上的判别分析,需要先通过训练数据集学习得到某个分类函数或规则,再按照该函数或规则对测试数据集、待分类数据集进行判断归类