KNN和kmeans算法的区别

文章目录

  • 1.KNN算法
  • 2.kmeans算法
  • 3.区别
    • 1.类型区别
    • 2.学习对象区别

1.KNN算法

KNN算法的定义,简单来说就是通过计算未知样本与所有样本之间的距离,以最近邻者的类别作为决策位置样本类别的唯一依据。
KNN是一种典型的分类算法,因其简单高效在世界范围内受到广泛应用。
但是KNN同样有很多缺点,比如对内存要求较高,容易受到噪声干扰等等。

2.kmeans算法

kmeans算法的定义:给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数。
kmeans的缺点也很明显,选择的K值不好把握,并且因为是采取迭代的方法,很容易得到的是局部最优解。

3.区别

1.类型区别

KNN是分类算法,在分类之前已经有学习对象,属于监督学习;而k-means算法是聚类算法,属于无监督学习。

2.学习对象区别

KNN所学习的内容都是带有label的对象,是完全正确的对象;
kmeans所学的内容是无label的对象,需要先将其分类,再进行学习。

你可能感兴趣的:(笔记,算法,kmeans,聚类)