K近邻算法原理

K近邻算法原理

    • 基本思想
    • 欧氏距离
    • 算法流程
    • 影响因素

咱们来一起学习一下K近邻(k-nearest neighbors,简称KNN)算法的基本原理~

基本思想

首先来看这样一幅图:
K近邻算法原理_第1张图片
我们根据涂色样本点和未涂色样本点 X 的距离给涂色样本点编号1-6,即:1号样本点距离X最近,其余次之。

那么问题来了:样本点 X 应该属于哪种颜色呢?是蓝色还是绿色?

其实,我们可以根据 X 的相邻样本点来判定。例如,和 X 距离最近的三个样本点中绿色占多数,那么 X 就属于为绿色;和 X 距离最近的 5 个样本点中蓝色占多数,那么 X 就属于蓝色。

这种解决问题的思路正是 K 近邻算法的基本思想:根据 K 个近邻样本的 y 值来预测自身的 y 值。具体到上面例子中的 y 值就是样本点的颜色。

K 近邻是监督学习中比较简单的一种算法,它既可

你可能感兴趣的:(机器学习精通)