3.1 KNN - 算法概述

KNN算法的缺点

  1. 效率低下(最大的缺点),O(m*n)的复杂度,m个样本,n个特征.
  2. 高度数据相关
  3. 预测结果不具有可解释性.

KNN算法原理
针对某个数据点,根据旁边相邻数据点的标记,进行投票,该数据点位票数最多的标记.

超参数

  1. 距离.可采用不同的距离.对明可夫斯基距离,可以取不同的p


    3.1 KNN - 算法概述_第1张图片
    距离

2.n_neighbors(k) 进行投票的数据点,数据点k越小,算法越复杂.

3.weights:加权方式,可以按照等距离加权,也可以根据距离的倒数进行加权.

你可能感兴趣的:(3.1 KNN - 算法概述)