knn 最近邻 算法的思考 与 总结

算法功能 分类(核心功能),回归
算法类型 有监督学习,惰性学习(没有产生模型),距离类模型
数据输入

包含数据标签y,特征空间中至少包含K个训练样本

特征空间中各个特征的量纲需要统一,若不统一则需要进行归一化处理

自定义超参数k

模型输出

在knn分类中,输出是标签中的某个类别

在knn回归中,输出是对象的属性值,该值是距离输入的数据最近的k个训练样本标签的平均值

   

1.优点

     1.1 简单好用 ,容易理解, 精度高,理论成熟,可以用来做分类也可以用来做回归

     1.2可以用于数值型数据,也可以用于离散型数据

    1.3无数据输入的假定

     1.4适合对稀有事件进行分类

 

 

2 缺点  :

     计算复杂性高,空间复杂性高

     计算量太大,所以一般数值很大的时候不用这个,但是单个样本有不能太少,否则容易发生误分

      样本不平衡问题,

       可理解性比较差,无法给出数据的内在含义

 

The more important is  python 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(ML)