《算法图解》note 10 K近邻算法

这是《算法图解》第十篇读书笔记,内容主要是K邻近算法的介绍。

1.K近邻算法简介

K近邻算法(K-nearest neighbor)是一个给定训练数据,根据样本数据最近的K个实例的类别来判断样本数据的类别或数值的算法。该算法可细分为两种类型:判断样本类别的分类算法,计算样本数据的值的算法。

2.python实现方式

可用python的scikit-learn包实现K近邻算法。
调用包的方式如下:

from sklearn import neighbors
#K近邻算法的分类算法
classifier=neighbors.KNeighborsClassifier()
#K近邻算法的回归算法
regressor=neighbors.KNeighborsRegressor()

3.K近邻算法的优缺点

3.1优点

(1)可处理分类问题和回归问题。
(2)适合大样本情况下的自动分析。

3.2缺点

(1)计算量大。
(2)样本不平衡时,对稀少类的分率准确率较低。

你可能感兴趣的:(《算法图解》note 10 K近邻算法)