机器学习算法 --KNN算法(K-Nearest Neighbor)简单理解

KNN算法工作原理:

存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类对应的关系。输入没有标签的数据后,将新数据中的每个特征与样本集中数据对应的特征进行比较,提取出样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k近邻算法中k的出处,通常k是不大于20的整数。最后选择k个最相似数据中出现次数最多的分类作为新数据的分类。

简单来说就是在训练集中找到与放入的无标签样本的特征最相似的K个值,将K个值中出现最多的标签赋予放入的样本.

OVER~

你可能感兴趣的:(机器学习,算法,近邻算法)