ML-knn:基于K近邻的多标签数据表示方法(毕设论文学习三)

KNN介绍

KNN学习是一种监督学习方法。
它的工作机制为:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。
KNN学习与其他学习方法的最大不同之处:它是“懒惰学习”的著名代表,没有显示的训练过程,在训练阶段仅把样本保存,训练时间开销为零, 待收到测试样本后在进行处理。
在这里,k值的选择会对分类结果有显著影响;另一方面,采用不同的距离计算方式,找出的“近邻”可能有显著差别从而也会对分类结果有显著不同。

ML-KNN是什么

ML-KNN是一种算法,可以对输入的图片、文本、酵母序列进行多标签分类的一种算法

ML-KNN如何完成功能

首先,它在训练阶段对于训练集并不做过多处理。
其次,在得到输入的测试实例时,该算法会确定输入实例在训练集中的k个最近邻居。然后根据训练集中这些邻居的标签集进行一定处理,获得邻居实例属于各个可能类别的个数信息,最后利用最大后验原理来确定测试实例有哪些标签

为什么ML-KNN能实现多标签分类

从它完成功能的程序上我们可以看出,ML-KNN相当于在进行一个归纳总结,类比推理的过程
可以想象为,机器在得到输入后并不知道输入的是什么,那么他如何知道自己拿到了什么?他根据自己目前已经认识的东西(即训练集),通过认识的来对现在这个不认识的进行类比、归纳,数据处理,推断得到最可能的答案,进行输出。

你可能感兴趣的:(机器学习)