监督学习,无监督学习,半监督学习的区别

机器学习大致可以分成三类,第一类是监督学习(Supervised Learning),第二类是无监督学习(Unsupervised Learning),第三类是半监督学习(Semi-supervised Learning)。

1.监督学习(Supervised Learning):监督学习最大的特点就是其数据集带有标签。换句话来说,监督学习就是在带有标签的训练数据中学习模型,然后对某个给定的新数据利用模型预测它的标签。具体点来说,该数据集中的标签就像是作业的标准答案,而我们预测的标签则是我们给出的答案。如果我们的答案和标准答案不同,老师和父母就会来纠正,我们会进行学习,对题目的理解就会加深,正确率就会越来越高。

2.无监督学习(Unsupervised Learning):无监督学习和监督学习相反,所处的学习环境都是没有标签的数据。无监督学习实质上就是一种聚类问题,而非分类。在这里,我将分类问题理解为根据数据的特征或属性,将新对象划分到已有的类别中,而聚类问题则是并不知道数据会分为几类,需要分析数据,从而进行分类。简单来说,就是在一堆没有标签的数据中进行聚类,这一类数据可能有关财经,这一类数据肯有关政治,另一类则可能有关体育。

3.半监督学习(Semi-supervised Learning):半监督学习就是既有用到无标签数据,也有用到标签数据。半监督学习就是通过带有标签的数据来把无标签的数据归类到已知的事物领域。举个例子来简单说明一下。

a) 庄xx同学(数据1)是一个智能1班的学生(标签为智能1班的学生)
b) 林xx同学(数据2)是一个智能1班的学生(标签为智能1班的学生)

假设有一个翁xx同学(数据3),我并不知道他是谁,也不知道他是哪个班的学生,单经过观察,我发现翁xx同学经常跟着庄xx同学和林xx同学进出智能1班,所以我可以认为翁xx同学也是智能1班的学生。

你可能感兴趣的:(学习,机器学习,聚类)