什么是无监督、监督、半监督学习

先看个图片

什么是无监督、监督、半监督学习_第1张图片
什么是无监督、监督、半监督学习_第2张图片

什么是监督、无监督学习

区分有监督和无监督,就是看是否有监督(supervised),也就看输入数据是否有标签(label)。输入数据有标签,则为有监督学习(x,y),没标签则为无监督学习(x)。
这也正如我们在高中做题,答案(标签)是非常重要的,假设两个完全相同的人进入高中,一个正常学习(题目有答案),另一人做的所有题目都没有答案,那么想必第一个人高考会发挥更好,第二个人会发疯。
什么是无监督、监督、半监督学习_第3张图片
作者写的非常好:
1.从约束角度分析y对于x的约束
2.论标签对无监督算法的作用

半监督学习

1. 伪标记一种简单的半监督学习方法
为了在监督学习下训练机器学习模型,必须对数据进行标记。这是否意味着未标记的数据对诸如分类和回归之类的监督任务毫无用处?当然不是!除了将额外的数据用于分析目的之外,我们甚至可以使用它来通过半监督学习来训练我们的模型-将未标记和标记的数据结合起来进行模型训练。

训练集:带标签
测试集:无标签
带有标签的训练集不足时,先把训练集进行训练得到训练模型(此时的模型具有一定能力但是不强),将测试集放入模型中,会预测出测试集的伪标签,然后将训练集+带有伪标签的测试集,输入模型中,进一步优化模型。
什么是无监督、监督、半监督学习_第4张图片
结论:
这听起来像是一项强大的技术,是的,它通常会提高我们模型的性能。但是,调整和使其正常工作可能很困难,即使工作了,也只能带来轻微的性能提升。因为它似乎在不大幅提高性能的情况下引入了额外的复杂性

参考:https://datawhatnow.com/pseudo-labeling-semi-supervised-learning/

你可能感兴趣的:(机器学习)