MixMatch半监督学习论文分析【终于说清楚了系列1】

MixMatch: A Holistic Approach to Semi-Supervised Learning.

文章发表于NeurIPS 2019

半监督方法的目是充分利用少量的有标数据以及大量的无标数据。
为了充分利用有标数据,通常会对有标数据进行增强
为了充分利用无标数据,会通过一种方法给无标数据打上人工标签,然后就可以像有标数据一样利用起来
MixMatch的主要步骤如下:


image.png

1.对有标数据进行增强
2.给无标数据一个人工标签。通过对一个无标数据增强K次并输入模型得到预测结果,对K次结果进行平均并锐化(Sharpen),得到人工标签。值得注意的是,这里的标签并不是one-hot的,而是一个概率分布。
3.将增强后有标数据和K个打上人工标签的无标数据都当做是有标数据,正常进行Mixup操作。

由此可见,该方法一致性正则熵最小正则(smoothness/cluster assumption)的应用。
一致性正则体现在将一个无标数据增强K次后打上同样的label
熵最小正则体现在给无标数据一个人工标签的过程

实验

image.png

image.png

代码:https://github.com/google-research/mixmatch

你可能感兴趣的:(MixMatch半监督学习论文分析【终于说清楚了系列1】)