STAC: A Simple Semi-Supervised Learning Framework for Object Detection

秋招结束了,准备开始搞毕业论文了,记录下这周组会要将的论文。这篇论文主要讲的是半监督的目标检测。

背景

我们可以将目标检测分类四个部分:

有监督目标检测:拥有大规模带标签的数据,包括完整的实例级别的标注,即包括坐标和类别信息
弱监督目标检测:数据集中的标注包含类别,不包含坐标信息
弱半监督目标检测:数据集中拥有部分实例级别的标注,大量弱标注数据,模型希望利用大规模的弱标注数据提升模型的检测能力
半监督目标检测:数据集中拥有部分实例级别的标注,大量未标注数据,模型希望利用大规模的未标注数据提升模型的检测能力

半监督检测的方法核心在于,如何充分利用大量未标注、多样性的数据提升模型在测试集上的性能。这篇论文主要用伪标签的办法去学习。

模型

模型主要分为两个阶段:
第一个阶段:使用所有有label 的数据训练目标检测器直到收敛;用该检测器预测无标数据中目标实体bounding box和类别;基于置信度过滤预测框以获得较高精度的为标签
第二阶段:对所有无标数据集进行数据增强,使用第一阶段生成伪标签的无标数据和有标数据训练模型

展开说说,主要分为四步:
第一步:训练一个teacher模型
第二步:用第一步的teachr模型,给无标签的数据生成伪标签。这里呢有个超参数τ,他先用NMS筛掉一部分框之后,在选出大于这个超参数的阈值的框出来,后面说明τ=0.9效果不错。
第三步:对无标的数据进行增强,当数据进行全局变化时伪标签也要做相应的变化,分别是:C(Global color transformation)、G(Global geometric transformation)、B(Box-level transformation)
第四步:计算无监督和有监督的损失,训练模型。

你可能感兴趣的:(深度学习)