论文阅读笔记 | (IJCAI 2018 Oral) Collaborative Learning for Weakly Supervised Object Detection

论文来自于上海交通大学,点击下载

Abstract

训练一个高准确率的检测模型需要大量精细标注的图片数据,其成本很高。本文提出了一种弱监督协同学习框架,仅使用粗略标签的图片训练目标检测模型,测试结果显示其定位精确率和检测准确率均显著优于目前最先进的方法。

本论文提出了一种弱监督协同学习(WSCL)的框架,将弱监督学习网络和强监督学习网络连接成为一个整体网络,通过一致性损失(consistency loss)约束强监督和弱监督学习网络具有相似的预测结果,通过强监督和弱监督学习网络间部分特征共享保证两个网络在感知水平上的一致性,从而实现强监督和弱监督学习网络的协同增强学习

Introduction

弱监督协同学习框架结构如下图所示:

论文阅读笔记 | (IJCAI 2018 Oral) Collaborative Learning for Weakly Supervised Object Detection_第1张图片

Weakly Supervised Collaborative Detection

基于上述弱监督协同学习框架,论文设计了一个 端到端的弱监督协同检测网络(WSCDN) ,弱监督和强监督的检测模块分别采用了目前最优秀 WSDDN Faster- RCNN 网络结构。其网络结构如下图所示。
论文阅读笔记 | (IJCAI 2018 Oral) Collaborative Learning for Weakly Supervised Object Detection_第2张图片
在每次学习迭代中,整个目标检测网络 只将图像级标签(image-level labels)作为弱监督 ,并且 通过预测一致性损失并行优化强监督和弱监督检测网络

Experimental Results

下图是WSCDN训练时,强监督和弱监督检测网络准确率的变化曲线。

论文阅读笔记 | (IJCAI 2018 Oral) Collaborative Learning for Weakly Supervised Object Detection_第3张图片

可以看出,在训练的初始阶段,弱监督检测网络准确率高于强监督检测网络。随着协同训练轮次的增多,两者的准确率均逐渐上升,但强监督检测网络提升的速度更快,并很快超越弱监督检测网络。在整个训练过程中,两类检测网络相互协同,达到了共同提高的效果。

我们比较了弱监督协同检测网络与其他相关弱监督检测方法在PASCAL VOC 2007测试图片上的效果(见下图)。其中,IW是单独训练得到的弱监督检测模型,CSS是分开迭代训练得到的强监督检测模型,CLWCLS分别是通过弱监督协同检测网络得到的强监督和弱监督检测网络。可以看出,我们的强监督检测网络明显优于其他检测器网络,表现在可以得到更全面和更紧凑的包围框预测。


你可能感兴趣的:(深度学习,计算机视觉)