Weakly Supervised Deep Detection Networks 学习笔记

                                                    Weakly  Supervised  Deep  Detection  Networks 详细解读

 论文大致意思是通过图像级的标注信息训练网络达到目标检测的目的,文中采用的方法如下图所示:

Weakly Supervised Deep Detection Networks 学习笔记_第1张图片

abstract :提出一种弱监督的深度检测架构,通过修改网络,只利用图像级别的标注,同时执行区域选择和分类。

Introduction:1.有实验证明训练过的用于分类的CNN可能隐藏了很多关于检测需要用到的信息

                    2.方法概述:a.给定图像x,第一步是通过在CNN的卷积层之上插入SPP来有效地提取区域级描述符(x;R)。

                                         b.接着,该网络从pooled region-level features中分支成两个数据流(一个用来分类,一个用来识别)

                    3.MIL利用外观模型(appearance model)去选择候选区域,而本文使用的是独立于识别分支的专用并行检测分支选择的候选区域 。所以能够很好的避免弱监督学习常用的方法MIL的缺点即局部最优

                    4.我们的双流CNN可能和lin等人的双线性架构有轻微的关联,他们提出了一种“双线性”结构,其中两个并行网络流的输出通过取相应空间位置的特征向量的外积进行组合。作者指出,这种结构的灵感来自于人类视觉系统的腹侧和背侧流,一个侧重于识别,另一个侧重于定位。虽然我们的架构包含两个这样的流,相似性只是表面的。一个关键的区别是在Lin等人。这两个流是完全对称的,因此没有理由相信一个流应该执行分类和另一个检测;相反,在我们的方案中,检测分支被明确地设计成比较区域,打破对称。还要注意,林等人不执行WSD,也不评估对象检测性能。

                    5.本文仅仅使用了image-level labels,region proposals 和 BP

Related Work:有关弱监督的研究分为两条路线,其一,针对MIL的非凸优化问题,有好几篇论文对初始化和正则化提出改进,其二基于识别图像部分之间的相似性的想法。最近有一批研究学者提出了弱监督定位原则,以改进CNN的分类性能(不提供图像中物体位置的任何标注)

Method

       1.预训练网络(采用只有图像级标注的数据集训练一个CNN)

       2.WSDDN:用SPP代替最后一个卷积块的pooling层,有关SPP介绍 ,SPP中SS详细介绍,以及候选区域R。我们根据fast rcnn将SPP改造成为其输入不是单个区域,而是一个区域的集合

【note】在接下来的分流开始之前先介绍softmax函数和交叉熵损失函数

softmax函数如下:

通常,对使用了 softmax 层的多分类神经网络,我们在最后一层使用的损失函数为交叉熵,它的形式如下

 

       3.分类数据流:使用的是softmax分类器,即计算每个区域中各个类别的概率

         

       4.检测数据流:还是使用softmax分类器,即计算每个类别中各个区域的概率

                           

      5.两个数据流的合并:采用内积的方式进行合并,进行标准非极大值抑制的方法(去除IOU>40%的区域)来获得最终的图像中的类特定检测的列表。与双线性结构的三点不同:其一利用不同的softmax分类器来打破两个流的对称性,其二,本文使用的是内积,而双线性结构使用的是外积,第三个不同之处在于,分数class(xcr)det(xdr)是针对特定图像区域r计算的,而不是针对网格上的一组固定的图像位置计算的。

    6.图像水平分类得分。  到目前为止,WSDDN已经计算了区域级分数x r

    7.有关损失函数:

    

     仔细观察发现这个函数是上面【note】部分的交叉熵损失函数的变体。

    8.空间惩罚项:由于我们没有groundtruth ,不能像fast rcnn 一样根据IOU 50%来选取排除定位框。因此我们遵循软规则化策略,该策略在训练期间惩罚最高得分区域和具有至少60%IoU的区域之间的特征图差异

    

实验部分(略)

你可能感兴趣的:(paper阅读)