阅读小结:A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

arXiv: https://arxiv.org/pdf/1704.03414.pdf


What:

1. 目标是去增强  检测器对于遮挡和形变 的泛化能力 

2. 但是数据集中 遮挡和形变 的图像一般较少  

3. 所以作者提出了 adversary的方法去增加 训练难度

4. 整个网络是 基于 Fast-RCNN 而不是 Faster-RCNN


阅读小结:A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection_第1张图片

How:

1. 先pretrain Fast-RCNN网络

2. 通过sliding window (如果feature map的大小是6*6,这个window大小是2*2)找到遮住哪部分对网络影响最大,用这个使loss最大的mask来pretrain adverse的部分网络(ASDN)

3. pretrain ASDN使用的loss 是 mask上每个像素做二分类cross entropy loss(其实这里也可以直接regression吧?)

4. pretrain完了以后,实际在训练的时候,ASDN输出的不是二值,而是一个0~1之间的概率。所以可以设置一个阈值,来确定最后到底要dropout哪些。作者实际上是先找到top50% predict出来要dropout的点,然后在这50%的位置里再随机选一些点来drop。实际就是drop了 1/3的位置。

5. 现在都pretrain完了~可以连起来训练了 

6. 另外,4中使用了随机采样,是不可导的。所以作者说可以用rl的方法来处理这部分的回传bp,但没细说。

7. 类似的我们除了可以用dropout 来模拟遮挡,也可以用 stn来模拟 物体的旋转 形变。

8. STN这部分限制了旋转角度为 -10度到10度

9. A-dropout 和 A-stn可以串行

你可能感兴趣的:(论文阅读)