Cascade R-CNN: Delving into High Quality Object Detection论文笔记

文章目录

    • 1. Motivation
      • 1.1 问题:
      • 1.2 实验:
    • 2. 其他的级联结构比较
    • 3. Experiment
      • 3.1 Quality Mismatch
      • 3.2 Number of Stages
    • Conclusion:

Attention:

论文解读的博客原文发布于个人github论文合集 欢迎关注,有想法欢迎一起讨论!私信评论均可。

后面有些语法在CSDN的markdown上不支持,导致显示bug,我就懒得改了,有需求直接访问原博客查看。

创建人 github论文汇总 个人博客 知乎论文专栏
ming71 paperdaily chaser 专栏

1. Motivation

1.1 问题:

  从IoU处找到样本划分的矛盾,并指出症结所在以解决问题:通常使用的IoU作为正负样本的划分依据,一般性地设置u=0.5,问题在于:
(1)IoU阈值设置过低,背景太多了,不容易学习到准确的特征,容易出现较多的误检
(2)IoU阈值设置过高,正样本被大量筛掉了导致过少,容易过拟合;
  而且训练采取的IoU和检测最优的IoU可能不一致,这会导致mismatch(下面实验分析这种情况)

1.2 实验:

Cascade R-CNN: Delving into High Quality Object Detection论文笔记_第1张图片

实验分析:
  (c)横轴是proposal与gt的IoU,纵轴是回归后输出的bbox与gt的IoU,显然希望纵轴越大越好。分析得出结论:a.所有的IoU都比baseline好,说明输出的回归结果IoU都比输入高,选择IoU阈值筛选proposal再回归有意义 b.在选取阈值附近IoU的proposal表现性能最佳.(如u=0.5时,会筛掉小于0.5IoU的proposals,发现与gt IoU在0.5附近的proposal经过回归的效果甚至比那些具有更高IoU的proposal更好,其他阈值也是对应各自的区间,mismatch现象说明proposal与gt的IoU与选择阈值对应性能最好,而不是越高越好)
proposal IoU分布的mismatch问题是这篇paper的Insight
  (d)右图曲线中u=0.7反而在0.5以下,说明一味设置高的IoU效果未必好,原因可能是高的IoU筛掉了过多的正样本,导致过拟合。

2. 其他的级联结构比较

  另外两个的结构可以说真的是一塌糊涂没什么创新和可比性,作者的这个cascade结构其实也很容易想到,只是他新颖地发现了IoU的mismatch问题,在不同stage设置不同的IoU进一步提升性能,非常独特的insight,基于观察的结果。

Cascade R-CNN: Delving into High Quality Object Detection论文笔记_第2张图片
  • Iterative BBox at inference
      采取容易想到的级联方式,问题在于:1.不同stage的IoU阈值相同,没有解决mismatch问题 2.每个stage共用一个head,没有考虑到前一个stage输出时已经改变了输出的proposal分布
  • Integral Loss
      考虑了IoU不同的矛盾,所以采取多IoU设计,但是是在一个proposal stage完成的,矛盾还是存在
  • Cascade R-CNN
    Cascade R-CNN: Delving into High Quality Object Detection论文笔记_第3张图片
      就很好理解了,RPN+3 stage(Iou=0.5 , 0.6 , 0.7)设计不同的IoU适应不同stage的proposal分布,取得更好的检测效果。同时上图proposal分布可以看出,在RPN送到stage 1的proposal IoU集中较低水平,越往后越高,因此设置递增的IoU阈值不会导致正样本减少的问题

3. Experiment

3.1 Quality Mismatch

Cascade R-CNN: Delving into High Quality Object Detection论文笔记_第4张图片

  左侧实线显示单检测器的效果而言IoU阈值越高效果反而越差,为了探究原因在proposal中加入gt提高proposal的高IoU分布情况,发现IoU较大的检测器提升更加明显(但是IoU不大提升不明显,应该是mismatch的原因,但是它也提升了,这是符合一开始的图片实验结果的:u=0.5-0.7情况下输入IoU在0.5-0.7区间都会提升的,太大就不一定了,比如输入Iou在0.7以上时,增长斜率小于1,说明开始劣化,可见加gt改分布也要结合设置的IoU进行match);虚线是用多阶段级联效果,自然是提升了。

3.2 Number of Stages

  经过实验发现三阶级联的效果最好,四阶会导致略微的性能退化,而计算成本反而上去了。


Conclusion:

  • 发现了IoU分布和阈值设定的mismatch现象:输入的proposal IoU分布需要与筛选的阈值相近才能获得较好的回归输出效果(过高会导致过拟合正样本少;过低容易误检)
  • 设计多级级联检测器,用不同的IoU递进优化检测性能。不同IoU能够很好match输出的proposal的IoU分布


你可能感兴趣的:(papers)