【论文学习】目标检测 —— FCOS:CVPR 2019关于one-stage和anchor-free最新实用算法

Paper:FCOS: Fully Convolutional One-Stage Object Detection,CVPR 2019

URL: https://arxiv.org/pdf/1904.01355.pdf

Code is available at: tinyurl.com/FCOSv1 

【论文学习】目标检测 —— FCOS:CVPR 2019关于one-stage和anchor-free最新实用算法_第1张图片

这篇文章是单阶段的目标检测算法,基于anchor-free思想,效果非常好,达到41的mAP,比去年超厉害的RetinaNet高了1.9%。

paper核心idea:利用分割的思想做像素级别的目标检测,使用FPN解决overlap问题,用center-ness提升框的质量。

 

摘要

本文提出了一种全卷积one-stage目标检测算法(FCOS),以逐像素预测的方式解决目标检测问题,类似于语义分割。目前最流行的不论是one-stage目标检测算法,如RetinaNet,SSD,YOLOv3,还是two-stage目标检测算法,如Faster R-CNN。这两类算法大都依赖于预定义的锚框(anchor boxes)。相比之下,本文提出的目标检测算法FCOS不需要锚框。通过消除预定义的锚框,FCOS避免了与锚框相关的复杂计算,例如在训练期间计算重叠等,并且显著减少了训练内存。更重要的是,FCOS还避免了设定与锚框相关的所有超参数,这些参数通常对最终检测性能非常敏感。FCOS算法凭借唯一的后处理:非极大值抑制(NMS),实现了优于以前基于锚框的one-stage检测算法的效果。

背景

基于anchor检测有以下四大问题:

  1. 检测性能对anchor的数量及尺寸影响较大。调参占据影响大
  2. 即使anchor的尺寸预先经过定义,但是当处理变化较大的物体,尤其是小目标时会面临困难,比如要根据新的检测任务重新设计anchor的尺寸。
  3. 为了得到一个较高的召回率,基于anchor的检测器需要在输入图像上密集的设置anchors,其中大部分anchor被标记为negative,加剧了训练时正负样本之间的不平衡。
  4. 计算IoU时,大量的anchor box也会占用大量的计算及内存资源。

FCOS

做法如下图所示,每个spatial的位置会出四维,分别是到上下左右边界的距离

【论文学习】目标检测 —— FCOS:CVPR 2019关于one-stage和anchor-free最新实用算法_第2张图片

FCOS有以下几个优点:

  1. 以将目标检测与语义分割,等基于全卷积的任务进行结合,更加简单。
  2. 目标检测与anchor/proposal无关,大量减少了参数量,计算量及内存。
  3. FCOS也可以与RPN结合取得更好的结果。
  4. 通过对模型进行小幅度改造就可以应用到其他视觉任务,比如关键点检测。

网络框架

【论文学习】目标检测 —— FCOS:CVPR 2019关于one-stage和anchor-free最新实用算法_第3张图片

为了解决多尺度问题,引入了RPN思想。但是和直接RPN感觉还是有区别的,这个在每个stage的feature上检测,给不同的level的feature加不同的感受也,可以检测到不同尺寸的物体。

损失函数

使用了focal loss来做分类,使用了IOU loss来做回归

【论文学习】目标检测 —— FCOS:CVPR 2019关于one-stage和anchor-free最新实用算法_第4张图片

Center-ness

作者还有一个很涨点的地方,就是使用了Center-ness,简单而有效,用来干掉一些低质量的框,而且,没有超参数,很好做。计算方法如下所示:

                                                  【论文学习】目标检测 —— FCOS:CVPR 2019关于one-stage和anchor-free最新实用算法_第5张图片           

该策略之所以能够有效,主要是在训练的过程中我们会约束上述公式中的值,使得其接近于0,这就导致图1右图中的蓝色框中的短边能够向黄边靠近,使得分布在目标位置边缘的低质量框能够尽可能的靠近中心。这样的话,在最终使用该网络的过程中,非极大值抑制(NMS)就可以滤除这些低质量的边界框,提高检测性能。

实验结果

作者做的实验也很充分,直接看看和别的算法相比的效果吧

【论文学习】目标检测 —— FCOS:CVPR 2019关于one-stage和anchor-free最新实用算法_第6张图片

结束语

这篇paper总体上来说,加的东西都非常实用。而且,作者的代码也已经开源了,很适合实现使用。文章写得也很容易理解,非常值得推荐阅读!

 

 

你可能感兴趣的:(FCOS,深度学习,目标检测)