Focal Loss for Dense Object Detection(ICCV2017)论文简析

Abstract


目标检测中存在的问题:

速度和简易程度上:一阶段的detector>两阶段的detector

精准度上:一阶段的detector<两阶段的detector

这个问题产生的原因是:

在稠密的detector训练时,前景背景类间极度不平衡

所以呢

作者通过reshape交叉熵loss,给易分类的样本更小的权重,来解决这个问题。还提出了RetinaNet

1.Introduction


目前的两阶段detector已经达到较高的精度,为什么简单的单阶段detector不能又快,精度又高呢。这篇文章就通过解决单阶段detector里最大的障碍-——类间不平衡,提出新的loss,来达到又快,又能达到两阶段detector的精度的效果。

  • 类间不平衡在R-CNN这样的detector中,都是通过两阶段级联和启发式采样解决的。在第一阶段通过候选区域框的方法(选择性搜索算法,EdgeBoxes、DeepMask、RPN)快速减少候选区域框的个数;在第二阶段通过启发式采样的方法(如固定的前后景比例,OHEM)保持前后景平衡
  • 相比,单阶段detector不许处理很多候选区域框。通常大约100k个。如果用启发式采样,可能效果不会很好,可以通过bootstrapping或者hard example mining来改善。
  • 这篇文章提出Focal Loss:带权重因子的交叉熵loss
  • 这篇文字提出RetinaNet,基于特征金字塔和anchor-based

2.Related Work


  • 经典传统的目标检测方法:滑动窗口、VJDetector、Hog、DPMs
  • 两阶段detectors:和最早的选择性搜索算法差不多,现在的方法第一步生成一组稀疏的候选框,第二步分类。R-CNN,RPN
  • 单阶段detectors:OverFeat、SSD、YOLO
  • 类间不平衡:类间不平衡导致1训练效率低2》》》这里不会翻译,求助
  • 鲁棒的估计:已经有一些设计loss的工作,它们都是对于outliers(难分类的样本)小权重。而本文则是给inliers(易分类的样本)小权重。简而言之,focal loss在训练是更注重难样本

3.Focal Loss


 Focal Loss是基于交叉熵loss(Cross Entropy Loss)设计的,这里以二分类为例,先介绍CE:

CE=\left ( p,y \right )=CE\left(p_{t} \right )=-log(p_{t})

p_{t}=\left\{\begin{matrix} p,if y=1\\ 1-p,otherwise \end{matrix}\right.

Focal Loss for Dense Object Detection(ICCV2017)论文简析_第1张图片 

图中蓝色线,就是交叉熵loss,可以从曲线中观察到,当Pt较大也就是>=0.5的时候,仍然存在不小的loss。当在很大的易分类样本上求和时,这不小的Loss可能覆盖难分类的样本

3.1Balanced Cross Entropy

一个常见的方法解决类间不平衡是引入权重因子\alphain【0,1】对于Class1 ,1-\alpha对于class-1。\alpha可以是类频率的逆或者是一个超参数。公式如下:

CE(p_{t})=-\alpha _{t}log(p_{t})

 3.2Focal loss Definition

 

 

 

 

 

 

 

 

你可能感兴趣的:(论文阅读,目标检测)