论文阅读: R-FCN-3000

Introduction

R-FCN-3000的定位是 large-scale detector

large-scale detector 核心技术 精度 意义
YOLO-9000 语法树 较差 第一个large-scale detector
R-FCN-3000 解耦“定位”和“分类” 较好 第一个可实用的large-scale detector

分类

采用了YOLO-9000中的分类思想:

大类得分 × 细类得分 = 最终分类得分

定位回归

将“定位”和“分类”解耦,避免了R-FCN中对每个类都进行一次bbox回归:
论文阅读: R-FCN-3000_第1张图片

设计了双pipeline结构如下:
论文阅读: R-FCN-3000_第2张图片

Innovation

经过一系列实验,发现:

  • “按类进行回归”是没有必要的,去掉之后甚至可以获得一个更合理的object得分;
  • 因为很多object类之间的外观高度相似,共享“定位卷积计算”是可行的。

Result

R-FCN-3000效果图如下:
论文阅读: R-FCN-3000_第3张图片

Thinking

这篇文章我只是略读。觉得作者洞察得很仔细,设计的网络结构也较简单,而且最终的检测精度和检测速度都不错。


[1] R-FCN-3000 at 30fps: Decoupling Detection and Classification

你可能感兴趣的:(论文阅读,论文算法)