目标检测——特征金字塔网络

本次继续介绍一篇有关目标检测的论文 《Feature Pyramid Networks for Object Detection》,作者包含Piotr Dollar, Ross Girshick,何凯明等大神,阵容很好很强大。

特征金字塔在基于深度学习的多尺度目标检测中早有应用,通常有以下几种使用方式。

(1)网络是一个简单的全卷积网络,为了检测不同尺度的目标,依次将原图按比例缩放并送入网络。缺点是需要多次resize图像,繁琐耗时。

目标检测——特征金字塔网络_第1张图片


(2) 网络是一个高深的全卷积网络,输入任意尺寸的原图,得到一个feature map,在feature map上进行多个尺度的目标位置回归。 R-CNN系列就是这种方法。缺点是容易漏掉小目标,同时搞定多个尺度难度较大。

目标检测——特征金字塔网络_第2张图片


(3) 对(2)进行改进,在不同分辨率的feature map上进行目标位置预测。缺点是底部的feature map的特征表达能力不足。

目标检测——特征金字塔网络_第3张图片


(4)本文的方法: 有点类似(2)和(3)的组合,既可以在不同分辨率的feature map上检测对应尺度的目标,同时feature map又具有足够的特征表达能力。这是因为每层的feature map来源于当前层和更高级层的特征融合。

目标检测——特征金字塔网络_第4张图片

具体的融合方法如下图所示,每一级的feature map尺寸都是2倍的关系,“2x up”采用的是最简单的最近邻上采样.

目标检测——特征金字塔网络_第5张图片

你可能感兴趣的:(人脸检测(目标检测))