目标检测“Feature Pyramid Networks for Object Detection”

为了在不同尺度检测物体,特征金字塔很重要。作者提出了一个具有横向连接的自上而下的结构,来构造每个尺度的高层语义特组图。这个结构成为特征金字塔网络(FPB)。

几种不同的检测结构对比,图(a)是使用图像金字塔构造特征金字塔,图(b)只使用一个尺度的特征进行快速检测,图(c)使用深度卷积结构的不同特征检测,图(d)是论文提出的具有自下而上,自上而下和横向连接结构的特征金字塔网络:
目标检测“Feature Pyramid Networks for Object Detection”_第1张图片

论文的目标是构造一个每层都具有强语义性的特征金字塔,它通过综合低分辨率、强语义性的信息和高分辨率、弱语义性的信息实现,即自上而下和横向链接的结构。这种自上而下的结构又有两种形式,如图2Top,使用最精细层来预测,而本文使用自上而下的每层来预测。
目标检测“Feature Pyramid Networks for Object Detection”_第2张图片

自上而下的结构:
通过对上层金字塔信息进行上采样,得到高分辨率的特征。特征之后使用横向链接与自下而上结构的特征进行综合,即简单的元素间相加。迭代该过程直至得到最精细层的特征,迭代之前,先对C5进行1*1的卷积生成粗糙特组图,最后一层特征进行3*3的卷积消除上采样产生的对齐影响。下图即自上而下结构的表示:
目标检测“Feature Pyramid Networks for Object Detection”_第3张图片

实验结果
目标检测“Feature Pyramid Networks for Object Detection”_第4张图片

你可能感兴趣的:(目标检测,深度学习)