PPN-Pooling Pyramid Network for Object Detection

PPN(用于目标检测的池化金字塔网络)是对SSD目标检测算法的改进,主要体现在减小模型规模、参数和计算量


【摘要】

我们提出一个类似SSD的目标检测算法,在保证模型精度的基础上减小了模型规模。对于不同尺度的特征图,我们使用共享的box predictor,并且对于不同尺度间的卷积操作,我们使用最大池化代替。相比于SSD,有两个优势:(1)避免了不同尺度间的分数校准错误(2)共享的box predictor可以看到所有尺度的训练数据。因为我们把多个box predictor减少至1个,并且在不同的层中共享,模型的规模显著减小。相比于SSD,我们同时也保证了精度。


SSD由于其运行速度和容易在 硬件上实现而流行。大多数的SSD算法采用多尺度预测,并且对于不同尺度的feature map,采取独立的predictor来预测类别得分和边框偏移量。

但是,对于multi scales的feature map,每一个feature map都采用独立的predictor,那么每一个predictor只能看见特定尺寸下的物体,各层之间没有联系。

下图左边是SSD的流程图,右边是PPN的流程图。可以看到改进主要体现在

  1. 对于feature map的降采样操作,本文采用max pooling来代替原有的卷积。
  2. 相比于原来的SSD中,不同feature map采用独立的conv来预测类别得分和边框偏移量,PPN采用一个共享的conv来得出bbox score和bbox location。

PPN-Pooling Pyramid Network for Object Detection_第1张图片

这样改进之后,有以下几个优势:

  1. 卷积采用最大池化替代,独立的predictor采用共享的predictor替代,有效减小了模型规模和参数,在保证精度的条件下提高了运行速度。
  2. 解决原来独立的predictor只能看到特定尺寸下的feature map里目标的问题,共享的predictor可以看到所有尺度下的目标的存在。

你可能感兴趣的:(目标检测,SSD)