SPP-Net的浅解

SPP-Net 是针对R-CNN的缺点,做出了改进。想要了解RCNN可以转到上一篇文章RCNN浅解

SPP-Net是何开明大神于2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》
下面看看SPP-Net做了哪些改进的地方。
SPP-Net的浅解_第1张图片
SPP-Net改进点:

  1. 只做一次卷积
  2. 提出了“Spatial Pyramid Pooling”(空间金字塔池化)

在SPP-Net中,图像通过一次卷积之后,得到的特征图是任意大小,不能直接送到全连接层,这时候SPP层起作用了。Spatial Pyramid Pooling Layer 类似于ROI Pooling层,SPP是把不同大小的特征图拼接在一起形成一个新的特征,并保证这个特征大小是一致的,然后送到全连接层进行分类和边界框的回归定位。

SPP-Net的不足:

  1. 虽然解决了R-CNN大量冗余的计算问题,但还是继续沿用了R-CNN的训练结构,也训练了SVM分类器, 也单独进行Bbox regression。
  2. SPP-Net 很难通过fine-tuning对SPP-layer之前的网络进行参数微调,这样一来,效率会变得很低,是由于 SPP做fine-tuning时输入是多个不同的图片,这样对于每一个图片都要重新产出新的feature map,效率很低,而Fast-RCNN对其进行了改进。

Reference:
https://cloud.tencent.com/developer/news/281788
https://www.cnblogs.com/kk17/p/9748378.html#%E4%B8%80%E6%AC%A1%E6%80%A7full-image%E5%8D%B7%E7%A7%AF

你可能感兴趣的:(目标检测,深度学习)