SPP-Net

  • title:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
  • official code -caffe:https://github.com/ShaoqingRen/SPP_net
  • unofficial code -keras:https://github.com/yhenon/keras-spp
  • unofficial code - tensorflow:https://github.com/peace195/sppnet

1、整体思路

  •  在图像中确定1000-2000个候选框(使用选择性搜索)
  • 将整个图像输入CNN进行特征提取得到特征图
  • 确定候选框对应的特征区域
  • 将不同尺寸的的特征区域输入到SSP(Spatial Pyramid Pooling)获得固定长度的特征向量
  • 对特征向量分类和回归

2、具体步骤

SPP-Net_第1张图片

3、 创新点

  • 对整张图像只进行一次特征提取,可以避免RCNN中的重复计算,加快速度
  • 利用空间金字塔赤化结构,可以避免RCNN对原始图像的crop和wrap(测试图像)

4、不足

  • 同RCNN训练经过多个阶段,特征要存于磁盘
  • 微调只更新SPP层会面的全连接层,对前面的卷积层不做更新

5、参考文章

  • https://blog.csdn.net/qq_35451572/article/details/80273222
  • https://blog.csdn.net/programmingfool5/article/details/82667581
  • https://blog.csdn.net/v1_vivian/article/details/73275259
  • https://blog.csdn.net/u012197749/article/details/79748659
  • https://blog.csdn.net/qq_29133371/article/details/52241526

7、加入我们

SPP-Net_第2张图片

你可能感兴趣的:(计算机视觉与图像识别,搭上《机器智能》的末班车,I,Can)