SPP-net

文章目录

  • 前言
  • 使用spp的深度神经网络
    • 卷积层与特征图
    • SPP层
  • SPP层的训练
  • Q&A
  • 总结

前言

论文原文

传统的CNN网络要求固定尺寸的图像输入(比如224x224),使得数据集的图片为了适应特定尺寸,不得不剪切或扭曲。然而,剪切的图片不一定包含整个物体,扭曲的图片会导致位置错乱。最终导致识别准确率因内容缺失或错乱而只能妥协。
SPP-net_第1张图片

为什么传统CNN需要固定尺寸的图像输入?一个CNN通常由两部分组成:卷积层和全连接层。

  • 卷积层会以滑动窗口的方式进行操作,并输出特征图。实际上,卷积层不需要固定尺寸的图像输入,也能输出不同尺寸的特征图。
  • 全连接层需要有固定长度的输入。因此,固定尺寸的限制仅来自于全连接层,而它通常存在于神经网络较深的部分。

所以,本文提出了SPP层,它接在卷积层之后,全连接层之前。

你可能感兴趣的:(AI与ML,深度学习,cnn,计算机视觉)