FasterRCNN理解

RCNN系列的内容已经有非常多同学分享出来了,大多也非常详细。为了避免在长文中迷失方向,这里做个精简版的总结,记录个人的理解。主要是概括算法流程以及特点,方便回顾。先简单介绍下RCNN和Fast RCNN,在详细记录faster rcnn的RPN网络的理解。

RCNN:

  1. 流程
    (1). 采用传统方法Selective Search产生目标候选框
    (2). 对每个候选框,用深度卷积神经网络提取特征得到feature map
    (3). 每个框得到的feature map喂给SVM分类器,并通过线性回归调整bounding box的位置和大小,使得更接近 gt
  2. 缺点:
    (1)CNN网络参数不共享
    (2)采用SVM分类器,速度慢
    (3)产生后选框ROI的大小不一样,这样导致CNN输出与FC维度不统一
    FasterRCNN理解_第1张图片

总的来说,RCNN比较笨,比较慢,进而提出SPP-net。SPP-net用CNN一次性提取特征,并利用空间金字塔池化(spatial pyramid pooling)将大小不一致的proposal变成大小一样的

你可能感兴趣的:(深度学习)