8月31日目标检测学习笔记——Faster RCNN

文章目录

  • 前言
  • 一、Faster-RCNN
    • 1、原理
    • 2、步骤
    • 3、RoI Pooling
    • 4、网络结构
  • 二、SPPNet(Spatial Pyramid Pooling)
  • 三、Fast-RCNN
  • 四、HyperNet
  • 五、RFCN
  • 六、Light-Head RCNN
  • 七、Cascade RCNN


前言

本文为8月31日目标检测学习笔记,分为七个章节:

  • Faster-RCNN;
  • SPPNet(Spatial Pyramid Pooling);
  • Fast-RCNN;
  • HyperNet;
  • RFCN;
  • Light-Head RCNN;
  • Cascade RCNN。

一、Faster-RCNN

1、原理

8月31日目标检测学习笔记——Faster RCNN_第1张图片

2、步骤

  1. 训练分类网络(AlexNet);

  2. Fine-tuning:

    • 类别 1000 改为 20;
    • 去掉 FC 层。
  3. 特征提取:

    • 提取候选框;
  4. 训练 SVM 分类器,每个类别对应一个 SVM;

  5. 回归器精修候选框位置,利用线性回归模型判定框的准确度。

3、RoI Pooling

将 proposal 抠出来,然后 resize 到统一的大小:

  1. 根据输入的 image,将 RoI 映射到 featrue map 对应的位置;
  2. 将映射后的区域划分为相同大小的 sections;
  3. 对每个 section 进行 max pooling。

4、网络结构

8月31日目标检测学习笔记——Faster RCNN_第2张图片

  • 主干网络:13con + 13relu + 4pooling;
  • RPN:3×3 + 背景前景区分 + 初步定位;
  • RoI Pooling;
  • 分类+位置精确定位。

二、SPPNet(Spatial Pyramid Pooling)

8月31日目标检测学习笔记——Faster RCNN_第3张图片

  • 空间金字塔池化:
    • CNN 不同尺度输入;
    • 仅对原图提取一次卷积特征。

三、Fast-RCNN

结合 SSPNet 改进 RCNN:

  • RoI Pooling:单层 SSPNet。

多任务网络同时解决分类和位置回归:

  • 共享卷积特征。

8月31日目标检测学习笔记——Faster RCNN_第4张图片


四、HyperNet

Faster-RCNN 变种。

8月31日目标检测学习笔记——Faster RCNN_第5张图片


五、RFCN

8月31日目标检测学习笔记——Faster RCNN_第6张图片

  • VGG16 ⇒ ResNet;
  • 通过 position sensitive score map 把目标的位置信息融合进 RoI pooling;
  • 耗时的卷积尽量移到前面共享的 subnetwork 上。

六、Light-Head RCNN

8月31日目标检测学习笔记——Faster RCNN_第7张图片

  • Thinner feature map:score map 维度 ⇒ 10×p×p = 490;
  • 将 k×k 的卷积 转化为 1×k 和 k×1;
  • 最后通过两个 fc 层实现分类和回归。

七、Cascade RCNN

8月31日目标检测学习笔记——Faster RCNN_第8张图片
只有 proposal 自身的阈值和训练器所用的阈值较为接近的时候,训练器的性能最好。


你可能感兴趣的:(目标检测,学习,深度学习)