深度学习与物体检测每日笔记(4)经典目标检测框架一

回顾:

  • 先前已介绍过目标检测分为两阶和一阶检测器,两阶检测器是先生成预选框再进行分类微调。一阶检测器是同时进行选框和分类。物体检测领域两阶检测出现较早,典型代表是RCNN系列。一阶检测器典型代表是SSD和YOLO系列,相比两阶检测,速度更快,但精度有所损失。
  • 本次将温习RCNN、SSD和YOLO系列框架发展和原理。文章仅会简单介绍大致原理,适合工程应用人员知其所以然。

RCNN:

RCNN全称Regions with CNN Features,具有良好的检测分类性能。

  1. 首先生成数千个候选区域,将每一个区域归一化成固定大小图像。
  2. 将相同大小区域进行CNN特征提取,再进行SVM分类。
  3. 每一分类寻找得分最高的目标框,计算其与其他目标的IoU值(第一章已介绍),大于设置的阈值则删除建议框继续向下选取。所有类别按此方法筛选。回归器校准筛选后的区域,对x,y方向进行缩放和平移。
  • 缺点:候选框重叠过多,提取特征操作冗余;区域归一化固定大小损失特征;时间、空间复杂度都不理想。

Fast RCNN:

FasterRCNN是RCNN的改进版。

  1. 候选框(区域)生成不变。
  2. 将整幅图进行CNN特征提取得到特征图,候选区域再在特征图上映射(ROI),再对每个映射候选区域进行最大池化后变为相同大小的特征图(即相比RCNN,归一化操作放在处理后的特征图中,不用再对每一个区域卷积,同时保留特征性能较好)。
  3. 映射区域归一化后进行全连接并softmax分类和bounding box 回归(微调窗口)。
  4. 缺点:仍然没有解决候选框过多问题(selective search候选框十分耗时),无法实时应用。

Faster RCNN:

(6条消息) RCNN系列总结:RCNN -> Fast RCNN -> Faster RCNN概述_Liu, Xu的博客-CSDN博客_rcnn

目标检测的四个步骤:候选区域生成 + 特征提取 + 分类器分类 + 回归器回归 ,FasterRCNN由两个模块组成RPN候选框提取模块+Fast RCNN检测模块。

  1. 输入图像经过CNN特征提取,通过RPN生成约300个 region proposals 送入ROI Pooling 层;
  2. Fast RCNN模块通过共享上述卷积层,特征提取后获得feature maps;
  3. softmax分类器分类;
  4. bounding box 回归器回归,进行位置调整;

 Faster RCNN最主要的特点是使用RPN生成候选框,RPN (Region Proposal Network) 是一个全卷积网络(即将CNN最后的全连接层换为全卷积层),在最后一层卷积的feature map上生成约 300 个 region proposals;

你可能感兴趣的:(深度学习,目标检测,人工智能)