RCNN系列(1)--RCNN

1. 简介

2014 年加州大学伯克利分校的 Ross B. Girshick 提出 R-CNN 算法,其算法结构也成为后续 two stage 的经典结构。

2. 基本概念

2.1 Iou
RCNN系列(1)--RCNN_第1张图片
Iou表示为A区域,B区域间交集面积和并集面积的比例。

2.SelectiveSearch(选择性搜索)
不使用暴力方法,而是用候选区域方法(region proposal method)创建目标检测的感兴趣区域(ROI)。在选择性搜索(selective search,SS)中,我们可以先利用基于图的图像分割的方法得到小尺度的区域,然后一次次合并得到大的尺寸。考虑所有特征,例如颜色、纹理、大小等,同时照顾下计算复杂度。
RCNN系列(1)--RCNN_第2张图片

**3.Bouding Box Regression(边框回归)**边框
边框回归不是直接对边框的长宽和坐标点操作,而是对它的变化量操作,减小了误差。代码加详解

3. 网络结构

五个卷积层,两个全卷积,再加一个SVM做分类器。
RCNN系列(1)--RCNN_第3张图片

4.不足

1)多个候选区域对应的图像需要预先提取,占用较大的磁盘空间;
2)针对传统CNN需要固定尺寸的输入图像,crop/warp(归一化)产生物体截断或拉伸,会导致输入CNN的信息丢失;
3 每一个ProposalRegion都需要进入CNN网络计算,上千个Region存在大量的范围重叠,重复的特征提取带来巨大的计算浪费。

5.推荐

较为完善的比较了RCNN, Fast-RCNN, Faster-RCNN间的差异

你可能感兴趣的:(RCNN系列)