目标检测:RCNN

参考:http://blog.csdn.net/hjimce/article/details/50187029
          http://blog.csdn.net/shenxiaolu1984/article/details/51036677

RCNN使用以下四步实现目标检测: 
a. 在图像中使用selective search确定约1000-2000个候选框 ,具体参考              http://blog.csdn.net/surgewong/article/details/39316931
b. 对于每个候选框内图像块,使用深度网络提取特征 
c. 对候选框中提取出的特征,使用SVM分类器判别是否属于一个特定类 
d. 对于属于某一特征的候选框,用回归器进一步调整其位置

使用RCNN有如下问题:

问题一:测试时速度慢 
RCNN一张图像内候选框之间大量重叠,提取特征操作冗余。 
本文将整张图像归一化后直接送入深度网络。在邻接时,才加入候选框信息,在末尾的少数几层处理每个候选框。

      问题二:训练时速度慢 

原因同上。 
在训练时,本文先将一张图像送入网络,紧接着送入从这幅图像上提取出的候选区域。这些候选区域的前几层特征不需要再重复计算。

问题三:训练所需空间大 
RCNN中独立的分类器和回归器需要大量特征作为训练样本。 
本文把类别判断和位置精调统一用深度网络实现,不再需要额外存储。

你可能感兴趣的:(目标检测)