RCNN、Fast-RCNN Faster-RCNN大致区别总结

RCNN大致步骤:先提取proposal,然后将proposal输入CNN提取特征,使用SVM分类,最后做bbox reg。 

RCNN、Fast-RCNN Faster-RCNN大致区别总结_第1张图片

 

缺点:速度。提取proposal的时候计算机进行大量重复计算 

 

 

Fast改进:ROI pooling 

RCNN、Fast-RCNN Faster-RCNN大致区别总结_第2张图片

 

在fast中,作者将输入变为一整张图片,通过ROI再进行特征选择。 

并且将bbox reg和区域分类都加入网络变成了multi-task 

 

Fast将RCNN每一个框都要单独进CNN入这一大缺点改进,提升了速度。 

 

 

尽管fast极大地提高了速度,但是筛选特征框还是需要花费大量的时间,那么有没有办法进一步提高选择 框 的速度? 

使用 RPN(之前都是使用特定的算法选择) 

RCNN、Fast-RCNN Faster-RCNN大致区别总结_第3张图片

 

关于RPN: 

 在CNN提取的feature map上滑动窗口 

 提出两个class, reg损失函数 

 滑动窗口(sliding window) 提供了目标的大致位置 

 Reg回归进一步确定了目标的精确位置 

RCNN、Fast-RCNN Faster-RCNN大致区别总结_第4张图片

 

 

一种网络 提供四个损失: 

 RPN classification(确定选择anchor的好坏 1或0) 

 RPN localation (选择框proposal的位置 image->proposal) 

 Fast RCNN classification(所有类别分类) 

 Fast RCNN localation(对于proposal上的box的位置  proposal->box) 

 

RCNN、Fast-RCNN Faster-RCNN大致区别总结_第5张图片

 

你可能感兴趣的:(Computer,Vision,DeepLearning)