Region-based CNN(简称R-CNN)

目前最先进的detection方法应该是Region-based CNN(简称R-CNN)【1】,是由Jeff Donahue和Ross Girshick提出的。R-CNN的具体想法是,将detection分为寻找object和识别object两个过程。在第一步寻找object,可以利用很多region detection算法,譬如selective search,CPMC,objectness等,利用很多底层特征,譬如图像中的色块,图像中的边界信息。第二步识别object,就可以利用“CNN+SVM”来做分类识别。

Region-based CNN(简称R-CNN)_第1张图片

图31. Image detection系统框图

  • 给定一张图片,利用selective search方法来产生2000个候选窗口。
  • 然后利用CNN进行对每一个候选窗口提取特征(取全连接层的倒数第一层),特征长度为4096。
  • 最后用SVM分类器对这些特征进行分类(每一个目标类别一个SVM分类器),SVM的分类器的参数个数为:4096*N,其中N为目标的类别个数,所以比较容易扩展目标类别数。
这里有R-CNN的实现,请点击  rcnn code


  1. Ross Girshick et. Rich feature hierarchies for accurate object detection and semantic segmentation

你可能感兴趣的:(cnn,卷积神经网络,R-CNN)