实例分割-二阶段模型-RCNN系列介绍

图像分割根据任务要求可以分为语义分割,实例分割等

图像分割根据模型架构可以分为一阶段模型,二阶段模型

在二阶段模型中,最常见的就是用于实例分割的R-CNN系列。

R-CNN的R意思是region based,与之对应的还有object based(这一类包括yolo,ssd,注意这一类一般是一阶段模型)

(什么是region based?在后面的博客中会慢慢理解这一点)

而R-CNN系列,并不是一开始就用于实例分割,下面对该系列的发展进行介绍:

2014:R-CNN 目标检测or语义分割

用于目标检测(VOC2010  mAP=54%),语义分割(VOC 2011 accuracy=47.9% )

  • 输入:图像
  • 输出:图像中每个物体的Bounding Box+标签

算法流程:

  1. 生成regions proposals集合作为Bounding Box;
  2. 采用预训练的AlexNet+SVM判断Bouding Box对应图像的物体类型;
  3. 对已分类物体的Bounding Box进行线性回归,输出Box对应的tighter bounding boxes。(进一步调整物体边界,使其更贴近物体周围)

2015:Fast R-CNN 目标检测

在RCNN基础上,引入ROI pooling

  • 输入:图像以及region proposals

你可能感兴趣的:(目标识别/语义分割,计算机视觉,目标检测,深度学习)