Mask R-CNN

实例分割 vs. 语义分割

语义分割:将不同种类别物体分割,同一类物体用一种颜色表示。
实力分割:在语义分割的基础上对同类物体进一步细分。分为person1,person2,person3…

Mask R-CNN思路

在原始Faster-rcnn算法的基础上面增加了FCN(全连接卷积神经网络)来产生对应的MASK分支。即Faster-rcnn + FCN,前者负责物体检测(分类标签+窗口),后者负责确定目标轮廓,更细致的是 RPN + ROIAlign + Fast-rcnn + FCN。Mask R-CNN的一个特点是可以给窗口内表示对象轮廓的像素着色,不仅仅是提供目标位置,而是提供掩模(轮廓),COCO数据集标注出了轮廓,非常适合掩摸。
FCN算法是经典的语义分割算法,是一个端到端的网络,主要包含卷积和去卷积,首先对图像进行卷积和池化,使得feature map大小减小,再进行转置卷积(插值操作,将卷积的输出还原为输入大小),不断增大feature map 最后对每一个像素值分类。
(原文:https://blog.csdn.net/WZZ18191171661/article/details/79453780 )
Mask R-CNN_第1张图片
Mask R-CNN结构图
Mask R-CNN_第2张图片
FCN(全连接卷积神经网络)结构图
掩码分支是一个卷积网络,取 ROI 分类器选择的正区域为输入,并生成它们的掩码。其生成的掩码是低分辨率的:28x28 像素。

你可能感兴趣的:(Mask R-CNN)