Mask R-CNN中的mask分支理解

这里介绍Mask R-CNN的mask分支,mask rcnn的idea很简单,就是在faster rcnn的基础上加个mask分支(另外把ROI pooling转化成ROIAlign),所以只要理解了mask分支,大概就能理解mask rcnn了。

1. 结构:

Mask R-CNN中的mask分支理解_第1张图片

mask分支处理ROI得到固定尺寸的14*14*80的feature map,需要注意的是target不一定都是14*14的,阅读源码之后发现对target做了resize:

Mask R-CNN中的mask分支理解_第2张图片

2. Loss

Mask R-CNN中的mask分支理解_第3张图片

针对每个类别,做独热编码,做binary cross-entropy loss

3. Training

Mask R-CNN中的mask分支理解_第4张图片

前面提到的送进mask分支的ROI其实是只有正样本的ROI才被送进去

4. Inference

Mask R-CNN中的mask分支理解_第5张图片

Inference的时候并不是对target做resize,而是对mask 分支的output做resize

你可能感兴趣的:(目标检测)