CenterMask:Real-Time Anchor-Free Instance Segmentation

https://github.com/youngwanLEE/CenterMask

网络结构

实验效果

主要工作:

1、将Mask RCNN的检测分支替换为FCOS检测器
2、在分割分支中引入Spatial Attention Guidence
3、提出VoVnet的改进版——VoVNetv2:
增加shortcut变为residual block
将SE block中降低通道维度的FC层去掉,保持通道维度不变

具体改进:

Adaptive RoI Assignment Function

由于RoI来源于不同层级的特征图,一般的做法是参考FPN,将小尺度的RoI分配给高分辨率(低层)的特征图,将大尺度的RoI分配给低分辨率(高层)的特征图,分配算法为:


上式强依赖于ImageNet的预训练,固定为224的相对值,不适应尺度变化。更何况单阶段检测器与双阶段检测器也使用了不同的特征层级,因此将上式改为:

,限定最小值为3,最大值为5,分别代表输入图片和RoI的面积。自适应地根据RoI占原图的比例进行分配,有效改善小目标的AP。

Spatial Attention-Guided Mask

在mask分支中插入空间注意力模块,RoIalign提取分辨率为14x14的特征后,后接两个卷积层+一个空间注意力模块+两个卷积层,空间注意力模块首先按通道分别进行最大值和平均值池化,concat之后接3x3卷积,然后经过sigmoid函数与原输入相乘,类似于CBAM中空间注意力模块。

VoVNetv2

VoVNetv2的改进

增加残差连接
去掉SE中的第一个降低通道数的FC,只使用一层FC,称之为Efficient SE。


VoVNetv2实验结果
对比实验

你可能感兴趣的:(CenterMask:Real-Time Anchor-Free Instance Segmentation)