论文摘要

Understanding Convolution for Semantic Segmentation:

论文摘要_第1张图片

大部分优秀的语义分割方法都不外乎在这三点:1)FCN,2)CRFs,3)Atrous convolution。

目前主流的方法关注于前两点,不断使用更深的FCN模型,应用各种形式的CRFs获得更好的效果。

我们关注于第三点,encoding和decoding的卷积操作,目前主流的方法在decoding过程都是使用双线性上采样到ouptut label map,双线性上采样并不可学习还会丢失细节信息。

我们提出dense upsampling convolution(DUC),在特征图上使用一组卷积层(w*h*(d2*L)),L为类别数,这样每一个w*h*L都可以预测label map 上一个W/d,H/d的区域,这组卷积层的所有可以预测整个label map。这样相当于把label map划分成几部分,对每部分分别使用一个卷积层的一个进行预测,这样避免了上采样的损失。

对于encoding部分,我们提出了一个hybrid dilation convolution(HDC),我们使用a range of dilation rates,然后使用Res-101中类似block的方法concat起来。

Learning to Segment Object Candidates(DeepMask)

 

一种输出 mask proposal 的方法。

第一个分支输出 class-agnostic segmentation mask,第二个分支输出目标在中心的概率。

测试阶段,对一个image输出多次得到一系列的segment mask(segment proposal),从中选择概率最高的mask

Learning to Refine Object Segments (SharpMask)

论文摘要_第2张图片
基于 deepmask 网络,增加了skip网络来获得更精确的结果。

你可能感兴趣的:(论文摘要)