极简笔记 DeepLabv3+

【极简笔记】Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

文章核心:1. 提出DeepLabv3+,采用encoder-decoder结构(其实就是语义分割常用的下采样再上采样);2. 该网络通过带孔卷积可以任意控制encoder feature的resolution,有较好的尺度适应性;3. 采用modified Xception主干网络,并在ASPP(带孔卷积模块)和decoder模块采用depthwise separable convolution;

总之一句话,之前各种文章创新点的堆叠,加上大量的结构调参。
极简笔记 DeepLabv3+_第1张图片

encoder-decoder和带孔卷积就不讲了,重点在它怎么合并 。如图在decoder部分,它是双线性上采样x4之后,和浅层通过1x1conv,拥有相同spatial resolution的feature map concatenate,之后再过一个3x3 conv,算是一次stage,这样多来几次回到原图大小。

在Xception的修改上,1. 更多的层;2. max pooling部分用stride=2的depthwise卷积替换;3. 每次depthwise 3x3卷积之后都加上了BN和ReLU。
极简笔记 DeepLabv3+_第2张图片
极简笔记 DeepLabv3+_第3张图片

你可能感兴趣的:(极简笔记)