图像分割--SegNet

理解参考:https://blog.csdn.net/tuzixini/article/details/78760158

编码-译码架构

主要贡献:

  • 将池化层结果应用到译码过程

说明:

引入了更多的编码信息。使用的是pooling indices而不是直接复制特征。


SegNet结构:

图像分割--SegNet_第1张图片

图像分割--SegNet_第2张图片

这样的对称结构有种自编码器的感觉在里面,先编码再解码。这样的结构主要使用了反卷积和上池化。即: 
                                     这里写图片描述 

                                   这里写图片描述

SegNet和FCN最大的不同就在于decoder的upsampling方法,上图结构中,注意,前面encoder每一个pooling层都把pooling indices保存,并且传递到后面对称的upsampling层. 进行upsampling的过程具体如下:

                                    图像分割--SegNet_第3张图片

左边是SegNet的upsampling过程,就是把feature map的值 abcd, 通过之前保存的max-pooling的坐标映射到新的feature map中,其他的位置置零.

右边是FCN的upsampling过程,就是把feature map, abcd进行一个反卷积,得到的新的feature map和之前对应的encoder feature map 相加.

SegNet的分割精度略好于FCN


你可能感兴趣的:(图像分割--SegNet)