SegNet-论文笔记-理解

论文:SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust
Semantic Pixel-Wise Labelling

翻译:http://blog.csdn.net/u014451076/article/details/70741629

理解参考:http://blog.csdn.net/fate_fjh/article/details/53467948

Demo:http://mi.eng.cam.ac.uk/projects/segnet/

核心技术:
总体结构:
SegNet-论文笔记-理解_第1张图片
感觉其实和FCN思路十分相似,只是Encoder,Decoder(Upsampling)使用的技术不一致.此外SegNet的编码器部分使用的是VGG16的前13层卷积网络,每个编码器层都对应一个解码器层,最终解码器的输出被送入soft-max分类器以独立的为每个像素产生类概率.
每个编码器由数个蓝色层(卷积层,批归一化层,RELU层)以及一个Pooling层(2x2窗口,步进2,最大池化)组成,输出相当于系数为2的下采样.由于最大池化和子采样的叠加,导致边界细节损失增大,因此必须在编码特征图中在sub-sampling之前捕获和储存边界信息.为了高效,文中只储存了max-pooling indices.

突出贡献:
分割的精度略好于FCN,总体效率也比FCN略高,

你可能感兴趣的:(机器学习,论文阅读)