《Fully Convolutional Networks for Semantic Segmentation》阅读笔记

    最近看完了论文《Fully Convolutional Networks for Semantic Segmentation》。还是花了不少时间的,第一次接触FCN,有很多知识点还没用完全理解。想趁热打铁,先自己梳理一下整篇论文。

    在我看来,整篇论文的亮点有如下几条:

    1、提出了完整的FCN定义,并且举了具体例子阐述如何将传统表现较为优异的分类器,转化成一个FCN。这种转化使得任意大小的图像都可以作为输入图像(???),而网络的输出也不再是一维的了,可以输出spatial output maps。

    2、在模型的具体优化方法上,论文也提出了几个可以代替传统技巧的方案:用filter dilation代替shift-and-stitch来获得dense prediction,用convolution代替upsampling来连接粗糙的输出和紧密的图像, 用loss sampling代替patchwise training来平衡数据类别分布和处理spatial correlation。

    3、提出了一种skip结构,通过scale(放大)和crop(剪裁)的方法,来连接what和where之间的关系。

    由于自己的积累还不到家,有很多细节其实并没有完全弄通。不过这也急不来,等我再积累积累,再回头来看这篇论文吧。

你可能感兴趣的:(《Fully Convolutional Networks for Semantic Segmentation》阅读笔记)