FCN 和 U-net

FCN:全卷积网络,没有全链接层,全部用卷基层来代替。在通过若干次的上采样,将特征图扩大跟原图大小的若干张概率图,每张概率图表示这个像素属于该类别的概率值。
u-net 和 FCN 的思路基本上差不多。一个区别是 u-net没有用vgg等的CNN模型作为预训练模型,因为u-net做的是医学图像的二值分割,没必要用ImageNet的预训练模型,而且u-net这个结构我们是可以根据自己的数据集自由加深网络结构的,比如在处理具有更大的感受野的目标的时候;另一个区别是u-net在进行浅层特征融合的时候,采用的是叠加的做法,而不是FCN中的求和。
另外,u-net中有一个坑,那就是所有的卷积过程都是没有加pad的,这样就会导致每做一次卷积,特征的长宽就会减少两个像素,最后网络的输出和输入大小不一样。比如上图中,输入的图片大小是572x572,输出的概率图大小是388x388。

作者这么做的原因是为了数据增强,毕竟作者只用了30张原图做训练集。论文中介绍了一个叫overlap-tile的数据增强的方法。

你可能感兴趣的:(图像分割)