FCN的跳层结构

首先为什么要做跳层呢?

我们看到5个卷积层之前已经有了32倍的降采样,而后面的6、7卷积层也是32倍的降采样,然后降采样之后直接通过双线性插值生成32倍,这个直接拿来做优化是有问题的,这样的话就需要引入前面几个卷积层来做辅助,用以保证空间位置上的精确度,边缘区域分割的精确性。

通过实验发现使用最后输出的前两个卷积层是有用的再往前语义特性就很低了,所以只做两个跳跃层。

从图中也可以看到他从第三个和第四个池化层分别拿出直连,直连后再做一个1x1的卷积推断,卷积推断的输出就是21,然后通过1x1的卷积层把通道数量降到20层,其实就是做了一个语义推断了。所以这里增加一个1x1的卷积层做预测,在第三和第四池化层直接拿出预测结果。

然后还有一个结论就是较浅层的网络结果更精细,也就是位置信息更精确,较深层的更鲁棒,也就是说位置信息不行,但是语义推断结果精确,因此在这里使用跳层结构来做一个融合。

FCN的跳层结构_第1张图片

你可能感兴趣的:(人工智能,深度学习,计算机视觉)