FCN与上采样

1、FCN详解

2、计算机视觉中upsampling(上采样)的三种方式

fcn中的上采样其实就是bilinear filtering,就是数字图像处理的二维插值。将特征图放大,然后用crop层剪去多余的部分,使其和ground truth有一样的尺寸以便计算各个像素的预测值。bilinear filtering可以用卷积的形式实现。和前面conv层不同,deconv中卷积核不是随机的,而是根据放大的尺寸生成了与类别相同数量的球形的矩阵,如果你学过插值就知道我说的是什么。作者在原文中说过deconv中的核可以保持不变或可被训练,但是我感觉差别不大

==实反卷积(Deconvolution)可能是一种错误的名字,通常应该被成为transposed conv.==卷积的过程,通常并不是直接进行矩阵的乘法在进行加法,而是对不同通道的矩阵进行重叠划分加序列化变成一个新的大的矩阵,之后对卷子核也进行类似变换,这样卷积的过程就变成了矩阵乘法的过程。对矩阵乘法结果进行解序列化,转化成多个矩阵。transposed cov的过程,其实就是执行类似操作,仅有的一步不同就是在于transposed,需要把卷积核进行转置(这也就是转置卷积名字的由来),进行矩阵运算即可。具体可参考caffe中源码im2col.cpp

3 、关于转置卷积

你可能感兴趣的:(DL)