U-Net网络结构讲解(语义分割)

论文:https://arxiv.org/abs/1505.04597
2015年发表 生物医学影像领域提出的
U-Net网络结构讲解(语义分割)_第1张图片
每一个长矩形代表一个特征层,箭头代表操作。
左侧以572572的单通道图像为例,进行卷积和激活,stride=1,无填充。通过卷积之后高和宽都减少,没有使用到BN模块。接下来通过一个下采样也就是max pooling,stride=2。注意每次下采样再通过卷积层channel都会进行翻倍。
上采样采用了转置卷积(反卷积),经过上采样之后会将特征层的宽高放大两倍,channel会减半。将与之同级的特征层进行裁剪,和本特征层进行拼接。再卷积。再上采样。。。最后通过1
1卷积,没有激活函数。
现在主流的实现方式:将对应的卷积层加上padding,不会改变特征层的高和宽。并且卷积和ReLU之间加上BN,输出的高和宽和输入的一致。不用考虑边缘缺失数据的情况。
注:ground-truth参考标准

你可能感兴趣的:(深度学习,计算机视觉,神经网络)