DeepLab系列解读

DeepLab系列

Google团队提出的一系列图像分割算法,V1版本在2014年提出。并在VOC2012取得第二名的乘积,陆续推出了v2,v3和v3+ 版本。

DeepLabv1

创新点:

  • 使用空洞卷积(Atrous convolution)
  • 全连接条件随机场(fully connected CRF)

  空洞卷积是为了解决编码过程中信号不断被下采样,导致信息丢失的问题,由于卷积层提取到的特征具有平移不变性,这就限制了定位精度,所有v1版本就引入了全连接条件随机场来提高模型捕获局部结构信息的能力。通俗的来讲,将每一个像素作为条件随机场的一个节点,像素与像素的关系作为边,来构造基于全图的条件随机场。v1采用基于全图的条件随机场而非短程条件随机场,主要是为了避免使用短程条件随机场带来的平滑效果。正是如此,与其他先进模型相比,v1的预测结果拥有更好的边缘细节。
DeepLab系列解读_第1张图片

DeepLabv2

相较于v1,v2的不同之处是提出了ASPP,并将v1中的VGG网络换成了ResNet。ASPP结构可用于解决不同检测目标大小差异的问题:通过在给定的特征层上使用不同扩张率的空洞卷积,ASPP可以有效地进行重采样。
DeepLab系列解读_第2张图片

DeepLabv3 && DeepLabv3 +

v3是在ASPP部分做了进一步改动,加入BN层;其次将ASPP中尺寸 3* 3,空洞大小为24地卷积替换为一个普通的1*1卷积,以保存滤波器中间部分的有效权值。主要这么做的原因是,通过实验发现,随着膨胀率的增大,卷积核的有效权重减少的问题。v3在ASPP的最后增加了全局平均池化一遍更好的捕捉全图信息。此外V3去掉了CRF,通过将ResNet的Block4复制3次后级联在原有网络的最后一层来增加网络的深度。———————网络深度增加是为了捕获更高层的语义信息。
DeepLab系列解读_第3张图片

——————————————————————————————————
v3+在v3的基础上,增加了一个简单的解码器模块,用来修复物体边缘信息。同时v3+还将深度可分离卷积应用到ASPP中和解码器模块,以求得到更快,更强大的语义分割模型。

你可能感兴趣的:(深度学习,深度学习,计算机视觉,人工智能)