DeepLab-LargeFOV--学习笔记

  1. 所谓DeepLab-LargeFOV就是DeepLab v1
  2. 提出背景:在DCNN进行分割任务时,有两个瓶颈:
    1. 下采样所导致的信息丢失,通过带孔卷积的方法解决;(此处说的带孔卷积指的是膨胀卷积,可参考膨胀卷积学习笔记_Wsyoneself的博客-CSDN博客_膨胀卷积作用
    2. 空间不变性所导致的边缘不够准确,通过全连接的CRF解决。(CRF是可以通过底层特征进行分割的一个方法)
    3. 分类任务具有空间不变性,图像的仿射变换不会影响最后的分类结果,而且恰恰通过仿射变换等操作(数据增广)可以增加数据量,提高模型的精度;但是像分割和检测这类问题,不具有空间不变性。应该需要的是空间等变性。
  3. 创新点:
    1. 将深度神经网络DCNN与全连接CRF结合起来,提高图像分割的分割精度。
      1. 提出全连接的CRFs算法,来后处理分割结果,以得到更加精细的边缘细节.这里CRFs的提升比较明显.但这样会使得模型比较冗赘,不能够end-2-end地训练和推理,在deeplabv3之后就取消了CRFs,并且效果还更好(所以暂时先不学习这个CRFs了).
      2. 一般利用条件随机场(CRFs)来处理分割中不光滑问题,它只考虑到目标像素点的附近点,是一个短距离的CRFs。
    2. 提出空洞卷积的思想。更加稠密的feature maps,意味着更多的计算量,使用空洞卷积核,一方面可以使小卷积核获得大卷积核的大感受野,另一方面,小卷积核计算更高效。
    3. 应用尝试了多尺度、多层次的信息融合。当下有多数先进方法是在多尺度卷积特征的整合上进一步处理的,所以此模型也是采用多尺度卷积特征整合方法
  4. 网络搭建:DeepLab v1 模型是在VGG的基础上改造而成。
    1. 把全连接层(fc6、fc7、fc8)改成卷积层。
    2. 把最后两个池化层(pool4、pool5)的步长2改成1(下采样32倍变为8倍,保证feature的分辨率)
    3. 把最后三个卷积层(conv5_1、conv5_2、conv5_3)的dilate rate设置为2,且第一个全连接层的dilate rate设置为4(保持感受野)
    4. 把最后一个全连接层fc8的通道数从1000改为21(Pascal VOC数据集分类数为21)

你可能感兴趣的:(cv,计算机视觉,深度学习,人工智能)