一种边缘梯度插值的双分支deeplabv3+语义分割模型

摘要: 针对deeplabv3+解码器采用双线性插值的单一分支结构易导致图像的高频分量损失、语义分割精度不高的问题,采用索伯(Sobel)算子计算各像素点沿不同方向的边缘梯度值并结合双三次插值算法,提出一种边缘梯度插值方法;在此基础上,对1/8输入图像与编码器输出采用边缘梯度2倍上插值再经特征融合和边缘梯度2倍上插值操作,并与1/4输入图像经特征融合后再进行边缘梯度4倍上插值操作,从而提出一种边缘梯度插值的双分支deeplabv3+意义分割模型。对比实验结果表明,本文方法在VOC2012数据集上较原分割模型平均交并比指标有2.2%的提升,且对图像边缘细节分割有较好的视觉效果。

  • 关键词: 
  • 边缘梯度  /  
  • 图像插值  /  
  • 双三次插值  /  
  • 双线性插值  /  
  • deeplabv3+  /  
  • 双分支结构  /  
  • 解码器  /  
  • 语义分割  

图像语义分割就是利用深度学习模型从像素级分割出图片中的不同对象并对每个像素进行类别标注,高准确率语义分割是自主移动机器人视觉理解的基础。目前deeplab[1-4]系列网络模型广泛应用于语义分割,最早的deeplab语义分割模型由文献[1]于2014年提出,它通过全连接条件随机场实现像素间的结构化预测,采用空洞卷积来保证所获取的感受野;文献[2]在deeplab语义分割模型的基础上,通过空间金字塔池化(spatial pyramid pooling, SPP)[5]方案提出一种空洞空间金字塔池化(atrous spatial pyr-amid pooling, ASPP)的deeplab语义分割模型——deeplabv2。ASPP能有效获取图像的多

你可能感兴趣的:(物联网及AI前沿技术专栏,计算机视觉,人工智能,深度学习)