语义分割总结

目前看过的论文有FCN,U-net,还有几个经典网络没有看,看论文速度有待提高,赶紧还债,下面是我对几个语义分割网络的简单理解,后期会补充。另,建议关注一个类似知乎的国外精英网站:Qure) 
参考来源 :A 2017 Guide to Semantic Segmentation with Deep Learning 
在FCN网络在2104年提出后,越来越多的关于图像分割的深度学习网络被提出,相比传统方法,这些网络效果更好,运算速度更快,已经能成熟的运用在自然图像上。 
大致分为三部分:介绍语义分割问题,回顾语义分割方法,介绍一个有趣的网络算法。

1 什么是语义分割?

语义分割是在像素级别的水平上理解图像,为每个像素标记一个特定类别,比如下面一张图像

这里写图片描述 
这里写图片描述

除了识别摩托车和骑手,我们还要划定目标边界,因此不同于分类问题,我们需要像素密度预测。
两个比较常用的语义分割数据集为:VCO2012 和 MSCOCO

在使用深度网络之前传统的算法有TextonForest 和 Random Forest based classifiers。和分类问题一样,CNN在图像分割方面也获得了巨大成功。

其中最开始的一个算法是基于图像块的分类(patch classification(http://people.idsia.ch/~juergen/nips2012.pdf)) ,每个像素根据它所在的像素块被分类。使用像素块原因是分类网络通畅以整幅图像作为输入,所以我们以图像块代表一个像素进而得到像素类别。 
在2014年,Long等人提出全卷积网络(FCN),FCN是一个著名的CNN结构的像素密度预测网络,该网络的特点是没有全连接层,而是直接输出分割结果,这可以使网络输出任意大小的分割图,几乎所有以后算法都采用了这种范式。 
除了全连接网络,CNN的另一个问题是池化层。池化层增加了视野,能够在忽略“where”信息的情况下聚合上下文。然而,语义分割要求分类图精确校正,因此需要保存“where”信息。在论文中提出了两种不同的分类架构。 
第一种就是编码-解码结构。编码过程会通过池化操作逐渐降低空间尺度,而解码过程则会逐渐恢复目标细节和空间。在编码解码之间通常会有快捷连接来增加细节,比如融合,来使网络恢复目标更加完善。U-net网络如下所示: 
这里写图片描述

第二类网络使用dilated/atrous卷积,并且去掉了池化层。

这里写图片描述 
条件随机场(CRF)后处理能够提高分割效果。CRF是基于底层图像强度平滑“平滑”分割的图形模型。他们的工作原理为:强度类似的像素往往被标记为同一类。CRF能够提高1-2%的成绩。 
这里写图片描述 
CRF illustration. (b) Unary classifiers is the segmentation input to the CRF. (c, d, e) are variants of CRF with (e) being the widely used one. source 
第三部分介绍以下

1 FCN
2 SegNet
3 Dilated Convolutions
4 Deeplab(v1&v2)
5 RefineNet
6 PSPNet
7 Large Kerel Matters
8 Deeplab v3

FCN

全卷积网络对于图像分割 
14 Nov 2014

主要贡献:
    1 提出了使用端到端的卷积网络来进行语义分割
    2 直接使用预训练好的分类网络进行图像分割(迁移学习)
    3 使用反卷积层进行上采样
    4 介绍跳过连接提高上采样的粗糙度

详细解释:
    关键是在分类网络中全连接层可以看做是覆盖整个输入区域的
    内核的卷积。这相当于对原始分类网络的评估,在重叠的输入上面,但是由于计算在重叠区域是共享的,所以计算效率更高。虽然这种独到的见解不是第一次提出,但它却是提高了VOC2012测试效果。

这里写图片描述

Fully connected layers as a convolution.Source.

在经过一个全卷积的预训练的网络之后,比如说VGG。由于池化操作降低了图像空间维度,特征map仍然需要需要被上采样。与简单的双线性插值不同,反卷积层可以学习插值。该层野叫上卷积(upconvolution),全卷积(full convolution),转置卷积(transpose convolution)或者分数化卷积(fractionally-strided convolution)

然而,上采样(即使反卷积层)产生粗糙的分割图,是因为在池化过程中信息的丢失。因此,快捷连接/跳转连接能够产生分别率更高的特征对应图。 
评价:

这是分割图像中一个重要的贡献,当年引用率第一。

2 SegNet

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 
Submitted on 2 Nov 2015 
Arxiv Link

主要贡献:

最大池化转到解码提高分割精度

详细介绍

尽管FCN网络的上卷积层和一个跳转连接能够生成粗糙的分割图。因此,更多的跳转连接被引进。然而,不是简单的复制FCN的编码特征,同时也保留最大池化时最大值位置。这使得SegNet需要更多内存但也比FCN更加有效。

这里写图片描述 
Segnet Architecture. Source. 
评价: 
1 FCN和SegNet都是第一次提出编码解码的结构 
2 SegNet基准不够好 
3 扩张卷积

Multi-Scale Context Aggregation by Dilated Convolutions 
Submitted on 23 Nov 2015 
Arxiv Link

主要贡献:

1 使用扩张卷积,一个卷基层用于密度估计 
2 提出“上下文模块”采用扩张卷积在多尺度聚合 
详细介绍 
池化能帮助网络分类网络提高接受野。但是由于池化降低了分辨率,所以池化在分割方面很不好。因此,作者使用扩张卷积。如下图所示: 
这里写图片描述 
Dilated/Atrous Convolutions. Source 
扩张卷积层(Atrous Convolutions)在不降低视觉空间的前提下增加视野维度。

在预训练网络VGG中,最后两个池化层被移除,接下来卷基层由扩张卷积替换。 
特别的,在pool-3和pool-4之间的卷积层是dilation-2,pool-4之后是dilation 4。使用这个(论文中叫前端模块),在不增加参数的情况下提高了 
一个模块(称为文章上下文模块)进行训练,分别与前端模块的输出作为输入。这个模块是一个级联的卷积,扩张扩张不同的多尺度上下文聚合和预测从前端的改进。 
一个模块(在论文中称上下文模块)单独进行训练,与前端模块的输出作为输入。这个模块是级联的扩张卷积,拥有不同的扩张尺度,因此多尺度语境信息能被聚合,从前端的预测就被改进。

评价: 
需要注意的是,分割结果的尺寸是图像尺寸的1/8。几乎所有的方法都是这样的,对它们进行插值得到最终的分割图。

(4) DeepLab(v1 & v2)

v1 : Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs 
Submitted on 22 Dec 2014 
Arxiv Link

v2 : DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs 
Submitted on 2 Jun 2016 
Arxiv Link

主要贡献: 
1 使用 atrous/dilated 卷积 
2 提出atrous 空间金字塔池化(ASPP) 
3 使用全连接CRF

详细介绍:

atrous/dilated卷积在没有增加参数的情况下增加了视野范围。网络经过改变,如论文所示 
多尺度处理可以多个调整尺寸的原图像平行通过CNN分支(金字塔图形)或者使用具有不同采样率的(ASPP)多个平行的不同的atrous 卷积层。 
通过全连接CRF来实现结构预测。CRF。CRF作为后序流程单独训练/微调。 
这里写图片描述 
DeepLab2 Pipeline. Source.

(5) RefineNet 
RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation 
Submitted on 20 Nov 2016 
Arxiv Link

主要贡献:

(1)具有良好解码块的编码-解码架构
(2) 所有部件遵循剩余全连接

详细解释:

采用dilated/atrous卷积也存在缺点。dilated卷积计算量大需要较大内存。因为他们已经被应用到大量高分辨率特征map。这阻碍了高分辨预测的计算。DeepLab预测,是原始输入大小的1/8。
因此,本文提出编解码的架构。编码部分是ResNet-101模块。解码器有RefineNet模块,它连接/融合编码器的高分辨率特征和以前RefineNet模块的低分辨率特征。

这里写图片描述 
RefineNet Architecture. Source. 
每个RefineNet模块拥有融合多分辨率特征的结构,他通过上采样低分辨率特征和捕获语境的组件,该组件基于重复size为5*5,stride为1 的重复池化层。这些组件中每个都采用了符合身份地图思维(identity map mindset)的残差连接(ResNet) 
这里写图片描述 
RefineNet Block. Source. 
(5) PSPNet 
Pyramid Scene Parsing Network 
Submitted on 4 Dec 2016 
Arxiv Link

主要贡献: 
1 提出金字塔池化模型来聚合上下文信息 
2 使用辅助损失

详细介绍:

全局场景分类重要是因为它提供了切分类别分布的线索。金字塔池化模型通过使用大规模的kernel池化层来捕捉这类信息。

Dilted 卷积在dilted卷积论文中被用来修改残差网络(Resnet),在其上面增加一个金字塔池化模型。该模型将ResNet的特征映射与上采样的输出,该输出是并行池化层,拥有能够覆盖整个,一半和一小部分图像的kernel。 
辅助损失,对主要分支额外的,被应用第四阶段的ResNet(即输入金字塔池化模块)。该方法也被其他地方称为中间监督。 
这里写图片描述 
PSPNet. Source

(6) Large Kernel MAtters

Large Kernel Matters – Improve Semantic Segmentation by Global Convolutional Network 
Submitted on 8 Mar 2017 
Arxiv Link

主要贡献: 
提出了拥有大面积的kernel的编解码架构

详细解释: 
语义分割需要对对象进行分割和分类。由于全连接层是不可分割的结构,所以我们用非常大的卷积核来代替。 
另一个原因是虽然更深度的神经网络比如ResNet拥有更大的接受视野。研究表明网络往往从一个很小的区域收集信息(有效接受域)。 
较大的内核在计算上花费很大,并且参数更多。因此,K*K卷积核与1*K+K*1卷积核或者k*1+1*K卷积核近似。该模型在论文中被称作全局卷积网络(GCN)。 
在架构中,ResNet(没有任何dilated卷积)组成编码部分,而GCNs和反卷积构成解码部分。一个简单的残余块被称为边界细化(BR)也被使用。 
这里写图片描述 
GCN Architecture.Source

(7) DeepLab v3

Rethinking Atrous Convolution for Semantic Image Segmentation 
Submitted on 17 Jun 2017 
Arxiv Link

主要贡献: 
1 改进多孔(atrous)空间金字塔池化 
2 提出使用多孔卷积级联的模型

详细解释: 
ResNet模型通过使用多孔/扩张卷积被改进作为DeepLabv2和扩张卷积。改进的ASPP涉及图像层次特征的级联。一个1*1卷积和3个3*3多孔卷积以不同的比率。在每个并行卷积层后面是批处理标准化。 
级联模块是一个残差网络模块,除了卷基层是不同比率的多孔。该模型类似于扩张卷积论文中的语境模块,但它直接用与中间特征映射而不是信念映射(信念映射是指与拥有与类别数目相同通道的卷基层的特征映射) 
两个模型都是独立评估的。结合两者不能提高性能。他们两者都表现的非常相似在验证集上在拥有ASPP表现的更好,CRF没有使用。 
这些模型都由于从DeepLabv2的最好模型。作者注意到改进来自批处理和更好的编码多尺度上下文。 
这里写图片描述 
DeepLabv3 ASPP(used for submission).Source

  • 插入代码
  •      

深度学习-语义分割总结

  • u013580397
  • u013580397
  • 2017-11-11 20:19:50
  • 5346
翻译自qure.ai 什么是语义分割对图片的每个像素都做分类。较为重要的语义分割数据集有:VOC2012 以及 MSCOCO 。 有哪几种方法传统机器学习方法:如像素级的决策树分类,参考TextonF...

语义分割--(FRRN)Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes

FRRN Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes 收录:CVPR2017(IEEE...
  • u011974639
  • u011974639
  • 2018-03-14 22:15:56
  • 483
广告

图像语义分割之FCN和CRF

  • u012759136
  • u012759136
  • 2016-09-04 21:17:05
  • 40055
前言(呕血制作啊!)前几天刚好做了个图像语义分割的汇报,把最近看的论文和一些想法讲了一下。所以今天就把它总结成文章啦,方便大家一起讨论讨论。本文只是展示了一些比较经典和自己觉得比较不错的结构,毕竟这方...

语义分割深度学习方法集锦

  • xiamentingtao
  • xiamentingtao
  • 2018-01-19 16:49:27
  • 1748
转载:https://github.com/handong1587/handong1587.github.io/edit/master/_posts/deep_learning/2015-10-09-...

语义分割相关总结

  • qq_21275321
  • qq_21275321
  • 2017-08-16 14:36:37
  • 1510
好吧,实习期间学到的东西超多的,还看了一些语义分割相关的内容,嘿嘿~综述:语义分割简单来说就是像素级别的分类问题,以往我们做的分类问题只能分出一张单个图片物体的类别,然而当这个图片中有多个物体的时候它...

【Keras】基于SegNet和U-Net的遥感图像语义分割

from:【Keras】基于SegNet和U-Net的遥感图像语义分割 上两个月参加了个比赛,做的是对遥感高清图像做语义分割,美其名曰“天空之眼”。这两周数据挖掘课期末project我们组选的课...
  • Real_Myth
  • Real_Myth
  • 2018-03-03 19:51:49
  • 824

30篇关于语义分割的paper

  • 2017年12月28日 17:10
  • 103.65MB
  • 下载

语义分割与实例分割的区别

  • lanyuxuan100
  • lanyuxuan100
  • 2017-04-26 14:37:00
  • 5150
目前的分割任务主要有两种: (1)像素级别的语义分割 (2)实例分割这个有意思,什么叫实例分割呢?它与语义分割有什么区别与联系呢? 顾名思义,像素级别的语义分割,对图像中的每个像素都划分出对应的...

语义分割paper02

  • u010859498
  • u010859498
  • 2018-01-06 10:39:21
  • 140
转自:   http://blog.csdn.net/fabulousli/article/details/78633531 在FCN网络在2104年提出后,越来越多的关于图像分割的深度学习网络...

语义分割 - Semantic Segmentation Papers

Semantic Segmentation A Multi-Layer Approach to Superpixel-based Higher-order Conditional Random F...
  • oJiMoDeYe12345
  • oJiMoDeYe12345
  • 2017-05-23 14:54:16
  • 12181

语义分割SegNet

  • wmy199216
  • wmy199216
  • 2017-05-07 18:12:10
  • 2424
基于keras+tensorflow 直接上代码 import numpy as np from keras.models import Sequential from keras.layers im...

语义分割经典神经网络框架汇总

  • tianrolin
  • tianrolin
  • 2018-02-26 19:53:37
  • 255
语义分割经典神经网络框架汇总 FCN Jonathan Long, Evan Shelhamer, Trevor Darrell. 2014. Fully Convolutional...

深度学习之语义分割-SegNet

  • whz1861
  • whz1861
  • 2018-01-21 09:25:40
  • 229
This core trainable segmentation engine consists of an encoder network, a corresponding decoder netw...

CV | Semantic Co-segmentation in Videos 视频协同语义分割

前言:这篇文章发表在ECCV2016上,之前读过同一作者的CVPR2016的Object Flow,最近因为做了报告,就顺便整理学习笔记了,欢迎大家一起讨论。 视频的协同语义分割 这个方向...
  • iLOVEJohnny
  • iLOVEJohnny
  • 2017-01-05 19:12:40
  • 2117

实例分割和语义分割的区别

  • zhaoshuling1109
  • zhaoshuling1109
  • 2017-10-07 16:51:55
  • 953
目前的分割任务主要有两种: (1)像素级别的语义分割 (2)实例分割

语义分割与实力分割的区别

  • weixin_40294256
  • weixin_40294256
  • 2018-03-18 18:56:10
  • 67
语义分割:对图像中的每个像素都要划分出对应的类别,即实现像素级别的分类;而类的具体对象、即为实例,实例分割:不仅要进行像素级别的分类,还要在具体类别的基础上区分开不同的实例。比如说一幅图中有perso...

Semantic Segmentation 语义分割 -- 深度学习(一)

一 . Semantic Segmentation 定义和特点        作为传统的计算机视觉领域的经典问题,Semantic Segmentation 语义分割是分割问题研究的热门问题。具...
  • JYZhang_CVML
  • JYZhang_CVML
  • 2017-01-31 16:25:21
  • 5475

深度卷积网络CNN与图像语义分割

  • xiahouzuoxin
  • xiahouzuoxin
  • 2015-08-19 22:33:05
  • 77677
转载请注明出处: http://xiahouzuoxin.github.io/notes/级别1:DL快速上手级别2:从Caffe着手实践级别3:读paper,网络Train起来级别3:Demo跑起来...

计算机视觉 - 语义分割 (semantic segmentation)

转载自:http://blog.geohey.com/ji-suan-ji-shi-jue-zhi-yu-yi-fen-ge/计算机视觉之语义分割2017年10月11日人工智能被认为是第四次工业革命,...
  • sinat_35496345
  • sinat_35496345
  • 2018-03-19 11:39:43
  • 112

论文笔记 | 基于深度学习的图像语义分割技术概述之5.1度量标准

本文为论文阅读笔记,不当之处,敬请指正。 A Review on Deep Learning Techniques Applied to Semantic Segmentation:原文链接 ...
  • u014593748
  • u014593748
  • 2017-05-12 12:20:20
  • 4015

图像语义分割

  • zhangsh_20930
  • zhangsh_20930
  • 2017-09-15 23:55:07
  • 717
分割

图像语义分割学习笔记~心得

  • u011771047
  • u011771047
  • 2017-05-20 11:23:42
  • 1485
图像语义分割学习过程中的笔记,心得

FCN/MRF图像语义分割与马克尔夫随机场

  • u011534057
  • u011534057
  • 2016-09-26 14:15:24
  • 2920
参考自知乎作者:困兽 链接:https://zhuanlan.zhihu.com/p/22308032 前言 (呕血制作啊!)前几天刚好做了个图像语义分割的汇报,把最近看的论文和一些想法讲了一下。...

语义分割(semantic segmentation) 常用神经网络介绍对比-FCN SegNet U-net DeconvNet

在读U-Net的时候,感觉文章有点难以理解,所以就来找有没有大神写的说明性文章,看到这篇感觉很厉害,转过来了原文http://blog.csdn.net/u012931582/article/deta...
  • Miss_yan
  • Miss_yan
  • 2018-03-03 20:52:39
  • 61

语义分割文献集合

  • u011489887
  • u011489887
  • 2018-02-27 18:18:11
  • 117
语义分割 Global Deconvolutional Networks BMVC 2016 https://github.com/DrSleep/GDN半监督语义分割 Mix-and-Matc...

图像分类,物体检测,语义分割,实例分割的联系和区别

图像理解包含图像分类、物体检测、物体分割、实例分割等若干具体问题。每个问题研究范畴是什么?或者每个问题中图像的处理结果是什么?整理如下。...
  • niaolianjiulin
  • niaolianjiulin
  • 2016-10-27 18:07:00
  • 2893

深度学习(三十三)CRF as RNN语义分割-未完待续

  • hjimce
  • hjimce
  • 2016-03-14 19:07:38
  • 21062
文献最大的意义在于把CRF的求解推理迭代过程看成了RNN的相关运算,嵌入CNN模型中,达到了真正的算法之间的融合。想要深入理解这篇文献,需要先学会文献《Efficient Inference in F...

(译)从全卷积网络到大型卷积核:深度学习的语义分割全指南

图像语义分割深度学习算法发展
  • aitazhixin
  • aitazhixin
  • 2017-11-16 17:24:10
  • 895

基于深度学习的图像语义分割技术概述之常用方法

  • gqixf
  • gqixf
  • 2017-09-19 15:05:01
  • 1865
深度学习图像分割的常用方法 深度学习在多种高级计算机视觉任务中的成功—特别是监督CNNs(Convolutional Neural Networks,卷积神经网络)在图像分类、物体检测方面的成功...

实时语义分割--ICNet for Real-Time Semantic Segmentation on High-Resolution Images

ICNet语义分割算法

你可能感兴趣的:(图像分割)