Seg+Gan的祖师爷——Semantic Segmentation using Adversarial Networks(未完成)

题目:使用对抗网络的语义分割

摘要:动机是因为它能检测并纠正高阶的不一致——gt和pred之间。实验表明我们的训练能提高acc。

 【个人总结,pix2pix的分割网络是不能学习像素之间的关系的,这就需要后端函数了以前都在折腾CRF,因为CRF是pairpixel级别的。现在用gan来获取higherorder的信息】

1.介绍:

类似于密集label的问题。现在的state of art(

2 Semantic image segmentation with deepconvolutional nets and fully connected CRFs. In ICLR,2015

15 Efficient piecewise trainingof deep structured models for semantic segmentation. In CVPR, 2016

16Fully convolutional networks for semanticsegmentation. In CVPR,2015.

21 Learning deconvolution network for semanticsegmentation. In ICCV, 2015.)依赖于cnn。

共同点是训练时,每个label变量都是独立训练的。许多post-processing被开发来增加输出的空间连续性,因为独立的预测很显然不能实现这些。

CRF场是最有效的方法来加强输出的空间连续性。

 

更多的,使用RNN方法(

30 Fully connected deep structured networks. Arxivpreprint, 2015.

35 Conditional random fields as recurrent neuralnetworks. In ICCV, 2015.——CRFasRNN)

可能训练CNN在一元可能性xxxx,成对的可能性,可以被学习,通过局部链接CRFS(

15 Efficient piecewise training of deep structuredmodels for semantic segmentation. In CVPR, 2016)

 

除了这些提升之外,这些讨论的方法都限制于pairwise CRF。然而,高序的可能性,也被发现很有效。比如基于label连续性的强健的高频特征,通过超像素(

13 Robust higher order potentials for enforcing labelconsistency. IJCV)

比如(1 Higher order conditional random fields in deep neural networks. InECCV, 2016.)显示了特定类的高频可能性能够被分割网络综合。但是这些能被学到的参数的数量有限。

【pixelwise-pairwise-higher order】

我们对加强高频连续性,且不被局限于特定类的高频可能性很感兴趣。

我们使用GAN,优化,通过联合多类crossentropy和对抗loss。对抗loss鼓励分割网络产生label——不能被DC区分于gt。因为对抗模型可以评估许多label变量的综合配置,它能增强高频连续性——不能被pairwise和perpixel增强的。

 

贡献:

你可能感兴趣的:(Seg+Gan的祖师爷——Semantic Segmentation using Adversarial Networks(未完成))