【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》

摘要:

无监督域自适应旨在通过源域上有标记训练数据,学习到可以适用于目标域上无标记样例的分类器。最近,通过深度域对抗方法来学习域不变特性取得了令人印象深刻的进展。尽管近年来的研究取得了一定的进展,但域自适应在较细类别水平上实现特征分布的不变性方面仍然存在一定的局限性。为此,本文提出了一种新的域自适应方法域对称网络(SymNets)。提出的SymNet是基于源和目标任务分类器的对称设计,在此基础上,我们还构造了一个额外的分类器,与源域和目标域分类器共享每层神经元。为了进行SymNet训练,我们提出一种新颖的对抗学习目标函数,其关键设计是基于一个两个级别的域混淆机制。类别级别的混淆损失比域级别的混淆损失有所细化,因为它促使中间网络特性的学习在这两个领域的相应类别上保持不变。域判别性学习和域混淆均建立在构造的附加分类器的基础上。由于目标域样本是无标记的,我们还提出了一种跨域训练的方法来帮助学习目标分类器。消融学习表明我们提出的方法是有效的。特别是,基于常用的基本网络,我们的SymNet在三个基准域适应数据集上达到了state of the art。

Introduction

1.deep learning需要大量标注数据,在现实生活中很难获得。
2.Domain adaptation方法致力于解决域偏移问题。理论分析表明:可以通过最小化源域分类经验误差以及源域和目标域的距离来最小化目标域上分类器的误差。基于对抗的域适应方法在当前取得了state of the art,该类方法设计一个域鉴别器区分特征所来自的域,一个特征提取器以提取与不变特征从而使域鉴别器产生混淆。通过对抗的训练达到域对齐的效果。
3.基于对抗的方法存在一个严重的问题:类别和特征的联合分布没有严格的对齐。一些方法通过给目标域打上伪标签进行类别间的对齐。另一些方法利用特征表示和类别预测之间的乘法交互作为高阶特征来帮助对抗性训练。
我们提出的方法SymNet包括一个针对目标域的任务分类器,还有一个与源域和目标域分类器共享神经元的额外分类器。介绍了一种训练SymNet的新的对抗学习方法,其中包含类别级别和域级别的混淆从而从类别级别加强域不变特征的学习。与此同时,提出一种跨域训练方法使得目标域分类器的学习与源域分类器的学习更加对称。
本文贡献如下:
1.提出全新的SymNet方法,通过设计共享神经元的额外分类器完成域判别性和域混淆的学习。
2.提出基于两级别域混淆损失的全新域对抗训练方法。通过将不同域相同类别进行混淆,提升了直接域混淆的效果。
3.在标准数据集上取得了state of the art。消融学习也显示了所提出模块的必要性。

整体网络结构与目标函数

所提出的模型结构
【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》_第1张图片
整体目标函数由6部分构成,如下:
在这里插入图片描述

  • 其中第一项

在这里插入图片描述
在源域上通过交叉熵损失的有监督训练。

  • 第二项:

【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》_第2张图片
利用源域有标签样例训练目标域分类器。形式上看上去和第一项没有区别。但是通过 C s t {C}_{st} Cst实现与源域分类器的区分。同时,建立了源域目标域分类器之间神经元的对应关系是后续类别级对齐的基础。

  • 第三项通过设计一个与源域目标域分类器共享神经元的Cst来区分样例的不同域。通过一个双向交叉熵损失:

【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》_第3张图片
其中
在这里插入图片描述

在这里插入图片描述
看做将一个样例分成源域和目标域的概率,如图所示:
【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》_第4张图片
C s {C}_{s} Cs得到 x x x属于所有源域类别的概率和, C t {C}_{t} Ct得到 x x x属于目标域所有类别的概率。进而通过softmax得到样例的域标签。
如果有一个来自目标域属于第 k k k类的样例, C s {C}_{s} Cs C t {C}_{t} Ct都能正确判断他的所属类别。而 C s t {C}_{st} Cst可以获得他的所属域。从而既保证了域不变性,也保证了特征的判别性。

  • 第四项是类别及的混淆损失项:

【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》_第5张图片
由于源域是有标注的,可以获得样例具体的类别信息,所以对于源域样例,通过 C s t {C}_{st} Cst的前一半得到的类别和后一半得到的类别应该是一样的,通过这样的损失达成类别级别的对齐。

  • 第五项是域级别的混淆损失:
    【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》_第6张图片
    域级别的混淆不需要具体的类别信息,所以使用无标注的目标域样例。通过对样例所属域中所有类别概率求和达到域混淆目的。
    上面第四和第五项通过域级别和类别级别的混淆实现了两个域之间联合分布的对齐。
  • 第六项为熵最小化正则项,以此加强目标域模型的判别性:

【论文笔记 CVPR-2019】《Domain-Symmetric Networks for Adversarial Domain Adaptation》_第7张图片
其中:
在这里插入图片描述
此项使 G G G中参数得以更新,以此减少较大域间差异的带来的副作用,同时缓解了训练初期分类错误难以在后续训练中纠正的问题。
具体实验结果和分析大家可以查看原文:https://arxiv.org/pdf/1904.04663.pdf

你可能感兴趣的:(DA,论文)