Re-weighted adversarial adaptation network for unsupervised domain adaptation

摘要主要强调以下几点:

1. 当domain discrepancy比较大的时候,文章中方法的性能比其余方法要好的多(实验部分的确如此)

2. re-weighted:在训练discriminator D的时候,每一个source sample并不是同等重要,weight取决于label

3. 在匹配source sample和target sample的特征分布的时候,用的是基于EM 距离的OT方法

4. 将2和3嵌入到同一个框架中,实现end-to-end training

方法:RAAN模型

Re-weighted adversarial adaptation network for unsupervised domain adaptation_第1张图片

主要包含三个网络:Ts, Tt, 和D, 先训练Ts和CLS, 再训练Tt和D来匹配Ts

(1)基于OT的adversarial learning

先给出两个特征的概率密度函数:

Re-weighted adversarial adaptation network for unsupervised domain adaptation_第2张图片

再转换成用联合分布解决匹配问题

定义OT问题的代价

接着用EM距离来最小化代价函数

Re-weighted adversarial adaptation network for unsupervised domain adaptation_第3张图片

定义EM距离

Re-weighted adversarial adaptation network for unsupervised domain adaptation_第4张图片

转换约束条件

Re-weighted adversarial adaptation network for unsupervised domain adaptation_第5张图片

至此完成对adversarial training的loss函数的定义

(2)通过修正source domain label的分布,使其与target domain label的分布相近,从而达到adapt classifier的目的

修正source domain label实则等于给每一个source sample设置weight,这个weight就是,显然weight只与label有关

Re-weighted adversarial adaptation network for unsupervised domain adaptation_第6张图片

(3)优化RAAN

定义修正的adversarial loss:

总的loss function:

优化Tt:

 

 

 

 

你可能感兴趣的:(Re-weighted adversarial adaptation network for unsupervised domain adaptation)