领域适应domain adaptation 学习笔记

domain adaptation经典方法

在source domain有大量fully labeled数据,target domain 有不完全labeled数据,两个domain 之间有gap存在(跨domain测试效果很差),如何利用source上的数据训练适应于target domain的模型呢?
回答:想办法让他们投影到相同的特征空间

ps:以下内容属于homogeneous domain adaptation,图对图,声对声

discrepancy-based method

用pre-defined参数来使源域和目标域的feature相似

  1. deep domain confusion 2014
    要让目标域和源域的各类别特征空间重合
    计算目标域和源域的feature 距离,叫做maximum mean discrepancy,加入loss中

  2. deep adaptation networks 2015
    1是在fc之前算mmd,2是在高层和低层都算了mmd

  3. coral
    使用2nd order mmd
    CMD使用更高阶数的mmd

adversarial based method

分辨feature 是从target还是source,用domain classifier对抗训练extractor(用的最多的)

  1. simultaneous deep transfer across domains and tasks 2015
    有两个特性
    domain confusion:用feature extractor和classifier对抗训练。
    label correlation:分类判断时会产生distribution among labels的答案,要求源域和目标域的这个distribution接近

  2. DANN 2016
    创造gradient reversal layer,feature同时进入分类分支和domain classifier分支。其中domain classifier返回的loss会经过gradient reversal layer,也就是将extractor朝着loss增加的方向更新。

  3. pixelDA 2017
    使用gan产生虚假的target domain图片:
    给源域图加噪音,经过generator产生目标域图,discriminator用来判断是否是生成图,classifier用来判断图片内容。

reconstruction based method

要求feature能reconstruct成原本的图片,避免失去信息

  1. domain seperation networks
    进行了feature disentanglement,这个本来用于生成具有指定特征的图片(比如指定倾斜角度的手写数字)。
    对目标域和源域提取各自的域特征和共同特征。对单个域图片,将域特征和共同特征相乘获得內积,令內积尽量小;对于不同域图片,令共同特征尽量相似,包括使用mmd,dann等similarity计算方式。
    最后把域特征和共同特征输入decoder,希望能重建输入图像
    还要在源域上训练分类器

你可能感兴趣的:(算法笔记)