论文阅读:Unsupervised Domain Adaptation for Face Recognition in Unlabeled Videos

概述:

Unsupervised Domain Adaptation for Face Recognition in Unlabeled Videos,ICCV 2017的文章,实现的是用domain adaptation技术将没有label 的视频数据迁移到图片识别网络中。

作者:

URL:

http://openaccess.thecvf.com/content_ICCV_2017/papers/Sohn_Unsupervised_Domain_Adaptation_ICCV_2017_paper.pdf

Motivation:

1 有label的视频人脸数据比较少,远不如labeled face image多。

2 视频人脸和图片人脸会有一些domain上的差别,比如会有blur等。这种问题适合domain adaptation解决。

3 需要对video中质量高的加以更高的权重来提取人脸特征。

Insight:

1 提出了用domain adaptation来解决视频人脸识别的框架。

2 对图片进行degrade(blur,噪声等),当作image bridge来连接人脸图片和视频人脸之间的gap,本质上是data augmentation。

3 利用discriminator来提取一个置信度的方法对视频人脸质量进行判定和加权。

方法:

先训练好一个RFNet(图片特征提取网络),然后根据一系列的loss来训练VDNet(Video人脸特征提取网络):

灰色表示预训练好并且再训练VDNet的时候保持不变的层。

一系列的Loss如下:

L_FM是让同样一张图片VDNet和FRNet要很相似。

L_FR是让一张图片经过VDNet和经过image degrade之后的特征的期望尽量相似。

L_IC是一个metric learning的loss,比如triplet,来保持discriminative。文中使用N-pair Loss。

L_adv是GAN网络类似的loss,一方面让discriminator不能分辨这是VDN额头出来的特征还是FRNet出来的特征,Discriminator就是两层的fc。Discriminator能学习到这个feature属于高清image的置信度,这个置信度可以当作质量判断的权重。

整体的Loss就是上述几项loss相加,交替训练VDNet和discriminator。

实验

YTF和IJB-A

学习到的weight:

Thinking:

使用Domain Adaptation的方式处理人脸问题,框架比较新颖,很有启发性,用discriminator来进行质量判断也是一个很好的思路,只是学习到的权重差别都不是特别大,感觉可以通过一个变换把权重的range变大。

你可能感兴趣的:(paper,face,recognition,domain,adaptation)