paper8:Exploring Disentangled Feature Representation Beyond Face Identification 2018CVPR

Exploring Disentangled Feature Representation Beyond Face Identification
探索人脸识别之外的解纠缠特征表示 2018CVPR
一.摘要
本文提出了一种基于人脸识别的最小化监督下的学习disentangled 互补人脸feature的方法。
构建了一个身份提取和消除的两路auto-encoder框架(D2AE),这个框架反向学习用于身份验证的身份提取feature和欺骗验证系统的身份消除特征。由于双流的设计,学习到的disentangled feature不仅表示身份或属性,而且表示完整的input image。
综合表明,所提出的feature不仅在LFW上保持了最先进的身份验证性能,而且在celebA LFWA对人脸属性识别也有一定的识别力。
二.介绍
背景:

  • 学习独特而又通用的特征表示方法,在人脸验证、属性识别等人脸相关的问题中发挥着至关重要的作用。
  • 大多数现代的方法学习特定于预先定义的监督的面部特征。如果不进行仔细的微调,这些特征很难推广到新任务的特性空间。如果没有明确的监督,学习到的特征很可能不能反映微笑和张嘴这两种属性之间的联系,也不能将性别和种族等身份相关的属性和身份紧密联系起来。
  • 学习一种适用于任何面部相关任务的全部特征表示,在人脸分析领域具有重要意义,而且可能还具有可移植性。
    框架的优点:
    1.对抗监督
    在新的对抗监督下。Identity-dispelled feature 被完整的encode。有效的保证了具有互补feature的表示的更好的泛化性和完整性。
    2.可解释性
    3.双流端到端框架
    所提出的框架是端到端学习的,完全由人脸识别进行监督,有别于传统的采用交替对抗性监督的方法。通过重用学习到的面部特征,无需对网络进行微调,就可以轻松地插入其他与面部相关的任务。
    Disentangled Representation:
    对特征空间的分离还没有得到探索,在姿态不变的任务里试图分离特征,并且对图像进行身份保存。然而,他们通常需要显式的属性监督,编码每个属性作为一个单独的元素在特征向量中。这些方法仅限于表示固定数量的属性,并且在添加新属性后需要重新训练。将类信息编码为离散的one-hot向量,信息服从高斯分布,但是他的训练是不稳定的。
    三、结构
    paper8:Exploring Disentangled Feature Representation Beyond Face Identification 2018CVPR_第1张图片
    输入235*235 大小的图像,进过inception-Resnet网络,对特征进行encode,提取图像的高维特征信息。在这里分成两个支路,一个支路经过三个卷积层,一个Avepool和full connection层,继续对提取的信息进行非线性变换。全连接层的意义在于把所有的信息按照类别的数量整合到一起,便与分类。这个支路用于人脸身份识别。另外一个支路同样经过三个卷积层和一个Avepool和full connection层。这个分支用于属性识别,最后将两个分支的特征维度连接起来,然后再经过20层卷积层和6个下采样进行交叉,然后重构出和输入图像相同维度的image。
    监督信号:
    paper8:Exploring Disentangled Feature Representation Beyond Face Identification 2018CVPR_第2张图片
    第一个支路只有一个损失函数,这个损失函数的作用是判断每个特征和真实图像之间的差异,然后反向传播更新提取特征的权值,然后优化网络,用来做人脸识别。
    在这里插入图片描述
    第二个支路有两个损失函数,第一个损失函数是用来分类,训练成一个分类器。
    第二支路相当于判别网络,一边训练一个和第一个支路一样的分类器,一边用真实图像进行分类的结果和分类器进行判别,然后反向传播更新encode的网络,提高encode编码的性能,然后使得后面的分类分的更好。

在这里插入图片描述
我们需要训练身份消解分支来欺骗身份分类器
在这里插入图片描述
重构损失,为了得到和输入image相同的图片
在这里插入图片描述
四、总结:
这篇论文看的不是很懂,不清楚第二个分支到底是在干嘛,没有领悟到作者更深层的创新思想。

你可能感兴趣的:(paper)