人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"

人脸姿态的变化是人脸识别的难点,一般的姿态不变的人脸识别方法是人脸正面化,或者从非正脸的图片中学习特征。论文提出Disentangled 表示学习-生成对抗网络。有三个特征,1)生成器的编码-解码结构使得DR-GAN学习generative和discriminative的表示,2)通过提供到解码器的姿态编码和鉴别器的姿态估计,学到的特征表示与其他的人脸变形disentangled。3)DR-GAN可以输入一张或多张图像,生成一个unfied的表示。

DR-GAN的结构如下图所示:
人脸识别

生成对抗网络由G和D生成样本,GAN的主要目标是图像合成,论文建立了一个带有编码-解码结构的G,如图2d所示,编码器的输入是任意姿态的人脸,解码器的输出是人造的特征姿态的人脸。G是人脸旋转器,D不仅用来分辨真实和人造图像,还用来预测ID及姿态。D的任务是让生成的人脸和真实的人脸不具有相同的ID,这样使得G生成更真实的旋转人脸,并且学习到的人脸表示更generative。
人脸识别

论文提出的G输入是人脸图像,姿态编码c及一个随机噪声z,生成足以迷惑D的标准姿态人脸。 Genc 学习输入图像的特征表示,这个表示与c和z串联,输入到 Gdec 进行人脸旋转。 Genc 输入多幅图像,生成每个图像的特征表示及系数,所有表示综合成一个表示, Gdec 使用这个表示合成人脸。Multi-Image GAN的生成器如下图所示:
人脸识别

实验结果
对抗损失与L2损失合成人脸效果对比:
人脸识别

你可能感兴趣的:(深度学习,人脸识别)