人脸识别 | 基于深度学习以人类为中心的图像理解

640?wx_fmt=png 春天来了 640?wx_fmt=png

小草偷偷地从土里钻出来,嫩嫩的,绿绿的。园子里,田野里,瞧去,一大片一大片满是的。坐着,躺着,打两个滚,踢几脚球,赛几趟跑,捉几回迷藏。

是不是突然觉得这不是人工智能的平台吧!

啊哈哈哈~今天杭州的天气格外的好,有一种想去西湖游荡一圈的冲动,有一种上灵隐寺烧香拜佛的想法,有一种骑行环绕西湖景区的动机,但是~最后还是被好的Paper、好的程序、好的框架给吸引,在笔记本前敲击着键盘,为大家带来今天的分享,想和大家一起学习。

640?wx_fmt=png

今天和大家说的是关于人脸识别人类部件解析。下面先给大家展示下具体背景及效果图,然后我们开始展开讲解。

人脸识别 | 基于深度学习以人类为中心的图像理解_第1张图片

人脸识别 | 基于深度学习以人类为中心的图像理解_第2张图片

640?wx_fmt=png

视 频 展 示

640?wx_fmt=png

这里主要就是展示了人脸检测识别,并且会提示你有没有恶意遮挡,才可以进行检查。

本次讲解的人脸主要有一下三种因素影响:

UnconstrainedFaceRecognition


Large-ScaleFaceRecognition
Low-ShotLearning

人脸识别 | 基于深度学习以人类为中心的图像理解_第3张图片

在现实生活中,可以通过很多路径产生图像,比如以上的所有设备,都可以迅速以及实时的采集图像,所以现实中图像数据最为常见,所以针对人脸识别有一个比较好的优势,就是可以通过一些设备进行监查,时刻在手机数据样本,增加设计框架的泛化性能。

今天主要讲解的框架如下:

人脸识别 | 基于深度学习以人类为中心的图像理解_第4张图片

那我们先说说Face Recognition!根据最近几年的框架开始展开讲解:

人脸识别 | 基于深度学习以人类为中心的图像理解_第5张图片

01

人脸识别 | 基于深度学习以人类为中心的图像理解_第6张图片

3D-Aided Dual-Agent GANs forUnconstrained Face Recognition

主要提出一种Dual-Agent生成对抗网络(DA-GaN)模型,该模型能够提高真实人脸仿真器输出的真实感,同时在真实感细化过程中保留身份信息。Dual-Agent是专为区分真伪和身份而设计的。特别是使用现成的三维人脸模型作为模拟器来生成不同姿态的轮廓人脸图像,Da-GAN利用FCN作为发生器,利用自动编码器作为Dual-Agent的判别器,除了新的结构外,还对标准GAN进行了几个关键的修改,以保持姿态和纹理,保持身份和稳定训练过程:(1)姿态感知损失;(2)身份感知损失;(3)具有边界平衡正则项的对抗性损失。此外,所提出的DA-GAN也是一种更有效地解决通用迁移学习问题的新方法。

人脸识别 | 基于深度学习以人类为中心的图像理解_第7张图片

Keywords: UnconstrainedFaceRecognition;FaceSynthesis;3DFaceModel;GenerativeAdversarial Networks

人脸识别 | 基于深度学习以人类为中心的图像理解_第8张图片

02

人脸识别 | 基于深度学习以人类为中心的图像理解_第9张图片

Towards Pose Invariant FaceRecognition in the Wild

在人脸识别中,影响准确率的一个比较重要的因素是姿态的多样性。放眼目前的人脸识别技术,有两种方法为主流方向,一种是直接提取不同姿态的人脸特征,另一种就是再提取特征之前,现将人脸摆正。

本文方法可以将两种方法联合起来使用,最终二者相互影响,实现准确率的提升。提出了一种Pose Invariant Model (PIM)的方法来识别自然场景的人脸。

本方法有三个新颖之处:

1、PIM是一个新奇统一的深度框架包括了 人脸摆正(Face Frontalization sub-Net, FFN)和一个特征学习(Discriminative Learning sub-NetDLN);

2、FFN是一个设计好的双通道的GAN网络来同时感知全局和局部的细节;

3、DLN是一个人脸识别的中通用的CNN,利用enforced交叉熵来优化网络。

人脸识别 | 基于深度学习以人类为中心的图像理解_第10张图片

Keywords

Pose-InvariantFaceRecognition

Cross-DomainAdversarialLearning; DomainAdaption TransferLearning LearningtoLearn DynamicConvolution EnforcedCross-Entropy Optimization Generative Adversarial Networks

人脸识别 | 基于深度学习以人类为中心的图像理解_第11张图片

人脸识别 | 基于深度学习以人类为中心的图像理解_第12张图片

之后的几项我们会在”计算机视觉协会“知识星球为大家带来详细讲解,并给予详细的代码,希望有兴趣的同学可以进一步学习!

640?wx_fmt=png Human Parsing  640?wx_fmt=png

人脸识别 | 基于深度学习以人类为中心的图像理解_第13张图片

主要用一下案例讲解:

人脸识别 | 基于深度学习以人类为中心的图像理解_第14张图片

Winner:CVPR2017 LIP Human ParsingChallenge

提出了一种用于人体解析的自监督神经聚合网络(SSNAN)。SSNAN自适应地学习在每个像素“address”上聚合多尺度特征。为了进一步提高特征识别能力,在不需要额外监督的情况下,采用自监督的联合损失作为辅助学习策略,将人的联合结构引入到分析结果中。提出的SSNAN是端到端可训练的,SSNAN可以集成到任何先进的神经网络中,以帮助在不同的位置和尺度上聚集关于重要性的特征,并从全局的角度整合关于人类关节结构的丰富的高级知识,从而提高解析结果。

人脸识别 | 基于深度学习以人类为中心的图像理解_第15张图片

人脸识别 | 基于深度学习以人类为中心的图像理解_第16张图片

640?wx_fmt=png

最后再说说这个领域的未来工作吧!(点击阅读原文,可以获取部分代码!

Face

  • 验证和识别:无约束(如姿态、年龄、化妆、表情、模糊等)/大规模/低命中人脸识别

  • 视频监视、安全场景(例如,防、活性检测等)、Mobile、人机交互分析与多人分析:自上而下、多任务学习方法OE-商业、群体行为分析、人-再识别、图像编辑、视频监控、自主驾驶、虚拟现实

Human

  • 人类分析和多人分析:自上而下和自下而上,多任务学习方法

  • E-Commercial,群体行为分析,行人-再识别,图像编辑,视频监视,自主驾驶,虚拟现实

如果想加入我们“计算机视觉战队”,请扫二维码加入学习群。计算机视觉战队主要涉及机器学习、深度学习等领域,由来自于各校的硕博研究生组成的团队,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。

人脸识别 | 基于深度学习以人类为中心的图像理解_第17张图片

640?wx_fmt=png

人脸识别 | 基于深度学习以人类为中心的图像理解_第18张图片

你可能感兴趣的:(人脸识别 | 基于深度学习以人类为中心的图像理解)