人脸识别Face Recognition综述

综述:https://arxiv.org/pdf/2009.13290.pdf

人脸识别整个系统一般由三个关键要素构成:人脸检测(face detection)、人脸预处理(face preprocess),人脸表征(face representation)

人脸检测定位图像或视频帧中的人脸。

人脸预处理是进行人脸标定到一个规范的视角并将他们裁剪到一个标准化像素大小。

人脸表征阶段,从预处理后的图像中提取具有鉴别性的特征用于识别。

这三个要素都是由深度卷积神经网络实现的。

The standard pipeline of end-to-end deep face recognition system

人脸识别Face Recognition综述_第1张图片

1 Face Detection

给定一幅输入图像,人脸检测的目标是找到图像中所有的人脸,并给出所有人脸的包围框的坐标和置信度得分。人脸检测的主要挑战包括变化的分辨率、比例、姿态、光照、遮挡等。传统的方法侧重于设计手工制作的特征来区分人脸和背景区域。

2 Face Preprocessing

在第二阶段,人脸预处理的目标是将检测到的人脸标定为一个规范的视图(即人脸对齐或正面化),这是提高人脸识别端到端性能的必要步骤。

通常,人脸对齐利用空间变换技术将人脸校准为标准化视图。在现有的人脸对齐方法中,人脸landmark是必不可少的,因为它们是进行相似变换或仿射变换的参考。因此,人脸关键点定位是人脸对齐的先决条件。

基于深度学习的人脸landmark定位方法可以分为三种:coordinate regression based approaches, heatmap regression based approaches and 3D model fitting based approaches

Visualization of facial landmarks of different versions:

3 Face Representation

人脸表征致力于学习深度人脸模型,利用深度人脸模型从预处理的人脸中提取特征进行识别。这些特征用于计算匹配人脸的相似度。

在监督训练方面,主要包括分类、特征嵌入、混合和半监督等方案。具体地说,分类方案将人脸表征学习视为一个分类问题(即一个ID被认为是一个类),它通常使用softmax loss及其变体作为监督训练。特征嵌入方案通过不同样本之间的优化距离来学习人脸表征。混合方案是指综合使用训练深度人脸模型的分类和特征嵌入。这三个方案侧重于监督训练。最近,深度半监督人脸表征学习中增加注意力,因为它们可以通过使用大量未标记人脸,来提高人脸表征的学习。此外,我们还展示了几个具体的人脸识别场景,包括跨域、少样本学习和基于视频的场景。

人脸检测数据集:

人脸识别Face Recognition综述_第2张图片 

你可能感兴趣的:(Deep,Learning,#,CV,深度学习,人工智能)