【论文学习】人脸识别 —— Deep Face Recognition: A Survey. 新人必看入门总结

最近看了很多人脸识别loss相关和GAN相关的paper,但是没有提纲挈领的把这些串起来,今天看到了这篇综述,里面虽然介绍的比较复杂,不过总结的还是非常明晰的。

Paper: Deep Face Recognition: A Survey

链接:https://arxiv.org/pdf/1804.06655.pdf

摘取了自己感兴趣的几部分,分享给大家,主要讲一下大的框架吧

目录

人脸识别分类

人脸识别流程

性能指标

关于norm的理解


 


  • 人脸识别分类

【论文学习】人脸识别 —— Deep Face Recognition: A Survey. 新人必看入门总结_第1张图片

 总体来说,face recognition主要有两个应用场景:face verification和face identification。verification是指判断给定的face是不是某个人;identification是指判断给定的face是哪个人(或者是陌生人)。

根据test face是否一定在training dataset中。如果是,则称作subject-dependent;否则,称作subject-independent。subject-dependent 一般用于“明星检测”中,像手机中的人脸识别是subject-independent。

在实际应用场景中,如果需要识别的face是在总的gallery中的,则是close-set;否则,就是open-set。 


  • 人脸识别流程

【论文学习】人脸识别 —— Deep Face Recognition: A Survey. 新人必看入门总结_第2张图片

人脸识别的流程先做align,然后接活体检测。然后才开始人脸识别过程,有数据预处理(one-to-more等),再加CNN网络提取特征,后面接分类或相似度衡量。

【论文学习】人脸识别 —— Deep Face Recognition: A Survey. 新人必看入门总结_第3张图片

Face Processing: 在提取feature前的模块,用于应对各种不同的条件,如poses, illumination, expressions, occlussions等。主要有两类方法:“one-to-many“,即通过数据增广,从一张图生成很多个有不同上述attribute(如pose)的patch或image,例如让网络见过各种variant角度的脸,有鲁棒性。这个常用3D脸,或者GAN;“many-to-one”,做减法,即通过normalization使得图片都变成某个canonical的状态,例如把任何的脸投射到正脸上,然后做好正脸即可。 这个常用GAN。

Feature Extraction深度神经网络,既有常见的网络如ResNet、 VGG,也有各种特殊的architecture。

Loss functionloss function的主要目标是要使可分和可判别,降低网络学习和优化的复杂程度。

Face Matching这一部分是在test阶段用于比较similarity between features时用的。


  • 性能指标

TARTrue Accept Rate,表示正确接受的比例。对相同人的图片对进行比较,我们计算出的相似度大于阈值的图像对所占的比例。TAR越大越好。

FARFalse Accept Rate,比较不同人的图像时,把其中的图像对当成同一个人图像的比例。FAR越小越好。 公式FAR = (非同人分数>T) / 非同人比较的次数

FRRFalse Reject Rate,错误拒绝率,指把相同的人的图像当做不同人的了。

公式:FRR = (同人分数

EEREqual Error Rate,等误率,当FAR = ERR时候对应的阈值T的值。即曲线的交点。


  • 关于norm的理解

Weight normalization这里的norm指的是分类层的权重归一化,让分类过程变得更容易更准确。解决如ID1有100张数据,ID2只有2张,这种数据不均和带来的问题。这也是test时候选择使用cos度量的原因吧

Feature normalizationfeature norm,如限制feature分布在一个球面上,使类别间的分布变瘦,类间的方差变小。更倾向于在角度angular间拉开。


 

你可能感兴趣的:(深度学习,人脸识别)