人脸识别活体检测技术探讨

随着人脸识别、人脸解锁等技术在金融、门禁、考勤、人证合一等日常生活中的广泛应用，人脸防伪/活体检测（Face Anti-Spoofing）技术在近年来得到了越来越多的关注。

简单来说，活体检测就是要识别出成像设备（摄像头、手机等）上检测到的人脸图像是来自真实的人脸，还是某种形式的攻击或伪装。这些攻击形式主要包括照片（包括纸质照片和手机、平板等电子设备上的照片）攻击、视频回放攻击、面具攻击等。

活体检测包括普通彩色（RGB）摄像头上的检测，也包括红外摄像头、三维深度摄像头上的检测。后面两种相对容易实现，这里主要讨论普通RGB摄像头上的活体检测。

以前的动作活体检测的方式具有很高的安全性，但要求用户配合做几个动作，因此体验不好。现在的活体检测不需要用户动作配合，被称作静默活体检测。此外，活体检测要求实时完成，在不超过1秒，最好在300毫秒内完成识别。

现在主流的活体识别算法基本可以分为两种类型。第一个类型使用特定的某种物理特征，或多种物理特征的融合，通过深度学习方面的训练分类器，来区分是活体，还是攻击（或者是哪种形式的攻击）。另一个方式是使用卷积神经网络（CNN）的方法，直接在RGB图像（或者转换到其它色度空间）上使用深度神经网络来提取特征，最后通过分类器来区分是活体还是非活体。为了提取时间上多帧而不是单帧的信息，也可以结合使用RNN的方法。CNN的方法能达到很好的效果，但通常比较耗时，不能满足实际应用中嵌入式设备的实时识别的要求。而且，当物理特征挑选使用恰当时，第一种方法能够达到非常好、甚至超越CNN的效果。

活体检测中的物理特征主要分为纹理特征、颜色特征、频谱特征、运动特征、图像质量特征等，此外，还包括心跳特征等。其中纹理特征包括很多，但最主流的是LBP、HOG、LPQ等。颜色特征除了RGB之外，学术界发现HSV或YCbCr具有更好的区分活体非活体的性能，被广泛用作不同的纹理特征上。频谱特征的原理是活体、非活体在某些频段具有不同的响应。运动特征提取目标在不同时间上的变化，是一个有效的办法，但通常耗时较久，达不到实时的要求。图像质量特征有很多描述方式，比如反射、散射、边缘或形状等。

经过多种算法的比较，我们的活体检测选用了多种物理特征融合加上分类器的算法。我们的计算优势体现在以下几个方面。

[if !supportLists]1） [endif]我们的物理特征选用了上面描述的其中几种，涵盖了纹理特征、颜色、频谱特征、图像质量特征，和可选的运动特征。

[if !supportLists]2） [endif]我们研究了几种融合方式：i)在特征上进行融合；ii）在自动编码器（auto encoder）上进行融合；iii）在分类得分上融合。我们选用了准确率最高，易用性好，速度快的方法。

[if !supportLists]3） [endif]我们使用的分类器算法超越传统的支持向量机（SVM）算法，使用了最新深度学习方法，比如center loss。

算法经过优化之后，可以有效提取各种摄像头上的活体和非活体的不同响应，根据我们在多个主流厂家摄像头及手机的测试结果表明，识别准确率达到99%以上。同时，实时性能优异，能在300毫秒内快速完成识别。

当然，泛化性能对所有活体识别来说都是一个挑战，这需要采集海量的数据来进行训练，涵盖市面上主要的手机、摄像头型号。我们希望使用我们的SDK的开发者们，可以分享你们能获取的活体、非活体照片，以便于我们进一步优化我们算法的准确率。

到我们的AI开放平台上可以下载并免费使用的人脸识别及活体检测SDK https://ai.deepcam.cn/#/home 欢迎大家来使用。

人脸识别活体检测技术探讨

你可能感兴趣的:(人脸识别活体检测技术探讨)