一、python人脸识别绪论(论文、综述用)

毋庸置疑,人脸是当下一项火热的技术,也是高校学生趋之若鹜的研究课题。在此之前,阅览了不少资料,也没有什么自称“专家”的人给“人脸识别”一词下过明确的定义,毕竟这是一个新兴的技术和概念。在我眼中,人脸识别是机器学习和深度学习的一项很成功的实际应用,它无疑给了那些认为人工智能是泡沫的人们一记响亮的耳光。


“人脸识别”是从照片(静态图片)或一段视频(动态)中定位到人脸,并进行下一步操作的技术。有两点要注意,在“定位人脸”这一步操作前还有一步操作,类似判空,即判断这张图片(或者这段视频)里是否有人脸存在。当认为有人脸存在后再进行下一步操作“定位人脸”。第二点所谓的”下一步操作“,主要是识别出人脸以后的后续操作。总不见得找到人脸就算结束,啥都不干了吧。所以下一步操作可以是诸如美颜、车站身份认账等等。我把它分为以下六类:

  1. 身份认证 
  2. 证件验证
  3. 人脸检索
  4. 面部分析
  5. 美颜
  6. 换脸

身份验证,类似门禁、手机人脸解锁、还有火车站进站的身份验证这种。主要是系统判断当前人脸是否在数据库内,是的话通过验证,反之验证失败,门禁不开、手机无法解锁、火车站不放行。要注意的是,身份验证往往没有“活体检测”这一步。

证件验证,与身份验证类似。只是多了活体检测这一步骤。往往用在金融界(贷款),和机密度较高的身份验证。类似的策略最早可以回溯到微软的windows Hello生物识别里的人脸识别。它通过在surface上加入一个热成像摄像头,通过判断人脸热量分布图来确认屏幕前的不是一张照片或者一具死尸,而是活生生的用户。国内以蚂蚁金服为例,则是使用摇摇头,张张嘴来检测是否是活体。当然也有使用红膜识别来加以辅助,但这明显不在机器学习的讨论范畴内。

人脸检索,与前两者不同,前者是“一对一”匹配。而人脸检索是“一对多”操作。主要运用于“天眼”这种设备,来查找嫌犯。

面部分析,主要是判断定位到的人脸是男的还是女的?大致年龄范围。什么人种?(黑人?白人?黄种人?)是什么表情?(喜?怒?哀?乐?等等)这里 主要使用的是机器学习中的分类器。

美颜,顾名思义,类似美颜相机的功能。

换脸,也是顾名思义,不过这在中华人民共和国是违法的。


人脸识别的一般步骤:

一、python人脸识别绪论(论文、综述用)_第1张图片

 

从中可以看到,大致分为6个步骤:

  1. 图像预处理
  2. 人脸检测
  3. 人脸校正
  4. 人脸特征点定位
  5. 人脸特征提取
  6. 分类器

图像预处理的大小,尽可能去除噪点。对应的操作可以是滤波处理等。

人脸检测,顾名思义就是用来判断一张图里是否含有人脸的步骤。如果检测到人脸就将其定位(一般用矩形框框出),反之返回“没有找到人脸”的消息。

人脸校正。有些时候照片上的人脸不是“正脸”,所以无法直接判断。于是就有了人脸校正,其主要原理是用矩阵变换实现人脸几何上的变换,从而变为正脸。

人脸特征点定位,是指在检测到人脸后,定位可以代表人脸的关键位置的点。一般采用5点:左右眼、左右嘴角、鼻子。还有人脸轮廓和最轮廓的68点图。

人脸特征提取。这是人脸识别的核心技术,通过提取人脸特征,我们可以判断图片中人的性别、大致年龄、进行人脸对比操作。它的好坏影响最后的输出结果。

分类器是指逻辑回归问题的一种分类算法,常见的有贝叶斯分类器等。根据判断结果选择相应的下一步。比如说男性笑容和女性笑容并不一样。所以得先判断男女,在使用分类器匹配下一步“笑容”的数据内容。


 

你可能感兴趣的:(一、python人脸识别绪论(论文、综述用))