人脸识别预研

1. 人脸识别发展

以往的人脸识别主要是包括人脸图像采集、人脸识别预处理、身份确认、身份查找等技术和系统。现在人脸识别已经慢慢延伸到了ADAS中的驾驶员检测、行人跟踪、甚至到了动态物体的跟踪。由此可以看出,人脸识别系统已经由简单的图像处理发展到了视频实时处理。而且算法已经由以前的Adaboots、PCA等传统的统计学方法转变为CNN、RCNN等深度学习及其变形的方法。现在也有相当一部分人开始研究3维人脸识别识别,这种项目目前也受到了学术界、工业界和国家的支持。

2. 人脸识别过程

人脸识别主要分为四大块:人脸定位(face detection)、 人脸校准(face alignment)、 人脸确认(face verification)、人脸鉴别(face identification)。下面的概念主要参考自:deep face recognition。

2.1 人脸定位(face detection)

对图像中的人脸进行检测,并将结果用矩形框框出来。在OpenCV中有直接能拿出来用的Harr分类器。

2.2 人脸校准(face alignment)

对检测到的人脸进行姿态的校正,使其人脸尽可能的”正”,通过校正可以提高人脸识别的精度。校正的方法有2D校正、3D校正的方法,3D校正的方法可以使侧脸得到较好的识别。 在进行人脸校正的时候,会有检测特征点的位置这一步,这些特征点位置主要是诸如鼻子左侧,鼻孔下侧,瞳孔位置,上嘴唇下侧等等位置,知道了这些特征点的位置后,做一下位置驱动的变形,脸即可被校”正”了。如下图所示:

人脸识别预研_第1张图片
里写图片描述

2.3 人脸确认(face verification):

Face verification,人脸校验是基于pair matching的方式,所以它得到的答案是“是”或者“不是”。在具体操作的时候,给定一张测试图片,然后挨个进行pair matching,matching上了则说明测试图像与该张匹配上的人脸为同一个人的人脸。一般在小型办公室人脸刷脸打卡系统中采用的(应该)是这种方法,具体操作方法大致是这样一个流程:离线逐个录入员工的人脸照片(一个员工录入的人脸一般不止一张),员工在刷脸打卡的时候相机捕获到图像后,通过前面所讲的先进行人脸检测,然后进行人脸校正,再进行人脸校验,一旦match结果为“是”,说明该名刷脸的人员是属于本办公室的,人脸校验到这一步就完成了。在离线录入员工人脸的时候,我们可以将人脸与人名对应,这样一旦在人脸校验成功后,就可以知道这个人是谁了。上面所说的这样一种系统优点是开发费用低廉,适合小型办公场所,缺点是在捕获时不能有遮挡,而且还要求人脸姿态比较正(这种系统我们所有,不过没体验过)。下图给出了示意说明:

人脸识别预研_第2张图片
这里写图片描述

2.4 人脸识别(face identification/recognition)

Face identification或Face recognition,人脸识别正如下图所示的,它要回答的是“我是谁?”,相比于人脸校验采用的pair matching,它在识别阶段更多的是采用分类的手段。它实际上是对进行了前面两步即人脸检测、人脸校正后做的图像(人脸)分类。

人脸识别预研_第3张图片
这里写图片描述

根据上面四个概念的介绍,我们可以了解到人脸识别主要包括三个大的、独立性强的模块:

人脸识别预研_第4张图片
这里写图片描述

我们将上面的步骤进行详细的拆分,得到下面的过程图:

人脸识别预研_第5张图片
这里写图片描述

3. 国内人脸识别公司介绍

人脸识别行业在国内发展迅速,从2015年开始,人脸识别作为计算机视觉领域最接近落地的分支,开始形成风口。而新兴公司如雨后春笋,2011年到2016年成立的人脸识别公司超过30家,其中大部分集中在2012到2015年,这只是人脸识别热潮的一个缩影。其背后原因是计算机视觉技术背后的通用性,做人脸识别的公司往往也可以做图像识别,反过来也是一样的道理。

中国网传的是这个四家人脸识别的独角兽:face++ 的旷视科技,senseTime的商汤科技,还有云从科技,依图科技。

云从科技从中国科学研究院出来,云从科技 在银行、公安、机场、火车站等行业应用具有优势,中国五大银行中的中行、农行、建行、交行已经先后与云从科技达成技术合作。

依图科技优势在于安防领域,已经将产品应用到全国二十多个省市地区的安防领域,另外依图也进入智慧城市领域和健康医疗领域,协助政府构建“城市大脑”, 希望将医疗领域的巨大知识鸿沟缩小,改善医患体验。

商汤科技的汤晓鸥博士的三个算法号称是目前LFW 排名前三的算法,主要提供SDK、API 服务、拥有faceU、直播美化等商业应用,正在向企业应用转型。
另外汉王、中控等老牌厂商掌控着传统的静态人脸识别加指纹考勤机,依靠价格固守着商用市场。

国内的BAT对人脸识别这个方向也蛮重视,国内巨头已经在起跑线摆出了火拼的架势,一场大战前的硝烟味正在扩散。

阿里巴巴通过蚂蚁金服控股旷视科技,通过云峰基金控股依图科技,阿里已全面将人脸识别技术应用到自己支付宝、淘宝等平台,并将系统旗下其他业务板块等,培养人脸识别的应用场景。

旷视拥有Face++云平台,通过云+端的模式为中小银行、地产园区等商业机构实现人脸识别调用服务,至今为止调用总量已达到1.2亿次。

另外腾讯旗下有自己内部的优图团队,基于整个腾讯的社交网络平台,为 QQ 空间、腾讯地图、腾讯游戏、等 50 多款产品提供图像技术支持。每天 QQ 空间有 2 亿上传图片的活跃用户,团队单日最多处理照片达 6 亿张,累计已经分析处理了超过 300 亿张照片。

百度人脸识别也依靠庞大的数据资源进步神速。百度人脸识别属于百度深度学习研究院旗下,在2015年LFW中曾达到99.77%的准确率,在当年排名第一,在今年的FDD测试也取得较好成绩,已推出百度识图、脸优app等产品。

然而对比市面的人脸识别公司,现在能提供开放平台给开发者,能免费进行调试的就只有BAT三家旗下的产品,云从科技,依图,商汤等知名的人脸识别公司主要做企业用户,没有给用户提供开放api。

4. 免费人脸识别技术公司对比

下面是可供我们免费使用人脸识别技术的公司的对比

公司 免费额度 技术 收费价格 知名应用
腾讯优图 2万张/月 自研的Uface识别引擎,LFW 99.80%,数亿用户每日识别验证,全面人脸识别技术。MegaFace 83.290% 人脸检测与分析:0.0005元/张 人脸比对、验证、检索:0.0032元/张 天天P图 、微众银行、QQ空间
百度深度学习 百度的api每天最多1000次,都对并发不做保证,商用版识别结果会和试用版一样,仅仅是次数限制 百度在2015年LFW中曾达到99.77%的准确率,当时排名第一 现在免费公测阶段,还未收费 百度钱包、泰康人寿、脸优
face++(阿里控股) 1.并发数有上限且不保证并发 2.Face 存储有上限:每个用户使用免费服务只能创建 1000个 FaceSet,总计最多存储 100 万个人脸。3.用户只能有一个 API Key 使用免费服务,而且该 API Key 不能转为正式 API Key。 技术先进 方式一:按量收费 0.001起/每次 方式二:包时计费 30起/每小时,每QPS(人体比对,搜索较贵分别为 0.05、0.1元/每次) 支付宝 联想 世纪佳缘

上面的三家企业均可以免费接入,三家中百度可以提供sdk, 其他两家只能提供开放的api,
技术上对各位在LFW 及FDDB考察的话,百度和腾讯的排名比较靠前,face++相比就靠后些。而且face++ 商用版还不能正常使用,最重要的人体比对,与搜索api 收费较高。

5. 结论

如果我们的用户不多,能够api的调用量不多,我建议可以尝试下百度的,当调用次数比较多的话,可以尝试腾讯的人脸识别技术。

你可能感兴趣的:(人脸识别预研)