zhangbijun1230

人脸识别长篇研究

一、发展史

1、人脸识别的理解：

人脸识别(Face Recognition)是一种依据人的面部特征(如统计或几何特征等)，自动进行身份识别的一种生物识别技术，又称为面像识别、人像识别、相貌识别、面孔识别、面部识别等。通常我们所说的人脸识别是基于光学人脸图像的身份识别与验证的简称。

人脸识别利用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸图像进行一系列的相关应用操作。技术上包括图像采集、特征定位、身份的确认和查找等等。简单来说，就是从照片中提取人脸中的特征，比如眉毛高度、嘴角等等，再通过特征的对比输出结果。

2、人脸识别的发展简史：

第一阶段（1950s—1980s）初级阶段：

人脸识别被当作一个一般性的模式识别问题，主流技术基于人脸的几何结构特征。这集中体现在人们对于剪影（Profile）的研究上，人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事 AFR 研究的研究人员除了布莱索（Bledsoe）外还有戈登斯泰因（Goldstein）、哈蒙（Harmon）以及金出武雄(Kanade Takeo)等。总体而言，这一阶段是人脸识别研究的初级阶段，非常重要的成果不是很多，也基本没有获得实际应用。

第二阶段（1990s）高潮阶段：

这一阶段尽管时间相对短暂，但人脸识别却发展迅速，不但出现了很多经典的方法，例如Eigen Face, Fisher Face和弹性图匹配；并出现了若干商业化运作的人脸识别系统，比如最为著名的 Visionics（现为 Identix）的 FaceIt 系统。从技术方案上看， 2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术。

第三阶段（1990s末~现在）

人脸识别的研究不断深入，研究者开始关注面向真实条件的人脸识别问题，主要包括以下四个方面的研究：1）提出不同的人脸空间模型，包括以线性判别分析为代表的线性建模方法，以Kernel方法为代表的非线性建模方法和基于3D信息的3D人脸识别方法。2）深入分析和研究影响人脸识别的因素，包括光照不变人脸识别、姿态不变人脸识别和表情不变人脸识别等。3）利用新的特征表示，包括局部描述子（Gabor Face, LBP Face等）和深度学习方法。4）利用新的数据源，例如基于视频的人脸识别和基于素描、近红外图像的人脸识别。

二、市场研究

1、全球人脸识别市场

前瞻根据人脸识别行业发展现状；到2016年，全球生物识别市场规模在127.13亿美元左右，其中人脸识别规模约26.53亿美元，占比在20%左右。预计到2021年，全球人脸识别市场预计将达到63.7亿美元，按预计期间的复合增长率达17.83％。

2、中国人脸识别市场

前瞻根据人脸识别行业发展现状，估算我国人脸识别市场规模约占全球市场的10%左右。2010-2016年，我国人脸识别市场规模逐年增长，年均复合增长率达27%。2016年，我国人脸识别行业市场规模约为17.25亿元，同比增长27.97%，增速较上年上升4.64个百分点。

3、国内主要玩家分布

1）中国部分人脸识别公司（排名不分先后）

2）四大独角兽介绍及对比细分领域

（1）旷视科技：

2014年，获阿里巴巴旗下蚂蚁金服投资，主攻金融和监控两大行业，有子公司旷视智安；团队成员除了几名来自清华校友外，还有来自美国哥伦比亚大学、英国牛津大学和美国南加州大学的科研及开发人员，截至目前员工仅有100余人。

在金融、安防、零售领域分别开始了商业化探索成功发育出Face++Financial，Face++Security，Face++BI等垂直人脸验证解决方案，主要将人脸识别应用在互联网产品上，自己做研发，在美图秀秀、淘宝等互联网领域得到良好的应用，在金融领域的市场一直占据沙发前排阵营；2016年获得上亿元C轮融资，最后选择通过计算机视觉技术与NLP技术的结合，制造出能“识别万物”的智能机器人，提供硬件模组，里面内置他们家的算法。目前正在准备启动IPO的步伐，VIE架构让他们得以绕过A股，不用达到连续三年盈利的标准实现快速上市。

（2）商汤科技：

SenseTime（商汤科技），获IDG资本投资，主攻金融、移动互联网、安防监控三大行业；由香港中文大学的汤晓欧创建，“商汤”中的汤指的就是汤晓欧本人，汤晓鸥及其研究团队所开发的DeepID算法率先将深度学习应用到人脸识别上，在技术指标上实现了新的突破。主要案例是围绕各个美化软件与直播平台制作人脸贴图，重点强化了人脸识别的关键点检测及跟踪技术。

团队有300多号，也从当初toC转向toB领域；成立于2014年的商汤科技选择另辟蹊径，选择用“四大美女”这个话题让人们躁动起来，到最后四大美女走了三个；商汤的网络都是自己设计的，这样对于深度学习网络的掌控力就会更强，提供SaaS服务的同时，可以通过SaaS把背后的数据拿到，再进行更多更细致的分析再次提升服务质量。

（3）云从科技：

2015年4月，周曦拿到战略投资成立云从科技，同年针对金融和银行业推出了40多种解决方案，包含从算法、产品、销售、售后的全产业链打造，针对农行、建行、交行、中行及多地公安提供定制化服务。团队成员除了来自中科大的校友外，还来自中国科学院各大研究所、UIUC、IBM、NEC、MicroSoft等全球顶尖学府及研究机构。

截止2016年11月，成立一年半，研发团队扩展为200余名，核心产品是人脸识别系统及IBIS集成生物识别平台，还具备3D模型、红外活体、静默活体等技术，可根据场景需求自由调节。选择连接硬件、开发与技术，属于全产业链模式，因为人脸识别系统多数情况下需要深度定制，只有这样，才能在客户提出需求的情况下迅速反馈，修改，统一用户体验。

（4）依图科技：

2012 年九月，朱珑与他的好友林晨曦在创立依图科技，这家从事人工智能创新性研究的创企从图像识别入手，首先与全国省市级公安系统合作，对车辆品牌、型号等进行精准识别，随后扩展到人像识别，通过静态人像比对技术和动态人像比对技术，协助公安系统进行人员身份核查、追逃、监控、关系挖掘等。

发展近6年，依图科技的产品已经应用到全国二十多个省市地区的安防领域，安防领域之外，依图也进入智慧城市领域和健康医疗领域，它要协助政府构建"城市大脑"，也希望将医疗领域的巨大知识鸿沟缩小，改善医患体验。

（5）细分领域对比表

（6）主要客户对比

4、商业模式

1）人脸识别商业模式设计步骤

2）人脸识别盈利模式

三、人脸识别的流程及主要技术

1、人脸识别系统组成

2、人脸识别的一般流程：

1）人脸采集：

（1）简介：

不同的人脸图像通过摄像镜头采集得到，比如静态图像、动态图像、不同的位置、不同表情等，当采集对象在设备的拍摄范围内时，采集设备会自动搜索并拍摄人脸图像。

（2）人脸采集的主要影响因素：

图像大小：人脸图像过小会影响识别效果，人脸图像过大会影响识别速度。非专业人脸识别摄像头常见规定的最小识别人脸像素为60*60或100*100以上。在规定的图像大小内，算法更容易提升准确率和召回率。图像大小反映在实际应用场景就是人脸离摄像头的距离。

图像分辨率：越低的图像分辨率越难识别。图像大小综合图像分辨率，直接影响摄像头识别距离。现4K摄像头看清人脸的最远距离是10米，7K摄像头是20米。

光照环境：过曝或过暗的光照环境都会影响人脸识别效果。可以从摄像头自带的功能补光或滤光平衡光照影响，也可以利用算法模型优化图像光线。

模糊程度：实际场景主要着力解决运动模糊，人脸相对于摄像头的移动经常会产生运动模糊。部分摄像头有抗模糊的功能，而在成本有限的情况下，考虑通过算法模型优化此问题。

遮挡程度：五官无遮挡、脸部边缘清晰的图像为最佳。而在实际场景中，很多人脸都会被帽子、眼镜、口罩等遮挡物遮挡，这部分数据需要根据算法要求决定是否留用训练。

采集角度：人脸相对于摄像头角度为正脸最佳。但实际场景中往往很难抓拍正脸。因此算法模型需训练包含左右侧人脸、上下侧人脸的数据。工业施工上摄像头安置的角度，需满足人脸与摄像头构成的角度在算法识别范围内的要求。

2）人脸检测：

（1）简介：

在图像中准确标定出人脸的位置和大小，并把其中有用的信息挑出来（如直方图特征、颜色特征、模板特征、结构特征及Haar特征等），然后利用信息来达到人脸检测的目的。

（2）人脸关键点检测（人脸对齐）：

自动估计人脸图片上脸部特征点的坐标。

（3）主流方法：

基于检测出的特征采用Adaboost学习算法（一种用来分类的方法，它把一些比较弱的分类方法合在一起，组合出新的很强的分类方法）挑选出一些最能代表人脸的矩形特征（弱分类器），按照加权投票的方式将弱分类器构造为一个强分类器，再将训练得到的若干强分类器串联组成一个级联结构的层叠分类器，有效地提高分类器的检测速度。

最近人脸检测算法模型的流派包括三类及其之间的组合：viola-jones框架（性能一般速度尚可，适合移动端、嵌入式上使用），dpm（速度较慢），cnn（性能不错）。

3）人脸图像预处理：

（1）简介：

基于人脸检测结果，对图像进行处理并最终服务于特征提取的过程。

（2）原因：

系统获取的原始图像由于受到各种条件的限制和随机干扰，往往不能直接使用，必须在图像处理的早期阶段对它进行灰度矫正、噪声过滤等图像预处理。

（3）主要预处理过程：

人脸对准（得到人脸位置端正的图像），人脸图像的光线补偿，灰度变换、直方图均衡化、归一化（取得尺寸一致，灰度取值范围相同的标准化人脸图像），几何校正、中值滤波（图片的平滑操作以消除噪声）以及锐化等。

4）人脸特征提取：

（1）简介：

人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的，也称人脸表征，它是对人脸进行特征建模的过程

（2）人脸特征提取的方法：

1、基于知识的表征方法（主要包括基于几何特征法和模板匹配法）：

根据人脸器官的形状描述以及它们之间的距离特性来获得有助于人脸分类的特征数据，其特征分量通常包括特征点间的欧氏距离、曲率、和角度等。人脸由眼睛、鼻子、嘴、下巴等局部构成，对这些局部和他们之间结构关系的几何描述，可作为识别人脸的重要特征，这些特征被称为几何特征。

2、基于代数特征或统计学习的表征方法：

基于代数特征方法的基本思想是将人脸在空域内的高维描述转化为频域或者其他空间内的低维描述，其表征方法为线性投影表征方法和非线性投影表征方法。

基于线性投影的方法主要有主成分分析法或称K-L变化、独立成分分析法和Fisher线性判别分析法。非线性特征提取方法有两个重要的分支：基于核的特征提取技术和以流形学习为主导的特征提取技术。

5）匹配与识别：

提取的人脸特征值数据与数据库中存贮的特征模板进行搜索匹配，通过设定一个阈值，将相似度与这一阈值进行比较，来对人脸的身份信息进行判断。

3、人脸识别的主要方法

1）Eigen Face（特征脸）

MIT实验室的特克（Turk）和潘特（Pentland）提出的“特征脸”方法无疑是这一时期内最负盛名的人脸识别方法。其后的很多人脸识别技术都或多或少与特征脸有关系，现在特征脸已经与归一化的协相关量(Normalized Correlation)方法一道成为人脸识别的性能测试基准算法。

https://blog.csdn.net/zizi7/article/details/52757300（人脸识别特征脸算法文档）

2）Fisher Face（渔夫脸）：

贝尔胡米尔（Belhumeur）等提出的 Fisherface 人脸识别方法是这一时期的另一重要成果。该方法首先采用主成分分析（PCA）对图像表观特征进行降维。在此基础上，采用线性判别分析（LDA）的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该方法目前仍然是主流的人脸识别方法之一，产生了很多不同的变种，比如零空间法、子空间判别模型、增强判别模型、直接的LDA 判别方法以及近期的一些基于核学习的改进策略。

https://blog.csdn.net/zizi7/article/details/52999432（Fisher Face算法文档）

3）EGM（弹性图匹配）

其基本思想是用一个属性图来描述人脸：属性图的顶点代表面部关键特征点，其属性为相应特征点处的多分辨率、多方向局部特征——Gabor变换12特征，称为Jet；边的属性则为不同特征点之间的几何关系。对任意输入人脸图像，弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点，同时提取它们的Jet特征，得到输入图像的属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。该方法的优点是既保留了面部的全局结构特征，也对人脸的关键局部特征进行了建模。

https://blog.csdn.net/real_myth/article/details/44828219（弹性图匹配算法文档）

4）基于几何特征的方法

几何特征可以是眼、鼻、嘴等的形状和它们之间的几何关系（如相互之间的距离）。这些算法识别速度快，需要的内存小，但识别率较低。

5）基于神经网络的方法

神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等。这类方法同样需要较多的样本进行训练，而在许多应用中，样本数量是很有限的。

6）基于线段Hausdorff 距离(LHD) 的方法

心理学的研究表明，人类在识别轮廓图（比如漫画）的速度和准确度上丝毫不比识别灰度图差。LHD是基于从人脸灰度图像中提取出来的线段图的，它定义的是两个线段集之间的距离，与众不同的是，LHD并不建立不同线段集之间线段的一一对应关系，因此它更能适应线段图之间的微小变化。实验结果表明，LHD在不同光照条件下和不同姿态情况下都有非常出色的表现，但是它在大表情的情况下识别效果不好。

7）基于支持向量机(SVM) 的方法

近年来，支持向量机是统计模式识别领域的一个新的热点，它试图使得学习机在经验风险和泛化能力上达到一种妥协，从而提高学习机的性能。支持向量机主要解决的是一个2分类问题，它的基本思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。通常的实验结果表明SVM有较好的识别率，但是它需要大量的训练样本（每类300个），这在实际应用中往往是不现实的。而且支持向量机训练时间长，方法实现复杂，该函数的取法没有统一的理论。

4、技术发展方向

1）结合三维信息：二维和三维信息融合使特征更加鲁棒 2）多特征融合：单一特征难以应对复杂的光照和姿态变化 3）大规模人脸比对：面向海量数据的人脸比对与搜索 4）深度学习：在大数据条件下充分发挥深度神经网络强大的学习能力

5、人脸识别数据库

1）Yale人脸数据库

2）ORL人脸数据库

3）CMU PIE人脸数据库

4）FERET人脸数据库

5）MIT数据库

6）BANCA人脸数据库

7）CAS-PEAL人脸数据库

8）JAFE表情数据库

9）Cohn-Kanade表情数据库

10）MMI表情数据库

6、技术指标

1）人脸检测中的关键指标：

例子：在摄像头某张抓拍图像中，一共有100张人脸，算法检测出80张人脸，其中75张是真实人脸，5 张是把路标误识为人脸。

1、检测率：识别正确的人脸/图中所有的人脸。检测率越高，代表检测模型效果越好。

2、误检率：识别错误的人脸/识别出来的人脸。误检率越低，代表检测模型效果越好。

3、漏检率：未识别出来的人脸/图中所有的人脸。漏检率越低，代表检测模型效果越好。

4、速度：从采集图像完成到人脸检测完成的时间。时间约短，检测模型效果越好。

在这个实际案例中：检测率=75/100 误检率=5/80 漏检率=（100-75）/100

2）人脸识别中的关键指标：

1000张样本图片里，共600张正样本。相似度为0.9的图片一共100张，其中正样本为99张。虽然0.9阈值的正确率很高，为99/100；但是0.9阈值正确输出的数量确很少，只有99/600。这样很容易发生漏识的情况。

1、检测率：识别正确的人脸/图中所有的人脸。检测率越高，代表检测模型效果越好。

2、误检率：识别错误的人脸/识别出来的人脸。误检率越低，代表检测模型效果越好。

3、漏检率：未识别出来的人脸/图中所有的人脸。漏检率越低，代表检测模型效果越好。

4、速度：从采集图像完成到人脸检测完成的时间。时间约短，检测模型效果越好。

在这个实际案例中：检测率=75/100 误检率=5/80 漏检率=（100-75）/100

2）人脸识别中的关键指标：

1、精确率（precision）：识别为正确的样本数/识别出来的样本数=99/100

2、召回率（recall）：识别为正确的样本数/所有样本中正确的数=99/600

3、错误接受率/认假率/误识率（FARFalse Accept Rate）：

1、定义：指将身份不同的两张照片，判别为相同身份，越低越好

2、FAR = NFA / NIRA

3、式中 NIRA 代表的是类间测试次数，既不同类别间的测试次数，打比方如果有1000个识别模型，有1000个人要识别，而且每人只提供一个待识别的素材，那 NIRA=1000*(1000-1) 。NFA是错误接受次数。

4、FAR决定了系统的安全性，FRR决定了系统的易用程度，在实际中，FAR对应的风险远远高于FRR，因此，生物识别系统中，会将FAR设置为一个非常低的范围，如万分之一甚至百万分之一，在FAR固定的条件下，FRR低于5%，这样的系统才有实用价值。

4、错误拒绝率/拒真率/拒识率（FRR False Reject Rate）：

1、定义：指将身份相同的两张照片，判别为不同身份，越低越好

2、FRR = NFR / NGRA

3、上式中NFR是类内测试次数，既同类别内的测试次数，打比方如果有1000个识别模型，有1000个人要识别，而且每人只提供一个待识别的素材，那 NIRA=1000，如果每个人提供N张图片，那么 NIRA=N*1000 。NFR是错误拒绝次数。

四、行业应用

1、人脸识别（FR）+其他行业

1）FR+金融：

（1）实名认证：

金融机构传统上使用人工肉眼判断、短信验证、绑定银行卡等手段进行实名认证。这些传统手段存在准确率不高、客户体验较差、成本高等问题，对金融企业业务发展造成了巨大的困扰。基于人脸识别的实名认证方式具有准确率高（一亿人中才存在两人长相相同）、客户体验好（认证速度快、客户操作少）、成本低（相较于传统认证方式）的优点，已被众多领先金融企业所采用。

（2）人脸识别在银行远程开户上的应用：

在远程开户时，金融机构可以通过智能终端在线上进行身份鉴权验证，使用人脸识别技术开户可以极大提升业务办理的安全性、时效性，并节省大量人力；

（3）刷脸取款：

在这方面人脸取代了银行卡，只需要人脸+密码即可完成取款。在前两个方面，人脸识别技术已经被国内各大银行广泛采用，刷脸取款方面，农行和招行抢先一步在ATM上线了刷脸取款功能。

2）FR+医疗：

（1）重点应用：

1、打击涉医犯罪，确保就诊安全。

建立有针对性的涉医犯罪人员布控库，与属地公安部门配合，进行实时布控。

2、管控职务犯罪，控制不当竞争。

对进入医院诊疗区域的医药代表进行管控，协助解决药品流通领域经营不规范、竞争失序等问题。

3、杜绝职业医闹，保护人身安全。

打击频繁出现的职业医闹，提高事件的响应速度，从被动响应变为主动预防。

4、规范就诊流程，和谐医患关系。

重点防范黄牛、医托等干扰正常就诊秩序的特殊人群。

5、加强监管力度，维护医保基金。

实现就诊病人与医保信息库中身份证照的比对，杜绝冒用医保卡的现象。

6、易肇事肇祸严重精神障碍患者管控。

结合“雪亮工程”，确保严重精神障碍患者流入地、流出地发现管控到位。

（2）人脸识别在医疗行业的应用突破基于三点：

1、获取到目标对象的信息：

因为行政体系不同，医疗行业想获取到目标对象信息存在较大困难，需相关行政单位进行关键的协调工作。目标对象信息包含但不局限于：人脸照片、人像照片、人员基本信息、人员动态等。

2、人脸识别的算法进一步提升：

目前的人脸识别算法的精度已经达到了相当高的水准，误报、漏报均已控制在可接受范围；更近一步的算法，可以从非结构化的视频/图片中获取更多的价值信息，从更多地维度来实现不同的应用。

3、管理者思维和水平的提升：

人工智能、人脸识别是革命性颠覆性的技术，可以给医疗行业带来巨大的提升。如何将人脸识别真正应用到医疗行业的各方各面需要管理者与技术提供方一起拓展思维、共同努力。

（3）人脸识别在医疗行业的前景：

1、对接公安视频监控、医警联动平台：

系统满足公安现有标准要求，后续可与公安机关视频监控、医警联动等平台进行无缝对接，将报警信息及关联的视频、图片推送给辖区派出所，实现联动。

2、人脸身份查证：

输入目标人员照片，即可知道此人身份及其是否属于重点管控人员，是否曾经来过医院，及其出现时间、频次。可用于筛查可疑人员，找到其活动规律。

3、人员轨迹回放：

输入目标人员照片，即可查询此人是否来过医院，到过哪些地方。此功能可还原特定人员的行动轨迹，用于嫌疑人行为研判和事后取证。

4、对接门禁系统：

与门禁系统对接，预留刷脸开门、人脸考勤等高级功能，方便办公区、手术室、药品库、住院部等区域的出入管理。

5、对接刷卡系统：

与二代证、医保卡等刷卡系统对接，将采集的人脸照片与证件上存储的照片进行比对，验证刷卡人的真实身份。

3）FR+新零售：

（1）应用人脸识别的优势

1、为重点客户画像：

帮助卖家获得顾客和潜在顾客更精准的信息，构建用户画像。可以安装在超市、商场、门店等入口，统计每天进入门店的人数、大致年龄和性别等;另一种可以安装在货架上，分析客户的关注点和消费习惯等。通过大数据分析挖掘回头客，提升客户提袋率和VIP转化率；

2、为零售商降本增益：

以智能化系统来代替人工，以人脸识别系统连接支付端来代替收银员，能跟快实现零售店的导流和商品人流分析等。

3、减少突发事件的产生：

门店遇到商品失窃的突发事件，通过对所获数据的分析，也可以将不良客户拉入“黑名单”或是降低其信用水平。

4、完美连接线上线下：

识别系统获得的用户偏好还能反哺线上，将所得数据通过线上反馈给厂商，助力于厂商更全面地了解消费者需求，进而精准地研发产品，设计营销策略。这些都是完美实现新零售“打通线上线下”内在要求的极佳方式。

（2）人脸识别的安全隐患：

1、人脸特征容易被复制：

众所周知，破解密码的最常用手段是复制，通过窃取数字密码以及套取指纹来解密的案例己经不胜枚举。与记录在大脑中或其他介质上面的数字密码相比，暴露在外面的人脸更容易被复制。通过拍照完全可以获得一个人的脸部特征并进行复制，利用整容技术或者用照片识别等欺诈的方法可以骗过人脸支付系统。

2、个人信息泄露问题。

在科技发达的今天，人们似乎很轻易就可以通过无孔不入的渠道查到消费者的各种信息。而对于刷脸支付来讲，像人脸特征这种人体密码一旦交给别人保管，个人信息的安全系数将如何确保？获取用户的面部特征是否会涉及到个人隐私？基于面部扫描系统的支付在普遍应用之后会不会带来基于位置服务造成的个人行踪泄露？

4）FR+安防：

（1）智慧城市的基础

1、视频分析：

基于视频中的人脸照片进行远距离、快速、无接触式的重点人员布控预警。让应用于车站、机场、地铁等重点场所和大型商场超市等人群密集的公共场所视频监控系统能够对视频图像进行采集、自动分析、抓取人脸实时比对，主动在监控场景中识别重点关注人员，实现重点人员的布控和识别。

2、重要场所的布控：

对机场、车站、港口、地铁重点场所和大型商超等人群密集公共场所进行布控，以达到对一些重点人员的排查，抓捕逃犯等目的。

3、静态库或身份库的检索：

对常住人口、暂住人口的人脸图片进行预先建库，通过输入各种渠道采集的人脸图片，能够进行比对和按照相似度排序，进而获悉输入人员的身份或者其他关联信息，此类应用存在两种扩展形式，单一身份库自动批量比对并发现疑似的一个人员具有两个或以上身份信息的静态库查重，两个身份库之间自动交叉比对发现交集数据的静态库碰撞。

4、动态库或抓拍库的检索：

对持续采集的各摄像头点位的抓拍图片建库，通过输入一张指定人员的人脸图片，获得其在指定时间范围和指定摄像头点位出现的所有抓拍记录，方便快速浏览，当摄像头点位关联GIS系统，则可以进一步的按照时间顺序排列检索得到的抓拍记录，并绘制到GIS上，得到人员运动的轨迹。

（2）反恐行动的助力

现在新疆、西藏等城市都将人脸识别作为基础设施建设领域的投资重点，由于人员复杂、居住人口相对混乱等因素，这些城市成为了恐怖袭击等违法犯罪行为的高发场所。而人脸识别技术采用人脸检测算法、人脸跟踪算法、人脸质量评分算法以及人脸识别算法。实现城市居住人员人脸的抓拍采集、建模存储，实时黑名单比对报警和人脸后检索等功能。能及时在危险发生之前制止。

（3）儿童安全的保镖

近年来儿童拐卖活动越来越猖獗，为了更好的保护儿童安全，有些幼儿园、小学在门口已经安装上了面部识别系统。系统采用人脸识别加IC/ID卡(非接触式智能卡) 双重认证：每一位幼儿在入学注册时进行相关登记：资料、面像、IC/ID卡号、接送者、接送者面像。

每次入园时刷卡进行报道，放学时刷卡并进行接送家长人脸认证，如果认证失败拍照后即报警通知管理员，如果认证成功即拍照放行。不论识别成功与否，系统都会记录下被识别者图像。每一次接送都有详细的时间、接送人员的照片可供查询。另外系统提供短信提示的扩展功能，家长可在手机上看到人脸识别认证时所拍的照片，从而监控到接送这个过程，从其中一个重要源头杜绝了儿童被拐的可能性。

（4）智慧酒店的管理

以前开房登记流程是：接待人员问询——身份证扫描确认——支付押金——选房层发房卡——打印纸质票据，这些流程非常繁杂，尤其是身份认证耗时最长，若遇到团队入住情况则更为复杂，身份证识别设备可能会因高频使用出现故障，而急于进房间休息的顾客却只能在前台等待手续完成，客户体验非常糟糕。

人脸识别技术就能很好的解决这一难题，帮助酒店实现系统化业务管理和一站式共享解决方案。智慧酒店的安防系统利用人脸识别技术，当顾客走到前台时系统已经自动根据顾客被摄像头捕捉到的影像调取顾客身份核对。整个验证核对过程简单、快速且实现了自动化，更大幅降低了人工识别造成的误差。而且，针对酒店VIP客人，系统可实时对比酒店大堂的摄像头影像和登记在酒店基础系统中的VIP面部数据，当VIP客人到达时，酒店可第一时间提供个性化周到服务，提高客户的满意度。

5）FR+公安

（1）寻人寻亲：

对老百姓或其他业务部门提供的照片，直接送入系统进行比对、检索、筛选，最后人工确认。

（2）派出所挡获违法人员：

对派出所挡获的人员，登记笔录，对于其中一些少数民族、聋哑人或保持沉默者等无法查证身份的人员，可拍摄照片送入各种照片库中比对，排查涉及大案要案人员，以免漏网；或查证其前科，累计处理。

（3）查证无名尸源：

需要查证无名尸源时，先拍摄正面照片，送入计算机，如果照片闭眼、破损或变形，可用人像合成系统或人工绘制一幅标准照，送入比对系统比对查证。

（4）目击者描述排查：

获得现场目击者对嫌疑人的形象描述后，可用人像合成系统进行排查。

（5）视频监控照片：

一般监控系统针对场景，得到的涉案嫌疑人的图像都有模糊、偏转、逆侧光等质量不佳问题，这时需要根据图像用人像合成系统或人工绘制一幅标准照，送入照片比对系统比对查证。

（6）公共场所集会：

在政府、球场等公共场所，时常会有人员滋事，此时公安民警不便直接带人处理，可以采用长焦摄像机拍摄特写镜头，如果效果不够好可以用人像合成系统修正，送入比对系统比对查证。

（7）一代/二代居民身份证识别：

根据犯罪人员的身份证照片信息，与系统照片库中的信息资料进行比对，提取出与证件上照片相似的人员信息，能充分利用现有的二代身份证照片资源，为公安部门的工作提供高效有利的帮助。

（8）其他应用：

常住人口的比对查询、暂住人口的比对查询、重点人口的比对查询、CCIC在逃人员的比对查询等。

6）FR+商业场景：

（1）访客登记：访客到访公司，于平板电脑进行访客信息登记，由摄像头自动抓取人脸，通过系统打印出访客贴纸；

（2）识别迎宾：公司员工，贵宾进入公司入口，摄像头能识别到访人员，实现门禁功能管理；

（3）人脸识别考勤：通过入口处的前台平板电脑进行人脸识别考勤，也可通过手机端进行人脸识别考；

（4）智能生活：较多的园区、楼宇需要人脸门禁系统，人员进出快速通行，便于管理住户、访客的进出记录；

（5）智慧教育：为严防替考事件的发生，确保考试安全，人脸识别可加强考试入场环节的考生身份认证，并有效实现智能视频监考、作弊防控等；

（6）智慧商场：利用人脸识别技术追踪并分析商场内的人流属性，人群分布等。

应用模式典型具体应用特点说明应用领域

2、FR的部分应用

1）人脸检测跟踪

1、应用：

商场客流跟踪分析，地铁、火车站、会场、机场等场所的可疑人员的跟踪检测，体育赛事的现场监控等。

2、难点：

多人脸跟踪、远场识别人脸、背景复杂、低质量图片人脸识别（算法预处理），还有侧脸（3D重建人物全面），遮挡，模糊，表情变化、强弱光（多特征融合增强抗干扰力）等各种实际环境。

3、建议：远场识别（可依据距离识别）、背景复杂（可虚化无关场景，凸显主角）。

2）人脸关键点定位

1、应用：

可用于图片的合成、动态图片的分析（直播行业鉴黄、鉴暴），通过关键点分析人脸表情情绪。

2、难点：大角度侧脸，表情变化、遮挡、模糊、明暗等，动静态关键点捕捉。

3、建议：对模糊部位可进行平滑处理，根据眼睛、嘴的特点建立不同的区域块等。

3）人脸身份认证

1、应用：

关键性应用（金融身份认证、海关检查、火车站和机场等进站），非关键性应用（智慧小区居民进出、办公大楼进出、公司单位上班打卡等）

2、难点：

年轻时的证件照和本人识别匹配、戴眼镜和未戴眼镜、侧脸和正脸、表情、背景干扰、整容后、双胞胎及长相类似等。

3、建议：

可基于三维人像分析避免认证时的假冒，动作分析等。（旷视的难以区分蜡像、海报和真人）

4）人脸属性（性别、年龄、种族、表情、饰品、胡须、面部动作状态

（1）人脸表情识别（Face expression recognition 简称FER）

1、普遍认为人类主要有六种基本情感：

愤怒（anger）、高兴（happiness）、悲伤（sadness）、惊讶（surprise）、厌恶（disgust）、恐惧（fear）。而大多数表情识别是基于这六种情感及其拓展情绪实现的

2、主要困难点是：

a）表情的精细化程度划分：每种情绪最微弱的表现是否需要被分类。分类的界限需要产品给出评估规则。

b）表情类别的多样化：是否还需要补充其他类别的情绪，六种情绪在一些场景下远不能变现人类的真实情绪。因此除了基本表情识别外，还有精细表情识别、混合表情识别、非基本表情识别等细致领域的研究。

c）缺少鲁棒性

（2）人脸性别识别

性别分类是一个典型的二类问题，人脸性别分类问题需要解决的两个关键问题是人脸特征提取和分类器的选择。人脸性别识别其实仅能识别到人脸外貌更偏向于女性还是男性，很难对女生男相、男生女相进行正确判断。

（3）人脸年龄识别

1、难点：

单人的不同年龄段识别和多人的不同年龄段识别，人脸年龄识别常和人脸识别进行组合识别，能更正确的判断在一定年限内“是否是一个人”的问题；除了以上内容，还有是否戴眼镜、头发长度、肤色等。

2、建议：

识别年龄无变化的人脸用分类即可，而对年龄变化的人脸识别方法是通过年龄模拟，将测试图像和查询库中的图像变换到某一共同的年年龄，从而去除年龄不同的影响，使识别在年龄相同的人脸图像进行。

（4）人脸属性的应用：

根据物理属性（性别、年龄、种族、眼镜颜值等）可用于广告定向投放、个性化智能推荐、顾客分析、婚恋交友等；化学属性（面部动作、情绪等）可用于即时视频社交、图片合成、图片美化等。

（5）识别建议：人脸属性分析时，可利用K-近邻算法匹配云端库里的类似照片后再对相似属性进行分析。

5）人脸聚类

（1）应用：个性化相册管理、照片分享社交、婚恋交友相似脸型匹配推荐兴趣社交等。

（2）难点：角度、光线、发型、相似脸型等干扰分类。

（3）建议：可基于一张正脸照片，将其他照片进行依次比对分析后再分类等（智能相册、婚恋社交）。

6）真人检测

（1）应用：银行开户验证、车站、机场、公司打卡等。

（2）难点：2D和3D的识别检测、真人与蜡像、硅胶假冒人脸识别、照片和真人识别检测验证等。

（3）建议：可基于三维人像分析避免认证时的假冒等，动态识别验证以区分假象（旷视的难以区分蜡像、海报和真人）。

7）人像美颜/美妆

（1）应用：兴趣社交、婚恋交友、图像合成、个性化用品推荐和广告投放等。

（2）难点：美颜与一般滤镜效果的区别、美颜后的自然效果等。

（3）建议：基于数据集的算法更新迭代。

8）人体关键点（CPM、DeeperCut）

（1）应用：关键动作抓拍、人体姿态估计、舞蹈难度评定。

（2）难点：多目标关键点定位、关键点遮挡、光线强弱等。

（3）建议：关键点遮挡（分块处理、三维构建找寻关键点）

3、FR的商业化

1）从时间上看商业化的不同阶段

2)从业务场景上看

（1）场景关键点

1、盘子够大，支撑公司发展

2、数据回流，为公司所用

3、高频使用，需求占比高

4、可在行业中复制

3）垂直行业人脸解决方案（地产行业为例）

（1）地产行业分布

1、商业地产：办公楼宇+园区厂区+商业零售+酒店

2、住宅地产：生活小区+公寓

（2）地产行业的市场规模

（3）演变方向及客户痛点

1、视频监控：

传统视频监控厂家正在进行智能化转型，从原先的“监控”视频，到现在的“读懂”视频当中的人、车、物、事；

2、门禁控制：

传统门禁控制领域价值链低，所有厂家正在寻求新的方式来转型，绝大部分都在生物识别方式上进行摸索；

人脸识别面板机、闸机及其它通行道闸雨后春笋般出现；

3、楼宇对讲：

普通楼宇对讲功能已无法满足使用要求，结合人脸识别功能的门禁系统需求越来越多；

4、防盗告警：

通过智能化手段，达到降本增效目的，已成为防盗告警、巡更检查等功能的重点迭代方向；

5、可视化系统：

降低非专业人士的使用难度，使得多方数据为“我”所用，为多种决策提供依据；

信息孤岛问题亟待解决，万物互联已是所有厂家达成的共识。

6、信息孤岛问题（痛点）：

(1) 智能化系统种类繁多，系统之间无法实现无缝连接，综合管理难度大，效率低；

(2)]智能化子系统数据采集离散，标准不一，数据价值大打折扣，无法为管理提供决策依据和帮助；

(3) 各子系统依靠人工管理，人员配备要求高、劳动强度大，人工成本居高不小；

(4) 绝大多数B端客户不懂具体业务或细节，需要具象化、可视化系统呈现。

（4）建设步骤及架构

1、步骤：

第一步：人员通信管理

基于人员通行管理的平台系统（功能性产品+后台系统管理）

员工、VIP、访客、陌生人、黑名单等人员权限管理；

第二步：传感网络融合

CCTV、车辆等；

基于“人员”、“车”、“监控”的三位一体智慧建筑场景应用；

其他子系统模块链接，形成整体传感网络，智能物联；

第三步：商业地产+新零售

人员、车辆、CCTV三功能在工作+消费场景融合；

构建以人为核心的商业综合体运营方案

2、整体IoT架构

（5）影响因素与优化方案

1、决定监控系统性能的几个主要因素：

1）模板库的人数：不宜大，包含关键人物即可；

2）经过摄像头的人数：同时出现在摄像头的人数决定了单位时间里的比对次数；

3）报警反馈时间：实时性越强，对系统性能要求越高；

4）摄像头采集帧数：帧数越高，人员经过摄像头前采集的次数越多，比对的次数也越多。

2、实战中的优化方案：

1）使用更先进的高清摄像头（3-5百万）；

2）室内均匀光线，或室外白天，无侧光和折射光；

3）人群面向同样的方向，朝向相机的方向运动；

4）恰当的监控点，如走廊、巷子或安检门/闸机口等（不要一群人同时出现）；

5）相机与人脸的角度小于20度。

4）顶尖公司的应用举例

（1）Google：2011年07月谷歌收购人脸识别软件公司PittPatt

（2）Facebook：2012年6月 Facebook收购以色列脸部识别公司Face.com

（3）微软：2012年6月微软亚洲研究院发布人脸检测算法，面部识别系统

（4）网易：2012年5月，网易人脸识别系统全国公测，用于邮箱登陆

（5）百度：2012年12月百度推出人脸识别，基于图像的全网人脸搜索

（6）阿里：2015年11月，在推出支付宝刷脸认证付款

（7）腾讯：2012年下半年，成立优图项目组

五、人脸识别（FR）的产品落地

1、FR技术产品的优势

1）非接触:

人脸图像的采集不同于指纹、掌纹需要接触指掌纹专用采集设备，指掌纹的采集除了对设备有一定的磨损外，也不卫生，容易引起被采集者的反感，而人脸图像采集的设备是摄像头，无须接触。

　　2）非侵扰:

人脸照片的采集可使用摄像头自动拍照，无须工作人员干预，也无须被采集者配合，只需以正常状态经过摄像头前即可。

　　3）友好:

人脸是一个人出生之后暴露在外的生物特征，因此它的隐私性并不像指掌纹、虹膜那样强，因此人脸的采集并不像指掌纹采集那样难以让人接受。

　　4）直观:

我们判断一个人是谁，通过看这个人的脸就是最直观的方式，不像指掌纹、虹膜等需要相关领域专家才可以判别。

　　5）快速:

从摄像头监控区域进行人脸的采集是非常快速的，因为它的非干预性和非接触性，让人脸采集的时间大大缩短。

　　6）简便:

人脸采集前端设备——摄像头随处可见，它不是专用设备，因此简单易操作。

　　7）可扩展性好:

它的采集端完全可以采用现有视频监控系统的摄像设备，后端应用的扩展性决定了人脸识别可以应用在出入控制、黑名单监控、人脸照片搜索等多领域。

2、FR三大识别场景

1）人脸确认（1:1）：

（1）简介：

将某人面像与指定人员面像进行一对一的比对，根据其相似程度来判断二者是否是同一人，相似程度一般以能否超过某一量化阀值为依据。简单的说就是A/B两张照片比对，产生的计算数值是否达到要求。

（2）产品应用：

快速的人脸识别比对，移动支付认证、安全性身份核对、作为身份确认的一种新方式，比如考生身份确认、公司考勤确认、各种证件照和本人确认。

（3）实际问题：

产品在系统设计的逻辑上，需要先考虑调取已储存对象信息的先验条件。通过界面/语音的提示，使得待认证者预先知道自己正处于被核对的过程中，且已预先了解拟核对对象的身份。

（4）比对来源的三种主要方式：

1. 用户自传照片，比如支付宝的人脸比对，用户自传的照片最大的问题是照片质量的合格率太低，拍照的光线、角度等因素会导致采集源的质量下降，不利于后期的大批量人脸特征码管理。

2. 使用身份证读卡器，读取身份证上的照片，遗憾的是这张照片2K的大小，不过也是目前用最多的源照片提取方式，比较适合签到场合。

3. 使用公安部旗下NCIIC的人脸比对接口（注意，不是网纹照片接口，这个接口已经不对外），使用的是直接的人脸比对接口。

2）人脸辨认（1:N）：

（1）简介：

将某人面像与数据库中的多人的人脸进行比对，并根据比对结果来鉴定此人身份，或找到其中最相似的人脸，并按相似程度的大小输出检索结果。

（2）产品应用：

人脸开门、人脸检索，排查犯罪嫌疑人、失踪人口的全库搜寻、一人多证的重复排查等。

（3）实际问题：

1、走失儿童的项目中去：这一类系统的部署需要两个条件：A. BCD基本库（比如1000万人） B.强大的算法硬件

2、零售店中的刷脸支付长江，需要用户预先输入全手机号，确定用户身份再进行人脸识别，将原本为1:N的问题转化为了1:1的问题。

（4）产品难点：

1、1:N中的N能够支持多大

① 场景多样化

从一个班级百号人刷脸签到，到一个公司千号人的刷脸打卡，再到一个学校的几万人，一个四线城市几十万人，一个一线城市的几千万人，难度是呈指数上升的。

② 公司实际情况

目前各家公司的成熟人脸识别应用能够支持几万到几百万人不等的应用场景，而且还有一个错误率的概念。比如，公司宣称千万分之一的错误率的情况下（1/10000000），人脸通过率其实只有93%，这是因为很难做到一定不发生错误，而且每个人都能识别通过。（假如一家公司说自己能做到亿分之一的错误率，通过率能做到98%以上，多半是虚假宣传，在实际使用中是很难达到的）

2、非配合场景

在配合场景下：比如ATM机刷脸取款，用户会自主配合，将人脸以一个理想的角度通过识别。

而在非配合应用场景下，比如监控视频下的人脸识别，追踪违法犯罪分子的身份信息，情况就要困难得多。这种情况下，用户脸部会发生角度偏大，遮挡，光线不可控等问题。

3、跨人种，跨年龄识别问题

研究发现，在一个数据集上训练好的模型，想到迁移到另外一个人种上，效果会出现较大程度的下降。另外，人脸随着年龄的变化带来的改变也给人脸识别带来不小的挑战。

要改善这样的问题，一个必要条件是需要建立一个足够完备的跨人种，跨年龄的人脸数据库；在国内的话，是以汉族人为主，同时跨年龄的人脸数据库也比较难收集，需要不短的时间跨度。

4、产品体验

① 近来备受关注的刷脸支付，很多时候都会要求用户输入全手机号，或手机号后四位，以缩小用户搜索库大小，实际上这是比较影响体验的。

② 西安一高校晨读刷脸签到，由于系统实际响应匹配时间过长，导致学生排百米长队。

3）多人脸检索（N:N）：

（1）简介：

1：N同时作业就是N:N了，同时相应多张照片检索需求。

（2）实际产品问题中：

1、在视频级N:N的校验中，如果要提高通过率，很多时候是采取降低准确率的方式，降低算法队列数量；同样在一些比赛中为了降低误识率，大大提高了准确率，所以算法在校验的过程中必须遵循至少一个固定标准，追求的是速度效率还是最高准确率。

2、视频流的帧处理所用，对服务器的计算环境要求严苛，目前的算法系统所支撑的输出率非常有限。

主要的限制如下：

海量的人脸照片解析需要大量运算（目前很少看到在采集端直接解析的，都是照片剪裁）海量的人脸照片传输需要大量的带宽（常见的720布控摄像头抓取最小的人脸照片为20K）海量的人脸照片在后台检索需要耗费大量的运算（国内主流主机为例，最多到24路摄像头

3、产品实战中的物理问题：

1）光照问题

（1）简介：

光照问题是机器视觉重的老问题，在人脸识别中的表现尤为明显。由于人脸的3D结构，光照投射出的阴影，会加强或减弱原有的人脸特征。

（2）解决思路：

A、对其进行包括光照强度和方向、人脸反射属性的量化，面部阴影和照度分析等，尝试建立数学模型，以利用这些光照模型，在人脸图像预处理或者归一化阶段尽可能的补偿乃至消除其对识别性能的影响，将固有的人脸属性（反射率属性、3D表面形状属性）和光源、遮挡及高光等非人脸固有属性分离开来。

B、基于光照子空间模型的任意光照图像生成算法，用于生成多个不同光照条件的训练样本，然后利用具有良好的学习能力的人脸识别算法，如子空间法，SVM等方法进行识别。

2）人脸姿态问题

（1）简介：

与光照问题类似，姿态问题也是目前人脸识别研究中需要解决的一个技术难点。姿态问题涉及头部在三维垂直坐标系中绕三个轴的旋转造成的面部变化，其中垂直于图像平面的两个方向的深度旋转会造成面部信息的部分缺失。针对姿态的研究相对比较的少，目前多数的人脸识别算法主要针列正面、准正而人脸图像，当发生俯仰或者左右侧而比较厉害的情况下，人脸识别算法的识别率也将会急剧下降。面部幅度较大的哭、笑、愤怒等表情变化同样影像着面部识别的准确率。（2）解决思路：

1、第一种思路：

是学习并记忆多种姿态特征，这对于多姿态人脸数据可以容易获取的情况比较实用，其优点是算法与正面人脸识别统一，不需要额外的技术支持，其缺点是存储需求大，姿态泛化能力不能确定，不能用于基于单张照片的人脸识别算法中等。

2、第二种思路：

是基于单张视图生成多角度视图，可以在只能获取用户单张照片的情况下合成该用户的多个学习样本，可以解决训练样本较少的情况下的多姿态人脸识别问题，从而改善识别性能。

3、第三种思路：

是基于姿态不变特征的方法，即寻求那些不随姿态的变化而变化的特征。中科院计算所的思路是采用基于统计的视觉模型，将输入姿态图像校正为正面图像，从而可以在统一的姿态空间内作特征的提取和匹配。

3）遮挡问题

对于非配合情况下的人脸图像采集，遮挡问题是一个非常严重的问题。特别是在监控环境下，往往彼监控对象都会带着眼镜，帽子等饰物，使得被采集出来的人脸图像有可能不完整，从而影响了后面的特征提取与识别，甚至会导致人脸检测算法的失效。

4）年龄变化

随着年龄的变化，面部外观也在变化，特别是对于青少年，这种变化更加的明显。对于不同的年龄段，人脸识别算法的识别率也不同。一个人从少年变成青年，变成老年，他的容貌可能会发生比较大的变化，从而导致识别率的下降。对于不同的年龄段，人脸识别算法的识别率也不同。

5）人脸相似性

不同个体之间的区别不大，所有的人脸的结构都相似，甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的，但是对于利用人脸区分人类个体是不利的

6）图像质量

人脸图像的来源可能多种多样，由于采集设备的不同，得到的人脸图像质量也不一样，特别是对于那些低分辨率、噪声大、质量差的人脸图像(如手机摄像头拍摄的人脸图片、远程监控拍摄的图片等)如何进行有效地人脸识别是个需要关注的问题。同样的，对于高分辨图像对人脸识别算法的影响也需要进一步的研究。

7）样本缺乏

基于统计学习的人脸识别算法是目前人脸识别领域中的主流算法，但是统计学习方法需要大量的训练。由于人脸图像在高维空间中的分布是一个不规则的流形分布，能得到的样本只是对人脸图像空间中的一个极小部分的采样，如何解决小样本下的统计学习问题有待进一步的研究。

8）海量数据

传统人脸识别方法如PCA、LDA等在小规模数据中可以很容易进行训练学习。但是对于海量数据，这些方法其训练过程难以进行，甚至有可能崩溃。

9）大规模人脸识别

随着人脸数据库规模的增长，人脸算法的性能将呈现下降

10）动态识别

非配合性人脸识别的情况下，运动导致面部图像模糊或摄像头对焦不正确都会严重影响面部识别的成功率。在地铁、高速公路卡口、车站卡口、超市反扒、边检等安保和监控识别的使用中，这种困难明显突出；

11）人脸防伪

伪造人脸图像进行识别的主流欺骗手段是建立一个三维模型，或者是一些表情的嫁接。随着人脸防伪技术的完善、3D面部识别技术、摄像头等智能计算视觉技术的引入，伪造面部图像进行识别的成功率会大大降低。

12）丢帧和丢脸问题

需要的网络识别和系统的计算机识别可能会造成视频的丢帧和丢脸现象，特别是监控人流量大的区域，由于网络传输的带宽问题和计算能力问题，常常引起丢帧和丢脸问题。

13）摄像机的头像问题

摄像机很多技术参数影响视频图像的质量，这些因素有感光器（CCD、CMOS）、感光器的大小、DSP的处理速度、内置图像处理芯片和镜头等，同时摄像机内置的一些设置参数也将影响质量，如曝光时间、光圈、动态白平衡等参数。

4、实战中的数据标注

1）数据标注

（1）一般来说，数据标注部分可以有三个角色

1. 标注员：标注员负责标记数据。

2. 审核员：审核员负责审核被标记数据的质量。

3. 管理员：管理人员、发放任务、统计工资。

只有在数据被审核员审核通过后，这批数据才能够被算法同事利用。

（2）数据标记流程

1. 任务分配：假设标注员每次标记的数据为一次任务，则每次任务可由管理员分批发放记录，也可将整个流程做成“抢单式”的，由后台直接分发。

2. 标记程序设计：需要考虑到如何提升效率，比如快捷键的设置、边标记及边存等等功能都有利于提高标记效率。

3. 进度跟踪：程序对标注员、审核员的工作分别进行跟踪，可利用“规定截止日期”的方式淘汰怠惰的人。

4. 质量跟踪：通过计算标注人员的标注正确率和被审核通过率，对人员标注质量进行跟踪，可利用“末位淘汰”制提高标注人员质量。

2）模型训练

数据标记完成后，交由算法同学进行模型的训练，期间发现的问题可与产品一起商讨。训练过程中，最好能可视化一些中间结果。一来可以检测代码实现是否有Bug，二来也可以通过这些中间结果，来帮助自己更好的理解这个算法的过程。

3）模型测试

测试同事（一般来说算法同事也会直接负责模型测试）将未被训练过的数据在新的模型下做测试。

如果没有后台设计，测试结果只能由人工抽样计算，抽样计算繁琐且效率较低。模型的效果，需要在精确率（识别为正确的样本数/识别出来的样本数）和召回率（识别为正确的样本数/所有样本中正确的数）中达到某一个平衡。

测试同事需要关注特定领域内每个类别的指标，比如针对识别人脸的表情，里面有喜怒哀乐等分类，每一个分类对应的指标都是不一样的。测试同事需要将测试的结果完善地反馈给算法同事，算法同事才能找准模型效果欠缺的原因。同时，测试同事将本次模型的指标结果反馈给产品，由产品评估是否满足上线需求。

（1）测试环境说明

例如：

CPU：Intel(R) Core(TM) i7-4790 CPU @ 3.60 GHz

内存：8GB

系统：Ubuntu 14.04 x86_64/Windows 7 SP1 64bit

GCC版本：4.8.2

（2）测试集和测试需求说明（比如“图片包含人脸大小应超过96*96像素，测试结果达到XX程度满足需求）

1. 经典人脸身份识别测试集LFW，共包含13233 张图片 5749 种不同身份；世界记录99.7%。

2. CK+ （一个人脸表情数据集），包含固定表情和自发表情，包含123个人的593个表情序列。每个序列的目标表情被FACS编码，同时添加了已验证的情感标签（生气、厌恶、害怕、快乐、悲伤、惊讶）。

（3）需要说明“有效距离，左右角度，上下角度，速度”等参数值（范围）

注：这和“部署的灵活性”相关——由于不同客户不同场景的需求不同，所以技术方的人脸检测模块，一般可以通过调整参数得到N种亚型，以适应不同应用场景(光照、角度、有效距离、速度) 下对运算量和有效检测距离的需求。

（4）测试结果——欠拟合

1、定义：模型没有很好地捕捉到数据特征，不能够很好地拟合数据

左图表示size与prize关系的数据，中间的图就是出现欠拟合的模型，不能够很好地拟合数据，如果在中间的图的模型后面再加一个二次项，就可以很好地拟合图中的数据了，如右面的图所示。

2、解决方法：

1）添加其他特征项，有时候我们模型出现欠拟合的时候是因为特征项不够导致的，可以添加其他特征项来很好地解决。例如，“组合”、“泛化”、“相关性”三类特征是特征添加的重要手段，无论在什么场景，都可以照葫芦画瓢，总会得到意想不到的效果。

2）添加多项式特征，这个在机器学习算法里面用的很普遍，例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。例如上面的图片的例子。

3）减少正则化参数，正则化的目的是用来防止过拟合的，但是现在模型出现了欠拟合，则需要减少正则化参数。

4）尝试非线性模型，比如核SVM 、决策树、DNN等模型。

（5）测试结果——过拟合

1、定义：模型把数据学习的太彻底，以至于把噪声数据的特征也学习到了，这样就会导致在后期测试的时候不能够很好地识别数据，即不能正确的分类，模型泛化能力太差。例如下面的例子。

上面左图表示size和prize的关系，我们学习到的模型曲线如右图所示，虽然在训练的时候模型可以很好地匹配数据，但是很显然过度扭曲了曲线，不是真实的size与prize曲线。

2、解决方法：

从产品角度

1）重新清洗数据，导致过拟合的一个原因也有可能是数据不纯导致的，噪音太多影响到模型效果，如果出现了过拟合就需要我们重新清洗数据。

2）增大数据的训练量，还有一个原因就是我们用于训练的数据量太小导致的，训练数据占总数据的比例过小。

从算法角度

1）交叉检验，通过交叉检验得到较优的模型参数;

2）特征选择，减少特征数或使用较少的特征组合，对于按区间离散化的特征，增大划分的区间;

3）正则化，常用的有 L1、L2 正则。而且 L1正则还可以自动进行特征选择;

4）如果有正则项则可以考虑增大正则项参数 lambda;

5）增加训练数据可以有限的避免过拟合;

6）Bagging ,将多个弱学习器Bagging 一下效果会好很多，比如随机森林等.

5）标注流程中遇到的问题

（1）项目过程中的不确定性：

1、出现原因：

一般情况下，只要数据标注的规范清晰，对规则的界定从一而终，标注工作的流程还是比较简单的。

数据标注规范可能会在测试后根据结果情况进行调整，那么，规则修改前后“数据标注的一致性”就出现了问题，会导致多次返工，在时间和人工成本上颇有影响。

2、解决方法：

1）如是分类性质的解析工作，建议标注规则先从非常肯定的非黑即白开始；规则设定由简到繁，带有疑虑数据再另外作记号。随着规则一步步深入，可能会出现交叉影响，此时就需要放弃一些低频问题的规则，余下的未标注的数据就根据新的规则标注。

2）如是多类规则同时进行的标注工作，需要把每类规则定得足够细致。

3）实例：

1、如询问机器人会干什么的语料中出现，“你说你会干什么？”可以理解为询问，也可能是嫌弃，这两类应对的策略不同，有歧义，所以不能把它归纳如询问类，需要把它从训练集里剔除。

2、如人脸情绪识别中，一个人在流眼泪，有时可以理解为伤心落泪，有时可以理解为喜极而泣，还有时可以理解为激动落泪，甚至是感动落泪等，所以在看到此类照片时，不能简单的凭借惯性化思维将其归纳到悲伤一类中，当人眼都很难判别清楚时，需要把它从训练集里剔除。

5、实际案例分析

1）某领域的人脸识别监测与身份确认

（1）案例问题：

光照影响：过暗或过亮等非正常光照环境，会对模型的效果产生很大干扰。在解决光照影响这个问题上，可以通过两种方式：

（2）解决方案：

1、从产品角度控制

A. 在用户可以更换环境的前提下（比如银行刷脸取钱等），可语音/界面提示用户目前环境不理想（头歪、头发、眼镜等），建议进行正确的正脸取照。

B. 在用户不能控制更换环境的情况下（比如人脸识别、车辆识别等摄像头固定的场景），只能通过调试硬件设施弥补这个问题。

C. 晚上：由于摄像头在晚上会自动切换到黑夜场景（从图片上看就是从彩色切换为黑白），因此在晚上强光下（例如路灯照射）人脸就会过曝，这时，我们可以通过强制设置摄像头环境为白天（图像为彩色）来避免。而过暗的情况，从节省成本角度看，可以在摄像头旁边增加一个光线发散、功率不高的灯来弥补。当然这两个问题也可以通过购买高质量的摄像头解决，但这样做也意味着更高的成本。

D. 白天：白天也会出现光线过亮的情况，这种情况可以考虑用滤光片等等。

2、从算法角度控制

用算法将图片进行处理，可以将图片恢复得让人眼看清的程度。

2）某款人脸年龄识别产品

（1）案例问题：

一款识别人脸年龄的产品对女性某个年龄阶段（25—35）的判断，误差较大，经过发现，是因为该年龄阶段有以下特点：

A. 女性在这个年龄阶段面貌变化不是很大，有时人眼给出的判断误差都很离谱。

B. 在这个年龄层次的女性注重打扮，化妆品很大程度上掩盖了其真实年龄，有时30多的跟20岁没多大差别；C. 精装打扮的和素颜的差别不是很大。

（2）解决方案：

1. 补充数据：针对该年龄层次的人脸图片数据做补充。不仅补充正例（“XXX”应为多少岁），还应补充负例（“XXX”不应为多少岁）。

2. 优化数据：修改大批以往的错误标注。

3. 数据总结：对化妆和不化妆的人脸图片进行分析，以便调整算法参数。

（3）需求研究：

1. 自拍：如女性群体一般都希望自拍时，年龄的判别在心里预期中能越小越好，当在和一群人自拍中可以适当的将主人公的年龄判别结果调低至达到用户心理满足感。此时可适当降低算法的参照度。

2. 婚恋交友：在婚恋网站交友过程中，双方都希望知道彼此的真实年龄信息，此时运用人脸年龄识别可以分析双方的年龄、皮肤等物理信息为彼此提供参考。此时的信息就不能以达到心理满足感为主了，应当追求准确度。

3）某款AR美颜相机

（1）无法定位出人脸：

在背景出现多人或宠物时，相机有时并未能精确定位出目标用户，而定位到背景图片中的人、宠物、身旁的其他人；有时屏幕一片漆黑；有时显示未检测出人脸。

1、从产品角度：

界面提醒用户远离复杂背景，或美颜时最好屏幕中只出现一人，或给出方框图让用户自己手动选择主要定位区域进行AR美颜；屏幕一片漆黑时可提醒用户是否是光线太暗，或是摄像头被障碍物遮挡等；

2、从算法角度：

可对人脸关键点进行定位，计算目标用户与摄像头的距离或计算人脸在频幕的区域占比来确定目标用户（一般几何距离近的、频幕区域占比较大的为美颜目标），结合活体检测来排除背景图片人物的干扰等。

（2）图像模糊昏暗：

光线太暗、运动、对焦等造成模糊（摄像头距离因素，造成图像低频存在，高频流失等）

1、从产品角度：

可提醒用户在光线较温和的区域进行美颜操作；或是擦除前置摄像头的障碍物；或文字提示动作太快；或是更换高清前置摄像头；或提示对焦失败，给与对焦框图让用户手动对焦等。

2、从算法角度：

在美颜前可在后台中调取手机亮度调节功能，用算法调节光线的亮暗程度以适应美颜所需的物理条件；用算法设法补齐高频部分从，而减少对照片的干扰。

（3）人脸关键动作抓捕太慢：

在进行AR美颜搞怪时（如张嘴动作，屏幕出现音符、唾沫星子等）对动作抓捕太慢（半天才抓捕到张嘴动作）。

1、从产品角度：

文字提示不支持快速移动或提示缓慢移动（如，亲！您的动作太快了，奴家还未反应过来等）

2、从算法角度：

人脸姿态估计、关键点定位来捕捉人脸动作。

（4）关键位置添加虚拟物品失败（如在嘴上叼烟、耳朵吊耳环、眼镜戴墨镜、脸显红晕）

1、从产品角度：

文字/图片提醒用户摆正人脸位置。

2、从算法角度：

可利用算法对人脸关键区域进行分割并定位，来达到人脸精准定位添加虚拟物品

4）人脸开门和人脸检索

（1）人脸开门等跨网方案需要关注的因素

1、远程算法更新：

远程算法更新必然会造成本地局域网功能暂时性无法使用。因此远程算法更新的频率、时间、更新效果都需要产品在更新前精确评估。

2、增删改人脸数据与本地数据的同步：

本地局域网和互联网是无法直接交互的，因此用户在互联网一旦对人脸数据库进行增删改的操作，下发程序的稳定性和及时性都需要重点关注。

3、硬件环境：

本地存储空间的大小和GPU直接影响到本地识别的速度。服务器的稳定性影响到功能地正常使用。

4、守护程序：

断电等外置情况意外情况发生又被处理完善后，程序能自动恢复正常。

（2）人脸检索等某一局域网方案需要关注的因素

1、速度：

除了算法识别需要消耗一定时间外，该局域网下的网速会影响到识别结果输出的速度。

2、数据库架构：

通过检索结果关联结构化数据。

3、阈值的可配置性：

在界面设置阈值功能，从产品层面输入阈值后，改变相对应的结果输出。

4、输出结果排序：

根据相似度排序或结构化数据排序内容地抉择

5、云服务的稳定性。

5）旷视科技官网产品体验（多图预警）

（1）年龄略有差距，自我估计+-5，性别基本无误，头部状态略有误差，人种误差在30-40%（样本量10，白种人和黄种人误差明显），情绪基本无误，眼镜种类识别有误差（商品识别的范畴），强光状态下表现不佳。

（2）逻辑错误：左眼（睁眼、普通眼镜）、右眼（墨镜）；相似度大（下图为张一山和夏雨）的较难区分（双胞胎估计很难区分）

（3）远距离检测较难：左图检测出一张，右图检测出两张（估计10米开外检测不到）

（4）能够识别蜡像、海报等非真人场景，因此在一些场合可欺骗摄像头，如在金融领域里的身份识别，海关检查等关键性应用中，将会有风险。

（5）佩戴的口罩无法检测出人脸

（6）公司体验对比结果

6、项目虚拟实战（以AR美颜APP为例，过程为理论经验推理所得，自己并未实习）

人脸检测系统下，有很多FR相关的应用，比如人脸属性识别（年龄、表情、性别、种族等）、人脸美颜/美妆、人脸聚类等等。我们从AR美颜/美妆这一个例子着手，探索项目的具体流程。

1）项目前期准备

（1）需求调研

1、场景及痛点：

现在大多数美颜相机拍照后，都只有添加各种滤镜、加几个字、变白一点，早已经不能满足广大女性群体对于美颜的需求；加上如今年轻女性和男性的审美标准和猎奇心理都在发生改变，社交方式的趣味性也变得不同，比如原来大家可能在空间、朋友圈、直播上看到美女帅哥都会觉得很吸睛，点赞粉丝直奔而来，但随着快手和抖音的出现，可以发现不仅仅是俊男靓女的照片和视频能引起围观，同样的各种普通群众的搞怪合成视频或合成照片（虚拟的AR特效带来的各种浮夸造型）同样能吸引无数粉丝的追捧，让普通人也能享受被人膜拜的满足感，而这些都需要用到人脸识别的相关技术。

（2）目标用户画像分析：

1、了解目标用户的主流群体：

学生（大学生、高中生、初中生）群体对月美颜美妆的心理需求、时尚人士的美妆需求、长相普通的人和长相突出的人对于美颜的心理需求等。

2、了解用户的年龄组成、地域分布对应美妆的特点。

3、不同收入群体（白领、金领、蓝领等）的美颜美妆需求关注点。

（3）市场分析：美颜美妆的市场规模，产业链，潜在的边际效应利益等。

2）文档准备

（1）需求文档：

详细的分析目前的用户需求，针对不同群体，设计不同的产品解决方案，包括市场的需求文档。

（2）数据文档：

前期的人脸图片收集、分发、标注总结文档（确定什么样的图片能要，什么样的不能要），各种脸型（长的、宽的、圆的、前额凸出的、眼睛深陷的等等）的分类，多少人完成眼睛美颜图片的分类等。

（3）产品文档：

1、场景落地文档：如听歌时头上戴虚拟耳机，叹气时嘴上叼烟，说话时唾沫星子等针对不同的人脸姿态场景研究可能的落地产品形式。

2、产品的设计文档：如美颜APP的页面交互设计、导航设计、视觉呈现设计等；直播APP中的弹幕呈现设计、点赞分享按钮设计等。

3、产品开发流程文档：如PM先提交需求、可行性分析、立项、设计流程、开发流程，算法搭建、模型训练、测试训练等一系列流程的步骤及跟进。

4、模型训练及测试文档：数据标注好后，喂给算法，搭建人脸识别美颜的模型框架，如前期用成千上万的照片训练机器的人脸关键点定位，让机器找准鼻子、眼睛、耳朵、嘴等位置等。

3）数据标注

（1）数据图片的采集：

在文档的指引下，从公开网站上爬取收集符合模型训练的人脸图片、或是运用公司的数据图片等。

（2）数据图片的标注：

在标注规范文档的指引下，将图片分发给标注团队进行数据的标注，对一些模棱两可的图片，如图片中的人脸较模糊，此时该照片是要还是不要，期间应与算法同事保持沟通，有时暗的图片在算法的优化中能准确识别，这样增加实际情况的容错率（实际中较暗的人脸图像也能定位出关键部位），那么这张图片则视为有效数据；有时较暗的图片经过算法之后并不能达到要求（及无法定位出人脸关键点），此时这照片则视为无效数据，直接剔除；但是标注团队并不知道这张图片是有效还是无效，所以标注过程中，算法同事也需间接参与进来。

（3）数据的反馈：

在部分图片标注过程后，交于算法同事训练模型调节参数，期间将测试后的数据（精确率和召回率的计算，来反映数据的标注结果）反馈给还在标注的人员，有时可能造成过拟合有时可能造成欠拟合等方便对数据进行重新操作。

4）项目流程跟踪

（1）产品立项后，每天的任务管理，流程进度跟踪，产出时间管理，开会反馈工作成果等。

（2）软硬件端：在开发流程文档的指引下，按照常规的软硬件跟踪开发。

（3）算法流程：

人脸采集、人脸检测、图像的预处理（模糊的则用算法去模糊等）、人脸特征提取、图像的匹配识别、AR虚拟等。

5）项目测试：

1、手机摄像头测试

2、平台后台程序测序

3、算法与平台后台测试

4、模型识别时间、准确率、召回率测试

5、服务器稳定性测试

6、网络带宽限制测试

7、其他平台、硬件产品常规测试

8、目标用户使用测试

6）项目优化：经过各种测试之后，针对反馈回来的数据进行产品的优化

如一张嘴就给你来根烟，结果烟插到鼻子上了，这就明显是没有定位到人脸关键点，是数据的原因还是算法的原因，这些都要经过优化处理；经过种子用户测试后，反馈得知这个点赞按钮操作起来有点别扭，应该怎样怎样，这时可能要与设计的同学讨论一下，该怎样优化产品的设计和体验。

7）项目验收上线

产品按照流程功能进行验收后上线。

六、FR的个人看法

1）人脸识别的现状

（1）实验室效果和现实效果对比，差距巨大

现如今的人脸识别技术在金融、安防等领域的应用实际上的效果要比实验室里的差很多，前阵子西安的某高校引入人脸识别晨读打卡，由于反应速度太慢，到中午还排着很长的队。可见实际生活中，由于各种物理因素（光照、角度、对焦、人鱼摄像头的距离等）导致抓拍的图片质量比较差，又经过网络传输到局域网/互联网进行对比（网络差的过程中，反应很慢），使得实际效果大打折扣。大多数情况下，实际抓拍图像质量远低于训练图像质量。

（2）训练时的标准和实际应用的标准

大多数情况下，实际应用的标准会远高于训练标准。例如，人脸识别实验室的标准是通过正脸数据训练出模型，能识别正确人脸就可以。而实际情况可能没有正脸数据，对训练提出了更高的要求。

（3）训练效果和现实效果

大多数情况下，实际效果会远低于训练效果。现在市面上CV公司都是说自己的训练效果在99%以上（无限接近于100%），但这不等于实际应用的效果就是99%。工业上场景复杂的人脸应用（类似识别黑名单这种1:N的人脸比对）正确率在90%以上就已经是表现得很好的算法模型。

2）未来发展趋势的思考：

随着人工智能的火热和发展，在全球信息化、云计算、大数据的背景下，生物识别技术的应用面会越来越大，由以人脸识别为其中代表。以下几个发展趋势呈现：

（1）网络化趋势

人脸识别解决了日常生活中一个基本的身份识别问题，今后，这总身份认证的结果会越来越多的和各行各业应用结合起来，并通过互联网和物联网得以信息共享，简单来说就是“身份识别+物联网”的发展趋势未来将十分普遍。

（2）多生物识别模式融合趋势

人脸识别技术现如今的还达不到人类的预期体验，对于一些安全性要求高的特殊行业应用，如金融行业，人脸识别很容易被不法分子攻破漏洞进行身份造假，因此需要多种生物特征识别技术的融合应用（如活体检测、虹膜识别等）以进一步提高身份识别的整体安全性。

（3）云技术

未来的云技术也将大大给人脸识别的应用提供数据和计算力支持，基于云技术的门禁控制可以同时管理成百上千的通道，加上物联网的普及，用户对任何地方的门禁进行远程控制和管理，准确识别本人，将广泛应用到企业、学校、培训机构、大型商业场合、办公大楼的门禁解决方案。

3）盈利模式的思考

（1）单一盈利模式

1、现如今的人脸识别技术服务商，都以将技术接入第三方应用软件，或是搭载在智能终端上，通过收取一定技术服务费来获取盈利。目前国内的第一梯队创业公司都在技术和数据上沉淀，而是否盈利，盈利多少都还尚不明确。

2、如在金融领域，人脸识别用于身份确认，然而身份确认之后，就没你什么事，你跟用户的关系只在于，打开某款APP或某个终端场景（闸机）的钥匙，打开之后，用户的所有行为都沉浸在APP中，并没有给FR技术服务商带来其他的使用数据及用户行为信息；从根本上来看，用户只是用钥匙开了门，而往往是门里面的东西（用户数据）才能带来商业价值。

（2）对比互联网和移动互联网

1、互联网时代早期有很多功能性的产品。如早年间的QQ只有聊天的功能；360用户只是用它来给电脑杀杀毒；百度就是个即问即答的老师；搜狐、新浪也就是用来看看新闻而已。

2、移动互联网时代也有很多这样的产品。滴滴帮用户叫个车；高德也就差不多是古代的指南针。

3、案例分析：众所周知，上面举的例子不是互联网时代的高市值企业，就是移动互联网时代高融资率的企业。

1）QQ后来用户数越来越多，QQ号成网络身份的一个必不可少的身份属性之一，用户大量的数据沉淀在其中，通过用户的使用行为信息，小马哥知道了这么多人都用我的QQ，那赶紧搞个什么娱乐活动，让有QQ号的人都来玩，于是就有了庞大的游戏帝国产业，游戏里面又加上各种钻（什么粉钻、绿钻、紫钻、黑钻）对应的各种会员机制，QQ号又以其他的方式来获取用户的行为信息如，QQ音乐（下歌要钱、换皮肤要钱）、腾讯视频（各种广告收入、会员充钱等）、QQ邮箱（会员高级功能）等，让人们越加沉浸在QQ帝国的生态圈中，莫名其妙的就被吸走了很多钱。可能你会说我还可以用其他的呀，但是好烦啊，这个也要注册，那个也要注册，明明一个QQ号可以玩转所有，没办法我就是这么懒，所以说懒人创造了这个世界的绝大多数科技产品。

2）滴滴现如今估值几百亿美刀，投资人为何给一个只帮你叫车的公司如此高的估值，我们知道滴滴打车比一般的直接叫车要便宜一点点（专车除外），那它的盈利点从而来，投资人有看中了它的哪一点。其实不难理解，滴滴之所以有如今的估值，正因为其几乎垄断了国内的打车市场，大量的用户使用它，必然就会有用户的使用数据，而这些数据便是变现的好东西，一旦整个生态搭建完毕，未来滴滴就将这些数据用无人驾驶方面，一旦抢占了市场的制高点，未来在行业链上就有绝对的议价能力。比如现在人们已经习惯了去一个陌生地方，就来一个滴滴打车，若滴滴突然涨价，一公里涨几毛或一元，你用它还是不用；心理学表明，人养成一个习惯之后，就会有惯性，对于没有超出心理承受预期的东西（不是涨价涨得特别离谱），人们会一直保持这个习惯中的一些行为，而不愿做出改变（也就是常说的人有一种惰性）。因此我想大多数人都会去接受，因为可能你花时间自己打车也是需要很多成本的；用户基数比较大，那这个涨了几毛的就会带来不少的盈利空间（中国十几亿人口，一人给我一毛钱，我都能成为亿万富翁了，但对别人而言，一毛钱可能连袋辣条都买不到），这还只是一方面。

4、人脸识别作为一种技术，并没有实际的产品承载点。以上分析中的种种产品，你都能叫出来名字，是因为这些功能或是技术都有一个实际的产品承载点，比如QQ用了即时通讯技术，头条背后的智能推荐用了机器学习相关技术，但在我们心目中它不是以一种技术停留在我们的心智空间里，它是一款实实在在的产品，我们可以操作它，使用它。无论是QQ还是滴滴、高德、今热头条、新浪等等，这些产品我们都能实实在在的接触到，并且后续行为都在这个技术的承载点里（如即时通讯技术的产品承载点是QQ，机器学习技术的产品承载点是头条），那么用户的数据自然也就在产品承载点之中，这样我们才能应用数据来创造价值，从而实现盈利。

5、人脸识别目前的阶段停留在大众视野里只是一种技术，人们的潜意识里并没有建立起一个概念，那就是这个人脸识别到底是个什么东西，我能操作它吗？它能给我带来什么呢？而一旦人脸识别有一个产品承载点，让用户能实实在在的进行操作，并有数据积累，才会有盈利的可能。而人脸识别的产品承载点是什么，目前还都没有出现，未来肯定会有，这也是未来的一大机会，无论是什么，这个产品必然都能被用户实实在在的接触到，并且后续也都将在其中产生行为，后者是必要条件。

4）信息安全的思考

一旦前面提到的产品承载点出现，FR技术必将大行其道，随之而来的可能是信息安全问题。

物联网时代之下，万物互联，万物智能，FR技术也必将融入到物联网之中，人们可能都不需要身份类的实物证件。回家开门扫脸，外出开车门扫脸，进公司扫脸，出去吃饭付钱扫脸。当人脸成为你的虚拟证件时，一旦又不法公司、团体、个人泄露或是破解了你的人脸虚拟证件，那么你的一切信息可能都暴露在他人面前，财产、房子、车子可能都有风险，还有可能因为丢失人脸证件，将无法证明你自己的身份，就像你丢了身份证一样。可想而知信息安全的重要性，未来估计会诞生一个虚拟身份信息系统，里面有每一个人的身份信息，当第三方需要身份认证时，可接入系统等。前阵子脸书因为社交信息泄露而惹上众怒引起公关麻烦。我想未来如果有一个公司专门负责用户信息数据的监管，我也不会觉得很奇怪的。

5）产品形式的思考

（1）可接触性：

无论FR技术最终是以硬件还是软件方式出现在用户面前，前提是用户能够实际的接触到，而不是仿佛在云端不可触摸，只有用户接触了，才能在心里产生出它是一款产品，而不是一项技术的概念。如AR美颜就是实实在在可操作的产品。

（2）连续使用性（高频性）：

产品必须是用户能连续使用的，也就是所谓的高频性，只有这样才能产生可利用的信息数据来变现。

（3）功能承载性：

产品要能以一种功能的方式为用户解决生活中的某一类问题。人脸除了身份认证（金融行业、安防门禁）、视觉欣赏（美颜美妆、整容）、社交评判依据（婚恋网站）还能用来干什么呢？

（4）To C or To B：

结合互联网时代的发展，我个人始终认为一款产品只有围绕用户提供服务，才有可能成就明星产品。从历史的角度来看，每一个王朝的兴衰更替都是以老百姓的意愿为转移，有道是“水能载舟亦能覆舟”。产品亦是如此，产品概念诞生到现在，每一款产品的兴衰也都是建立在用户的基础之上。任何一款产品抛开用户之后都只能死亡，尽管目前FR大层面上应用在B端，但是未来成功的FR应用产品必然是诞生在C端。

下面附上总结这篇系列文章的思路导图：

下面是参考文档链接

你可能感兴趣的:(人脸识别)

微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析一起搞IT吧数码相机算法数据结构人工智能 android 图像处理计算机视觉
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析目录一、libcvface_api.so数据结构详细注释解析一、libcvface_api.so数据结构详细注释解析///@brief人脸信息结构体typedefstructcv_face_t{cv_r
基于STM32单片机的考勤打卡系统
文章目录一、系统概述二、项目内容和功能介绍三、效果图四、资料获取一、系统概述基于STM32单片机的考勤打卡系统介绍一、系统概述基于STM32单片机的考勤打卡系统是一种集数据采集、身份识别、记录存储与远程管理于一体的智能化考勤解决方案。该系统以STM32微控制器为核心，通过非接触式识别技术（如RFID、指纹、人脸识别）或传统输入方式（如按键、密码）快速采集员工考勤信息，结合实时时钟模块（RTC）记录
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
OpenCVforUnity人脸识别插件：Unity3D中的实时人脸检测解决方案
OpenCVforUnity人脸识别插件：Unity3D中的实时人脸检测解决方案【下载地址】OpenCVforUnity人脸识别插件OpenCVforUnity人脸识别插件专为Unity3D开发者设计，帮助轻松实现高效的人脸识别功能。该插件支持摄像头画面的实时检测，精准比对面部特征，适用于刷脸验证等交互场景。集成简单快捷，符合Unity开发习惯，同时具备良好的可扩展性，方便二次开发与功能定制。无论
Python机器学习实战——逻辑回归（附完整代码和结果）小白熊XBX 机器学习机器学习 python 逻辑回归
Python机器学习实战——逻辑回归（附完整代码和结果）关于作者作者：小白熊作者简介：精通c#、Halcon、Python、Matlab，擅长机器视觉、机器学习、深度学习、数字图像处理、工业检测识别定位、用户界面设计、目标检测、图像分类、姿态识别、人脸识别、语义分割、路径规划、智能优化算法、大数据分析、各类算法融合创新等等。联系邮箱：[email protected]科研辅导、知识付费答疑、个性化定制
人脸识别接口&sdk，两张人脸相似度比对
人工智能时代，人脸识别技术正在被广泛应用于金融支付、安防监控、身份验证等多个领域，基于深度学习算法于海量样本训练，人脸识别接口以高精度、低延迟的特性出现在大众视野，成为开发者和企业用户集成人脸识别功能的首要选择之一。人脸识别接口技术服务原理：格式转换：支持BMP、JPG、PNG、TIF等多种常见图像格式；尺寸调整与压缩：建议图像大小控制在200KB左右，确保传输效率与识别质量；图像增强：自动旋转、
使用c++编写一段人脸识别眨眼检测的代码语嫣凝冰 c++opencv 计算机视觉图像处理开发语言
我可以给你一些大致的步骤：使用摄像头或图像文件获取视频帧。使用人脸检测算法检测视频帧中的人脸。对检测到的人脸进行眼睛检测。判断眼睛是否闭合，如果是则认为该人在眨眼。以下是一段使用OpenCV库编写的C代码示例：```#include#include#include#includeusingnamespacestd;usingnamespacecv;intmain(){//使用摄像头获取视频帧Vid
AI Agent开发第81课-企业AI落地15大陷阱与破局之道 TGITCIC AI Agent开发大全人工智能 AI落地企业AI落地大模型落地企业大模型落地
1.技术至上：忽视业务融合1.1业务需求驱动的本质AI项目的核心价值在于解决业务痛点，而非技术炫技。某银行通过成熟的人脸识别技术将坏账率降低15%，其成功源于对业务场景的精准把握。技术选择必须基于业务需求的优先级排序，而非单纯追求算法复杂度。当零售企业用AI优化供应链时，其目标是提升库存周转率0.5个百分点，而非发表顶会论文。1.2技术与业务的错位某科技公司投入千万研发智能客服系统，最终因响应准确
树莓派上基于Opencv 实现人脸检测与人脸识别土拨鼠不是老鼠 C++opencv 人工智能计算机视觉
一，需求基于树莓派4b，usb1080p摄像头，实现人脸检测与人脸识别。尝试了海陵科的模组和百度的sdk。海陵科的模组无法录入人脸，浪费了100多块钱。百度的sdk在树莓派上也无法录入人脸，官方解决不了。最后只能用opencv自己实现，因为只要实现最简单检测和识别就行，不在乎准确率。经测试opencv能满足基本要求，这里整理下思路。二，（1），加载模型并实例化Ptr和Ptr对象。树莓派4bopen
树莓派实验——人脸识别 Rounie opencv python 计算机视觉
importnumpyasnp#导入numpy科学计算库importcv2#导入OpenCV函数库#装载人脸识别特征文件face_cascade=cv2.CascadeClassifier('/usr/local/lib/python3.5/dist-packages/cv2/data/haarcascade_frontalface_alt.xml')cap=cv2.VideoCapture(0)
3516cv610的aiisp效果张海森_168820 音视频
3516cv610的aiisp效果1.图像增强（AI+ISP协同）亮点：动态范围提升（AIHDR）：比纯ISP的线性HDR更自然，减少鬼影；智能降噪（AINR）：在低照/夜间噪点压制更干净，纹理保留好；颜色还原：色彩更接近人眼感知，尤其在人脸区域处理更出色；AI自动曝光/白平衡：识别场景特征（如人脸、车牌）优先调整曝光区域，实际效果更“智能”；适用场景：人脸识别入口、夜视监控、强背光场景示例提升前
【EI会议征稿】东北大学主办第三届机器视觉、图像处理与影像技术国际会议（MVIPIT 2025）诗远Yolanda 图像处理计算机视觉考研视频机器学习论文阅读
一、会议信息大会官网：www.mvipit.org官方邮箱：[email protected]会议地点：辽宁沈阳主办单位：东北大学会议时间：2025年9月27日-9月29日二、征稿主题集中但不限于“机器视觉、图像处理与影像技术”等其他相关主题。机器视觉：视觉中的统计机器学习；立体视觉标定；几何建模与处理；人脸识别与手势识别；早期视觉和生物学启发的视觉；光流法和运动追踪；图像分割和图像分类；基于模型的视觉
人脸识别常用数据集和Loss JL_Jessie 人脸识别深度学习
人脸识别数据集数据集的noise对训练效果的影响很大！很长一段时间MegaFace的效果都上不去，就是因为数据集噪声的原因。而且自己在训练人脸的时候，如果不对数据集的噪声和属性有一点了解，对训练结果可能会有误判，甚至越训练越差…在选择数据集的时候不要一味求大，有的时候选择一个noise比例极高的大数据集，效果还不如选择一个clean的小数据集呢，可以参见这篇论文TheDevilofFaceReco
Python dlib（HOG+SVM）人脸识别总结程序媛一枚~ 人脸识别 python 支持向量机开发语言读书笔记人脸检测识别
Pythondlib（HOG+SVM）人脸识别总结面部标志检测dlib68点（HOG+SVM），194点人脸识别模型，包括口（外嘴唇，内嘴唇），鼻，眉毛（左右眉），眼睛（左右眼），下鄂5点面部标志检测器（左眼2点，右眼2点，鼻子1点）面部对齐更高效眨眼检测ear眨眼瞬间达到0疲劳驾驶检测—连续帧ear面部对齐眼睛连线反正切获取旋转角度，期望图像眼睛横长度计算比率左眼计算右眼相对坐标眼睛横中心点作为
ubuntu系统的树莓派人脸识别视频（转载哔哩哔哩） qq_39717490 ubuntu 音视频 linux
树莓派进阶玩法|人脸识别项目教程_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1uv4y1g7aB?spm_id_from=333.337.search-card.all.click&vd_source=f9b5cbd9734c647ef133bdde5c02cfd4,视频播放量34013、弹幕量29、点赞数690、投硬币枚数247、收藏人数1968
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
基于OpenCV-python的人脸识别系统 transuperb 完整代码 opencv python 人工智能
importsysimportosimporttkinterastkfromtkinter.ttkimportStyleimportnumpyasnpimportcv2fromPILimportImageTk,ImageDraw,ImageFontfrompanel.models.tabulatorimportthemefromModelimport*fromtkinterimportttk,fi
零基础学 OpenCV + Python 图像处理：手把手带你做人脸识别（附代码+典型案例）猫头虎 #Python专栏 opencv python 图像处理计算机视觉 AIGC AI编程人工智能
零基础学OpenCV+Python图像处理：手把手带你做人脸识别（附代码+典型案例）关键词：opencv-python、opencv图像处理、opencv人脸识别代码python、python安装opencv库亮点提示：本文面向零基础读者，手把手教你从环境搭建到实战应用，一步步深入，让你快速掌握OpenCV+Python图像处理与人脸识别技术。文中附带完整示例代码与典型案例，可直接复制、运行与深度
Camera相机人脸识别系列专题分析之十三：人脸特征检测FFD算法之libcvface_api.so人脸识别检测流程详解一起搞IT吧数码相机算法计算机视觉 android 人工智能图像处理
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十三：人脸特征检测FFD算法之libcvface_api.so人脸识别检测流程详解目录一、背景二、：FFD算法libcvface_api.so人脸识别检测流程详解2.1：FFD初始化2.2：FFD人脸识别检测process2.3：setFdAlgoInfo2.4：FFD卸载
Camera相机人脸识别系列专题分析之四：Camera相机领域人脸识别和人脸属性检测介绍一起搞IT吧人工智能计算机视觉图像处理 android
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：Camera相机人脸识别系列专题分析之三：一张图片的人脸识别过程原理这一篇我们开始讲：Camera相机人脸识别系列专题分析之四：Camera相机领域人脸识别和人脸属性检测介绍目录一、背景二、：Camera相机领域人脸识别2.1：影像相关基础知识2.1.1pipeline简介2.1.2Raw阈图像处理2.2：Camera相机人脸识别2.3：
Camera相机人脸识别系列专题分析之七：MTK ISP6S平台FDNode流程FdNodeImp.cpp调试手段及客制化dump，跳帧，开关，使能，异步控制等等一起搞IT吧数码相机人工智能图像处理 android
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：Camera相机人脸识别系列专题分析之六：MTKISP6S平台人脸识别fdnode流程FdNodeImp.cpp详解这一篇我们开始讲：Camera相机人脸识别系列专题分析之七：MTKISP6S平台FDNode流程FdNodeImp.cpp调试手段及客制化dump，跳帧，开关，使能，异步控制等等目录一、背景二、：FDNode客制化2.1：F
Camera相机人脸识别系列专题分析之十四：人脸特征检测FFD算法之libcvface_api.so人脸属性(年龄，性别，肤色，微笑，种族等)检测流程详解一起搞IT吧数码相机算法计算机视觉 android 人工智能图像处理
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十四：人脸特征检测FFD算法之libcvface_api.so人脸属性(年龄，性别，肤色，微笑，种族等)检测流程详解目录一、背景二、：FFD算法libcvface_api.so人脸属性检测流程详解2.1：FFD初始化阶段2.2：FFD人脸属性检测process2.3：fd_algo_
深度学习在人脸识别中的应用及Python实现 loop_syntax648 机器学习-深度学习
人脸识别是一种通过计算机技术识别和验证人脸的方法，近年来深度学习在人脸识别领域取得了显著的进展。深度学习模型能够学习和提取人脸图像中的高级特征，从而实现准确的人脸识别。本文将介绍深度学习在人脸识别中的应用，并提供Python实现的源代码。深度学习模型通常基于卷积神经网络（ConvolutionalNeuralNetwork，CNN）进行人脸识别。CNN是一种专门用于处理图像和视觉数据的神经网络模型
人脸识别python实现源码（功能丰富）张沙姗
人脸识别python实现源码（功能丰富）去发现同类优质开源项目:https://gitcode.com/此仓库提供了一组基于Python的人脸识别源码，利用dlib库的先进面部识别功能构建而成，并具备深度学习特性。以下是对该资源的详细介绍：功能特点在Wild标记的LabeledFaces数据集上实现99.38％的准确度。提供简单的命令行工具，支持以下功能：在图像文件夹中找到出现的所有面孔。获取每个
python实现面部特效_【AI美颜算法】300行Python实现基于人脸特征的美颜算法
先上效果图：AI美颜人类一直是一个看脸的物种，人人都希望可以变得更美是无可争议的，而美颜类应用的出现拯救了所有人，从此人类进入了美(照)颜(骗)时代。。。。。每次写技术blog都要写一堆废话引言，现在懒得写，大概就是美颜很重要，美女主播靠它活，没了它大部分妹子不敢发朋友圈blabla。美颜算法的基础是人脸识别技术，市面上的美颜应用普遍使用了CV科技类公司的人脸识别（特征点提取）接口：MeituKi
计算机视觉入门：OpenCV 人脸识别与手势控制系统全解析高山仰星计算机视觉 opencv 人工智能
1.引言计算机视觉（ComputerVision）是人工智能的重要领域，而OpenCV（OpenSourceComputerVisionLibrary）是最常用的开源计算机视觉库。它广泛用于图像处理、人脸识别、目标检测、手势识别等多个应用场景。本教程将详细介绍OpenCV的核心概念，并通过人脸识别的门禁系统和手势识别的智能控制系统这两个案例，帮助你掌握OpenCV的实际应用。2.OpenCV介绍与
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag