人工智能学家

关于人脸识别的最全研究！

来源：北京物联网智能技术应用协会

　　本文内容涵盖人脸识别发展历程、市场研究、核心技术、商业应用以及产业落地、个人看法等干货研究。注意，本文干货满满，约有2万7千字，强烈建议大家先收藏后学习！

01 发展史

　1. 人脸识别的理解

　　人脸识别(Face Recognition)是一种依据人的面部特征(如统计或几何特征等)，自动进行身份识别的一种生物识别技术，又称为面像识别、人像识别、相貌识别、面孔识别、面部识别等。通常我们所说的人脸识别是基于光学人脸图像的身份识别与验证的简称。

　　人脸识别利用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸图像进行一系列的相关应用操作。技术上包括图像采集、特征定位、身份的确认和查找等等。简单来说，就是从照片中提取人脸中的特征，比如眉毛高度、嘴角等等，再通过特征的对比输出结果。

2. 人脸识别的发展简史

　第一阶段（1950s—1980s）初级阶段

　　人脸识别被当作一个一般性的模式识别问题，主流技术基于人脸的几何结构特征。这集中体现在人们对于剪影（Profile）的研究上，人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事 AFR 研究的研究人员除了布莱索（Bledsoe）外还有戈登斯泰因（Goldstein）、哈蒙（Harmon）以及金出武雄(Kanade Takeo)等。总体而言，这一阶段是人脸识别研究的初级阶段，非常重要的成果不是很多，也基本没有获得实际应用。

第二阶段（1990s）高潮阶段

　　这一阶段尽管时间相对短暂，但人脸识别却发展迅速，不但出现了很多经典的方法，例如Eigen Face, Fisher Face和弹性图匹配；并出现了若干商业化运作的人脸识别系统，比如最为著名的 Visionics（现为 Identix）的 FaceIt 系统。从技术方案上看， 2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术。

第三阶段（1990s末~现在）

　　人脸识别的研究不断深入，研究者开始关注面向真实条件的人脸识别问题，主要包括以下四个方面的研究：1）提出不同的人脸空间模型，包括以线性判别分析为代表的线性建模方法，以Kernel方法为代表的非线性建模方法和基于3D信息的3D人脸识别方法。2）深入分析和研究影响人脸识别的因素，包括光照不变人脸识别、姿态不变人脸识别和表情不变人脸识别等。3）利用新的特征表示，包括局部描述子（Gabor Face, LBP Face等）和深度学习方法。4）利用新的数据源，例如基于视频的人脸识别和基于素描、近红外图像的人脸识别。

02 市场研究

　1. 全球人脸识别市场

　　前瞻根据人脸识别行业发展现状；到2016年，全球生物识别市场规模在127.13亿美元左右，其中人脸识别规模约26.53亿美元，占比在20%左右。预计到2021年，全球人脸识别市场预计将达到63.7亿美元，按预计期间的复合增长率达17.83％。

2. 中国人脸识别市场

　　前瞻根据人脸识别行业发展现状，估算我国人脸识别市场规模约占全球市场的10%左右。2010-2016年，我国人脸识别市场规模逐年增长，年均复合增长率达27%。2016年，我国人脸识别行业市场规模约为17.25亿元，同比增长27.97%，增速较上年上升4.64个百分点。

3. 国内主要玩家分布

　　3.1 中国部分人脸识别公司（排名不分先后）

3.2 四大独角兽介绍及对比细分领域

（1）旷视科技：

　　2014年，获阿里巴巴旗下蚂蚁金服投资，主攻金融和监控两大行业，有子公司旷视智安；团队成员除了几名来自清华校友外，还有来自美国哥伦比亚大学、英国牛津大学和美国南加州大学的科研及开发人员，截至目前员工仅有100余人。

　　在金融、安防、零售领域分别开始了商业化探索成功发育出Face++Financial，Face++Security，Face++BI等垂直人脸验证解决方案，主要将人脸识别应用在互联网产品上，自己做研发，在美图秀秀、淘宝等互联网领域得到良好的应用，在金融领域的市场一直占据沙发前排阵营；2016年获得上亿元C轮融资，最后选择通过计算机视觉技术与NLP技术的结合，制造出能“识别万物”的智能机器人，提供硬件模组，里面内置他们家的算法。目前正在准备启动IPO的步伐，VIE架构让他们得以绕过A股，不用达到连续三年盈利的标准实现快速上市。

（2）商汤科技：

　　SenseTime（商汤科技），获IDG资本投资，主攻金融、移动互联网、安防监控三大行业；由香港中文大学的汤晓欧创建，“商汤”中的汤指的就是汤晓欧本人，汤晓鸥及其研究团队所开发的DeepID算法率先将深度学习应用到人脸识别上，在技术指标上实现了新的突破。主要案例是围绕各个美化软件与直播平台制作人脸贴图，重点强化了人脸识别的关键点检测及跟踪技术。

　　团队有300多号，也从当初toC转向toB领域；成立于2014年的商汤科技选择另辟蹊径，选择用“四大美女”这个话题让人们躁动起来，到最后四大美女走了三个；商汤的网络都是自己设计的，这样对于深度学习网络的掌控力就会更强，提供SaaS服务的同时，可以通过SaaS把背后的数据拿到，再进行更多更细致的分析再次提升服务质量。

（3）云从科技：

　　2015年4月，周曦拿到战略投资成立云从科技，同年针对金融和银行业推出了40多种解决方案，包含从算法、产品、销售、售后的全产业链打造，针对农行、建行、交行、中行及多地公安提供定制化服务。团队成员除了来自中科大的校友外，还来自中国科学院各大研究所、UIUC、IBM、NEC、MicroSoft等全球顶尖学府及研究机构。

　　截止2016年11月，成立一年半，研发团队扩展为200余名，核心产品是人脸识别系统及IBIS集成生物识别平台，还具备3D模型、红外活体、静默活体等技术，可根据场景需求自由调节。选择连接硬件、开发与技术，属于全产业链模式，因为人脸识别系统多数情况下需要深度定制，只有这样，才能在客户提出需求的情况下迅速反馈，修改，统一用户体验。

（4）依图科技：

　　2012 年九月，朱珑与他的好友林晨曦在创立依图科技，这家从事人工智能创新性研究的创企从图像识别入手，首先与全国省市级公安系统合作，对车辆品牌、型号等进行精准识别，随后扩展到人像识别，通过静态人像比对技术和动态人像比对技术，协助公安系统进行人员身份核查、追逃、监控、关系挖掘等。

　　发展近6年，依图科技的产品已经应用到全国二十多个省市地区的安防领域，安防领域之外，依图也进入智慧城市领域和健康医疗领域，它要协助政府构建"城市大脑"，也希望将医疗领域的巨大知识鸿沟缩小，改善医患体验。

（5）细分领域对比表

（6）主要客户对比

4. 商业模式

4.1 人脸识别商业模式设计步骤

4.2 人脸识别盈利模式

03 人脸识别的流程及主要技术

1. 人脸识别系统组成

2. 人脸识别的一般流程

2.1 人脸采集

（1）简介

　　不同的人脸图像通过摄像镜头采集得到，比如静态图像、动态图像、不同的位置、不同表情等，当采集对象在设备的拍摄范围内时，采集设备会自动搜索并拍摄人脸图像。

（2）人脸采集的主要影响因素

图像大小：人脸图像过小会影响识别效果，人脸图像过大会影响识别速度。非专业人脸识别摄像头常见规定的最小识别人脸像素为60*60或100*100以上。在规定的图像大小内，算法更容易提升准确率和召回率。图像大小反映在实际应用场景就是人脸离摄像头的距离。
图像分辨率：越低的图像分辨率越难识别。图像大小综合图像分辨率，直接影响摄像头识别距离。现4K摄像头看清人脸的最远距离是10米，7K摄像头是20米。
光照环境：过曝或过暗的光照环境都会影响人脸识别效果。可以从摄像头自带的功能补光或滤光平衡光照影响，也可以利用算法模型优化图像光线。
模糊程度：实际场景主要着力解决运动模糊，人脸相对于摄像头的移动经常会产生运动模糊。部分摄像头有抗模糊的功能，而在成本有限的情况下，考虑通过算法模型优化此问题。
遮挡程度：五官无遮挡、脸部边缘清晰的图像为最佳。而在实际场景中，很多人脸都会被帽子、眼镜、口罩等遮挡物遮挡，这部分数据需要根据算法要求决定是否留用训练。
采集角度：人脸相对于摄像头角度为正脸最佳。但实际场景中往往很难抓拍正脸。因此算法模型需训练包含左右侧人脸、上下侧人脸的数据。工业施工上摄像头安置的角度，需满足人脸与摄像头构成的角度在算法识别范围内的要求。

2.2 人脸检测

（1）简介

　　在图像中准确标定出人脸的位置和大小，并把其中有用的信息挑出来（如直方图特征、颜色特征、模板特征、结构特征及Haar特征等），然后利用信息来达到人脸检测的目的。

（2）人脸关键点检测（人脸对齐）

　　自动估计人脸图片上脸部特征点的坐标。

（3）主流方法

　　基于检测出的特征采用Adaboost学习算法（一种用来分类的方法，它把一些比较弱的分类方法合在一起，组合出新的很强的分类方法）挑选出一些最能代表人脸的矩形特征（弱分类器），按照加权投票的方式将弱分类器构造为一个强分类器，再将训练得到的若干强分类器串联组成一个级联结构的层叠分类器，有效地提高分类器的检测速度。

　　最近人脸检测算法模型的流派包括三类及其之间的组合：viola-jones框架（性能一般速度尚可，适合移动端、嵌入式上使用），dpm（速度较慢），cnn（性能不错）。

2.3 人脸图像预处理

（1）简介

　　基于人脸检测结果，对图像进行处理并最终服务于特征提取的过程。

（2）原因

　　系统获取的原始图像由于受到各种条件的限制和随机干扰，往往不能直接使用，必须在图像处理的早期阶段对它进行灰度矫正、噪声过滤等图像预处理。

（3）主要预处理过程

　　人脸对准（得到人脸位置端正的图像），人脸图像的光线补偿，灰度变换、直方图均衡化、归一化（取得尺寸一致，灰度取值范围相同的标准化人脸图像），几何校正、中值滤波（图片的平滑操作以消除噪声）以及锐化等。

2.4 人脸特征提取

（1）简介

　　人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的，也称人脸表征，它是对人脸进行特征建模的过程

（2）人脸特征提取的方法

基于知识的表征方法（主要包括基于几何特征法和模板匹配法）：根据人脸器官的形状描述以及它们之间的距离特性来获得有助于人脸分类的特征数据，其特征分量通常包括特征点间的欧氏距离、曲率、和角度等。人脸由眼睛、鼻子、嘴、下巴等局部构成，对这些局部和他们之间结构关系的几何描述，可作为识别人脸的重要特征，这些特征被称为几何特征。
基于代数特征或统计学习的表征方法：基于代数特征方法的基本思想是将人脸在空域内的高维描述转化为频域或者其他空间内的低维描述，其表征方法为线性投影表征方法和非线性投影表征方法。基于线性投影的方法主要有主成分分析法或称K-L变化、独立成分分析法和Fisher线性判别分析法。非线性特征提取方法有两个重要的分支：基于核的特征提取技术和以流形学习为主导的特征提取技术。

2.5 匹配与识别

　　提取的人脸特征值数据与数据库中存贮的特征模板进行搜索匹配，通过设定一个阈值，将相似度与这一阈值进行比较，来对人脸的身份信息进行判断。

3. 人脸识别的主要方法

3.1 Eigen Face（特征脸）

　　MIT实验室的特克（Turk）和潘特（Pentland）提出的“特征脸”方法无疑是这一时期内最负盛名的人脸识别方法。其后的很多人脸识别技术都或多或少与特征脸有关系，现在特征脸已经与归一化的协相关量(Normalized Correlation)方法一道成为人脸识别的性能测试基准算法。

人脸识别特征脸算法文档：

https://blog.csdn.net/zizi7/article/details/52757300

3.2 Fisher Face（渔夫脸）

　　贝尔胡米尔（Belhumeur）等提出的 Fisherface 人脸识别方法是这一时期的另一重要成果。该方法首先采用主成分分析（PCA）对图像表观特征进行降维。在此基础上，采用线性判别分析（LDA）的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该方法目前仍然是主流的人脸识别方法之一，产生了很多不同的变种，比如零空间法、子空间判别模型、增强判别模型、直接的LDA 判别方法以及近期的一些基于核学习的改进策略。

Fisher Face算法文档：

https://blog.csdn.net/zizi7/article/details/52999432

3.3 EGM（弹性图匹配）

　　其基本思想是用一个属性图来描述人脸：属性图的顶点代表面部关键特征点，其属性为相应特征点处的多分辨率、多方向局部特征——Gabor变换12特征，称为Jet；边的属性则为不同特征点之间的几何关系。对任意输入人脸图像，弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点，同时提取它们的Jet特征，得到输入图像的属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。该方法的优点是既保留了面部的全局结构特征，也对人脸的关键局部特征进行了建模。

弹性图匹配算法文档：

https://blog.csdn.net/real_myth/article/details/44828219

3.4 基于几何特征的方法

　　几何特征可以是眼、鼻、嘴等的形状和它们之间的几何关系（如相互之间的距离）。这些算法识别速度快，需要的内存小，但识别率较低。

3.5 基于神经网络的方法

　　神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等。这类方法同样需要较多的样本进行训练，而在许多应用中，样本数量是很有限的。

3.6 基于线段Hausdorff 距离(LHD) 的方法

　　心理学的研究表明，人类在识别轮廓图（比如漫画）的速度和准确度上丝毫不比识别灰度图差。LHD是基于从人脸灰度图像中提取出来的线段图的，它定义的是两个线段集之间的距离，与众不同的是，LHD并不建立不同线段集之间线段的一一对应关系，因此它更能适应线段图之间的微小变化。实验结果表明，LHD在不同光照条件下和不同姿态情况下都有非常出色的表现，但是它在大表情的情况下识别效果不好。

3.7 基于支持向量机(SVM) 的方法

　　近年来，支持向量机是统计模式识别领域的一个新的热点，它试图使得学习机在经验风险和泛化能力上达到一种妥协，从而提高学习机的性能。支持向量机主要解决的是一个2分类问题，它的基本思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。通常的实验结果表明SVM有较好的识别率，但是它需要大量的训练样本（每类300个），这在实际应用中往往是不现实的。而且支持向量机训练时间长，方法实现复杂，该函数的取法没有统一的理论。

4. 技术发展方向

结合三维信息：二维和三维信息融合使特征更加鲁棒
多特征融合：单一特征难以应对复杂的光照和姿态变化
大规模人脸比对：面向海量数据的人脸比对与搜索
深度学习：在大数据条件下充分发挥深度神经网络强大的学习能力

5. 人脸识别数据库

Yale人脸数据库
ORL人脸数据库
CMU PIE人脸数据库
FERET人脸数据库
MIT数据库
BANCA人脸数据库
CAS-PEAL人脸数据库
JAFE表情数据库
Cohn-Kanade表情数据库
MMI表情数据库

6. 技术指标

6.1 人脸检测中的关键指标

　　例子：在摄像头某张抓拍图像中，一共有100张人脸，算法检测出80张人脸，其中75张是真实人脸，5 张是把路标误识为人脸。

检测率：识别正确的人脸/图中所有的人脸。检测率越高，代表检测模型效果越好。
误检率：识别错误的人脸/识别出来的人脸。误检率越低，代表检测模型效果越好。
漏检率：未识别出来的人脸/图中所有的人脸。漏检率越低，代表检测模型效果越好。
速度：从采集图像完成到人脸检测完成的时间。时间约短，检测模型效果越好。

在这个实际案例中：检测率=75/100误检率=5/80漏检率=（100-75）/100

6.2 人脸识别中的关键指标

　　1000张样本图片里，共600张正样本。相似度为0.9的图片一共100张，其中正样本为99张。虽然0.9阈值的正确率很高，为99/100；但是0.9阈值正确输出的数量确很少，只有99/600。这样很容易发生漏识的情况。

检测率：识别正确的人脸/图中所有的人脸。检测率越高，代表检测模型效果越好。
误检率：识别错误的人脸/识别出来的人脸。误检率越低，代表检测模型效果越好。
漏检率：未识别出来的人脸/图中所有的人脸。漏检率越低，代表检测模型效果越好。
速度：从采集图像完成到人脸检测完成的时间。时间约短，检测模型效果越好。

　　在这个实际案例中：检测率=75/100 误检率=5/80 漏检率=（100-75）/100

6.3 人脸识别中的关键指标

精确率（precision）：识别为正确的样本数/识别出来的样本数=99/100
召回率（recall）：识别为正确的样本数/所有样本中正确的数=99/600
错误接受率/认假率/误识率（FARFalse Accept Rate）：

定义：指将身份不同的两张照片，判别为相同身份，越低越好
FAR = NFA / NIRA
式中 NIRA 代表的是类间测试次数，既不同类别间的测试次数，打比方如果有1000个识别模型，有1000个人要识别，而且每人只提供一个待识别的素材，那 NIRA=1000*(1000-1) 。NFA是错误接受次数。
FAR决定了系统的安全性，FRR决定了系统的易用程度，在实际中，FAR对应的风险远远高于FRR，因此，生物识别系统中，会将FAR设置为一个非常低的范围，如万分之一甚至百万分之一，在FAR固定的条件下，FRR低于5%，这样的系统才有实用价值。

错误拒绝率/拒真率/拒识率（FRR False Reject Rate）：

定义：指将身份相同的两张照片，判别为不同身份，越低越好
FRR = NFR / NGRA
上式中NFR是类内测试次数，既同类别内的测试次数，打比方如果有1000个识别模型，有1000个人要识别，而且每人只提供一个待识别的素材，那 NIRA=1000，如果每个人提供N张图片，那么 NIRA=N*1000 。NFR是错误拒绝次数。

04 行业应用

1. 人脸识别（FR）+其他行业

1.1 FR+金融

（1）实名认证

　　金融机构传统上使用人工肉眼判断、短信验证、绑定银行卡等手段进行实名认证。这些传统手段存在准确率不高、客户体验较差、成本高等问题，对金融企业业务发展造成了巨大的困扰。基于人脸识别的实名认证方式具有准确率高（一亿人中才存在两人长相相同）、客户体验好（认证速度快、客户操作少）、成本低（相较于传统认证方式）的优点，已被众多领先金融企业所采用。

（2）人脸识别在银行远程开户上的应用

　　在远程开户时，金融机构可以通过智能终端在线上进行身份鉴权验证，使用人脸识别技术开户可以极大提升业务办理的安全性、时效性，并节省大量人力。

（3）刷脸取款

　　在这方面人脸取代了银行卡，只需要人脸+密码即可完成取款。在前两个方面，人脸识别技术已经被国内各大银行广泛采用，刷脸取款方面，农行和招行抢先一步在ATM上线了刷脸取款功能。

1.2 FR+医疗

（1）重点应用

打击涉医犯罪，确保就诊安全。建立有针对性的涉医犯罪人员布控库，与属地公安部门配合，进行实时布控。
管控职务犯罪，控制不当竞争。对进入医院诊疗区域的医药代表进行管控，协助解决药品流通领域经营不规范、竞争失序等问题。
杜绝职业医闹，保护人身安全。打击频繁出现的职业医闹，提高事件的响应速度，从被动响应变为主动预防。
规范就诊流程，和谐医患关系。重点防范黄牛、医托等干扰正常就诊秩序的特殊人群。
加强监管力度，维护医保基金。实现就诊病人与医保信息库中身份证照的比对，杜绝冒用医保卡的现象。
易肇事肇祸严重精神障碍患者管控。结合“雪亮工程”，确保严重精神障碍患者流入地、流出地发现管控到位。

（2）人脸识别在医疗行业的应用突破基于三点

获取到目标对象的信息：因为行政体系不同，医疗行业想获取到目标对象信息存在较大困难，需相关行政单位进行关键的协调工作。目标对象信息包含但不局限于：人脸照片、人像照片、人员基本信息、人员动态等。
人脸识别的算法进一步提升：目前的人脸识别算法的精度已经达到了相当高的水准，误报、漏报均已控制在可接受范围；更近一步的算法，可以从非结构化的视频/图片中获取更多的价值信息，从更多地维度来实现不同的应用。
管理者思维和水平的提升：人工智能、人脸识别是革命性颠覆性的技术，可以给医疗行业带来巨大的提升。如何将人脸识别真正应用到医疗行业的各方各面需要管理者与技术提供方一起拓展思维、共同努力。

（3）人脸识别在医疗行业的前景

对接公安视频监控、医警联动平台：系统满足公安现有标准要求，后续可与公安机关视频监控、医警联动等平台进行无缝对接，将报警信息及关联的视频、图片推送给辖区派出所，实现联动。
人脸身份查证：输入目标人员照片，即可知道此人身份及其是否属于重点管控人员，是否曾经来过医院，及其出现时间、频次。可用于筛查可疑人员，找到其活动规律。
人员轨迹回放：输入目标人员照片，即可查询此人是否来过医院，到过哪些地方。此功能可还原特定人员的行动轨迹，用于嫌疑人行为研判和事后取证。
对接门禁系统：与门禁系统对接，预留刷脸开门、人脸考勤等高级功能，方便办公区、手术室、药品库、住院部等区域的出入管理。
对接刷卡系统：与二代证、医保卡等刷卡系统对接，将采集的人脸照片与证件上存储的照片进行比对，验证刷卡人的真实身份。

1.3 FR+新零售

（1）应用人脸识别的优势

为重点客户画像：帮助卖家获得顾客和潜在顾客更精准的信息，构建用户画像。可以安装在超市、商场、门店等入口，统计每天进入门店的人数、大致年龄和性别等;另一种可以安装在货架上，分析客户的关注点和消费习惯等。通过大数据分析挖掘回头客，提升客户提袋率和VIP转化率；
为零售商降本增益：以智能化系统来代替人工，以人脸识别系统连接支付端来代替收银员，能跟快实现零售店的导流和商品人流分析等。
减少突发事件的产生：门店遇到商品失窃的突发事件，通过对所获数据的分析，也可以将不良客户拉入“黑名单”或是降低其信用水平。
完美连接线上线下：识别系统获得的用户偏好还能反哺线上，将所得数据通过线上反馈给厂商，助力于厂商更全面地了解消费者需求，进而精准地研发产品，设计营销策略。这些都是完美实现新零售“打通线上线下”内在要求的极佳方式。

（2）人脸识别的安全隐患

人脸特征容易被复制：众所周知，破解密码的最常用手段是复制，通过窃取数字密码以及套取指纹来解密的案例己经不胜枚举。与记录在大脑中或其他介质上面的数字密码相比，暴露在外面的人脸更容易被复制。通过拍照完全可以获得一个人的脸部特征并进行复制，利用整容技术或者用照片识别等欺诈的方法可以骗过人脸支付系统。
个人信息泄露问题：在科技发达的今天，人们似乎很轻易就可以通过无孔不入的渠道查到消费者的各种信息。而对于刷脸支付来讲，像人脸特征这种人体密码一旦交给别人保管，个人信息的安全系数将如何确保？获取用户的面部特征是否会涉及到个人隐私？基于面部扫描系统的支付在普遍应用之后会不会带来基于位置服务造成的个人行踪泄露？

1.4 FR+安防

（1）智慧城市的基础

视频分析：基于视频中的人脸照片进行远距离、快速、无接触式的重点人员布控预警。让应用于车站、机场、地铁等重点场所和大型商场超市等人群密集的公共场所视频监控系统能够对视频图像进行采集、自动分析、抓取人脸实时比对，主动在监控场景中识别重点关注人员，实现重点人员的布控和识别。
重要场所的布控：对机场、车站、港口、地铁重点场所和大型商超等人群密集公共场所进行布控，以达到对一些重点人员的排查，抓捕逃犯等目的。
静态库或身份库的检索：对常住人口、暂住人口的人脸图片进行预先建库，通过输入各种渠道采集的人脸图片，能够进行比对和按照相似度排序，进而获悉输入人员的身份或者其他关联信息，此类应用存在两种扩展形式，单一身份库自动批量比对并发现疑似的一个人员具有两个或以上身份信息的静态库查重，两个身份库之间自动交叉比对发现交集数据的静态库碰撞。
动态库或抓拍库的检索：对持续采集的各摄像头点位的抓拍图片建库，通过输入一张指定人员的人脸图片，获得其在指定时间范围和指定摄像头点位出现的所有抓拍记录，方便快速浏览，当摄像头点位关联GIS系统，则可以进一步的按照时间顺序排列检索得到的抓拍记录，并绘制到GIS上，得到人员运动的轨迹。

（2）反恐行动的助力

　　现在新疆、西藏等城市都将人脸识别作为基础设施建设领域的投资重点，由于人员复杂、居住人口相对混乱等因素，这些城市成为了恐怖袭击等违法犯罪行为的高发场所。而人脸识别技术采用人脸检测算法、人脸跟踪算法、人脸质量评分算法以及人脸识别算法。实现城市居住人员人脸的抓拍采集、建模存储，实时黑名单比对报警和人脸后检索等功能。能及时在危险发生之前制止。

（3）儿童安全的保镖

　　近年来儿童拐卖活动越来越猖獗，为了更好的保护儿童安全，有些幼儿园、小学在门口已经安装上了面部识别系统。系统采用人脸识别加IC/ID卡(非接触式智能卡) 双重认证：每一位幼儿在入学注册时进行相关登记：资料、面像、IC/ID卡号、接送者、接送者面像。

　　每次入园时刷卡进行报道，放学时刷卡并进行接送家长人脸认证，如果认证失败拍照后即报警通知管理员，如果认证成功即拍照放行。不论识别成功与否，系统都会记录下被识别者图像。每一次接送都有详细的时间、接送人员的照片可供查询。另外系统提供短信提示的扩展功能，家长可在手机上看到人脸识别认证时所拍的照片，从而监控到接送这个过程，从其中一个重要源头杜绝了儿童被拐的可能性。

（4）智慧酒店的管理

以前开房登记流程是：接待人员问询——身份证扫描确认——支付押金——选房层发房卡——打印纸质票据，这些流程非常繁杂，尤其是身份认证耗时最长，若遇到团队入住情况则更为复杂，身份证识别设备可能会因高频使用出现故障，而急于进房间休息的顾客却只能在前台等待手续完成，客户体验非常糟糕。

　　人脸识别技术就能很好的解决这一难题，帮助酒店实现系统化业务管理和一站式共享解决方案。智慧酒店的安防系统利用人脸识别技术，当顾客走到前台时系统已经自动根据顾客被摄像头捕捉到的影像调取顾客身份核对。整个验证核对过程简单、快速且实现了自动化，更大幅降低了人工识别造成的误差。而且，针对酒店VIP客人，系统可实时对比酒店大堂的摄像头影像和登记在酒店基础系统中的VIP面部数据，当VIP客人到达时，酒店可第一时间提供个性化周到服务，提高客户的满意度。

1.5 FR+公安

寻人寻亲：对老百姓或其他业务部门提供的照片，直接送入系统进行比对、检索、筛选，最后人工确认。
派出所挡获违法人员：对派出所挡获的人员，登记笔录，对于其中一些少数民族、聋哑人或保持沉默者等无法查证身份的人员，可拍摄照片送入各种照片库中比对，排查涉及大案要案人员，以免漏网；或查证其前科，累计处理。
查证无名尸源：需要查证无名尸源时，先拍摄正面照片，送入计算机，如果照片闭眼、破损或变形，可用人像合成系统或人工绘制一幅标准照，送入比对系统比对查证。
目击者描述排查：获得现场目击者对嫌疑人的形象描述后，可用人像合成系统进行排查。
视频监控照片：一般监控系统针对场景，得到的涉案嫌疑人的图像都有模糊、偏转、逆侧光等质量不佳问题，这时需要根据图像用人像合成系统或人工绘制一幅标准照，送入照片比对系统比对查证。
公共场所集会：在政府、球场等公共场所，时常会有人员滋事，此时公安民警不便直接带人处理，可以采用长焦摄像机拍摄特写镜头，如果效果不够好可以用人像合成系统修正，送入比对系统比对查证。
一代/二代居民身份证识别：根据犯罪人员的身份证照片信息，与系统照片库中的信息资料进行比对，提取出与证件上照片相似的人员信息，能充分利用现有的二代身份证照片资源，为公安部门的工作提供高效有利的帮助。
其他应用：常住人口的比对查询、暂住人口的比对查询、重点人口的比对查询、CCIC在逃人员的比对查询等。

1.6 FR+商业场景

访客登记：访客到访公司，于平板电脑进行访客信息登记，由摄像头自动抓取人脸，通过系统打印出访客贴纸；
识别迎宾：公司员工，贵宾进入公司入口，摄像头能识别到访人员，实现门禁功能管理；
人脸识别考勤：通过入口处的前台平板电脑进行人脸识别考勤，也可通过手机端进行人脸识别考；
智能生活：较多的园区、楼宇需要人脸门禁系统，人员进出快速通行，便于管理住户、访客的进出记录；
智慧教育：为严防替考事件的发生，确保考试安全，人脸识别可加强考试入场环节的考生身份认证，并有效实现智能视频监考、作弊防控等；
智慧商场：利用人脸识别技术追踪并分析商场内的人流属性，人群分布等。

　　应用模式典型具体应用特点说明应用领域：

2. FR的部分应用

2.1 人脸检测跟踪

（1）应用

　　商场客流跟踪分析，地铁、火车站、会场、机场等场所的可疑人员的跟踪检测，体育赛事的现场监控等。

（2）难点

　　多人脸跟踪、远场识别人脸、背景复杂、低质量图片人脸识别（算法预处理），还有侧脸（3D重建人物全面），遮挡，模糊，表情变化、强弱光（多特征融合增强抗干扰力）等各种实际环境。

（3）建议

　　远场识别（可依据距离识别）、背景复杂（可虚化无关场景，凸显主角）。

2.2 人脸关键点定位

（1）应用

　　可用于图片的合成、动态图片的分析（直播行业鉴黄、鉴暴），通过关键点分析人脸表情情绪。

（2）难点

　　大角度侧脸，表情变化、遮挡、模糊、明暗等，动静态关键点捕捉。

（3）建议

　　对模糊部位可进行平滑处理，根据眼睛、嘴的特点建立不同的区域块等。

2.3 人脸身份认证

（1）应用

　　关键性应用（金融身份认证、海关检查、火车站和机场等进站），非关键性应用（智慧小区居民进出、办公大楼进出、公司单位上班打卡等）

（2）难点

　　年轻时的证件照和本人识别匹配、戴眼镜和未戴眼镜、侧脸和正脸、表情、背景干扰、整容后、双胞胎及长相类似等。

（3）建议

　　可基于三维人像分析避免认证时的假冒，动作分析等。（旷视的难以区分蜡像、海报和真人）

2.4 人脸属性（性别、年龄、种族、表情、饰品、胡须、面部动作状态）

（1）人脸表情识别（Face expression recognition 简称FER）

普遍认为人类主要有六种基本情感：愤怒（anger）、高兴（happiness）、悲伤（sadness）、惊讶（surprise）、厌恶（disgust）、恐惧（fear）。而大多数表情识别是基于这六种情感及其拓展情绪实现的
主要困难点是：

表情的精细化程度划分：每种情绪最微弱的表现是否需要被分类。分类的界限需要产品给出评估规则。
表情类别的多样化：是否还需要补充其他类别的情绪，六种情绪在一些场景下远不能变现人类的真实情绪。因此除了基本表情识别外，还有精细表情识别、混合表情识别、非基本表情识别等细致领域的研究。
缺少鲁棒性

（2）人脸性别识别

　　性别分类是一个典型的二类问题，人脸性别分类问题需要解决的两个关键问题是人脸特征提取和分类器的选择。人脸性别识别其实仅能识别到人脸外貌更偏向于女性还是男性，很难对女生男相、男生女相进行正确判断。

（3）人脸年龄识别

难点：单人的不同年龄段识别和多人的不同年龄段识别，人脸年龄识别常和人脸识别进行组合识别，能更正确的判断在一定年限内“是否是一个人”的问题；除了以上内容，还有是否戴眼镜、头发长度、肤色等。
建议：识别年龄无变化的人脸用分类即可，而对年龄变化的人脸识别方法是通过年龄模拟，将测试图像和查询库中的图像变换到某一共同的年年龄，从而去除年龄不同的影响，使识别在年龄相同的人脸图像进行。

（4）人脸属性的应用

　　根据物理属性（性别、年龄、种族、眼镜颜值等）可用于广告定向投放、个性化智能推荐、顾客分析、婚恋交友等；化学属性（面部动作、情绪等）可用于即时视频社交、图片合成、图片美化等。

（5）识别建议

　　人脸属性分析时，可利用K-近邻算法匹配云端库里的类似照片后再对相似属性进行分析。

2.5 人脸聚类

　　（1）应用：个性化相册管理、照片分享社交、婚恋交友相似脸型匹配推荐兴趣社交等。

　　（2）难点：角度、光线、发型、相似脸型等干扰分类。

　　（3）建议：可基于一张正脸照片，将其他照片进行依次比对分析后再分类等（智能相册、婚恋社交）。

2.6 真人检测

　　（1）应用：银行开户验证、车站、机场、公司打卡等。

　　（2）难点：2D和3D的识别检测、真人与蜡像、硅胶假冒人脸识别、照片和真人识别检测验证等。

　　（3）建议：可基于三维人像分析避免认证时的假冒等，动态识别验证以区分假象（旷视的难以区分蜡像、海报和真人）。

2.7 人像美颜/美妆

　　（1）应用：兴趣社交、婚恋交友、图像合成、个性化用品推荐和广告投放等。

　　（2）难点：美颜与一般滤镜效果的区别、美颜后的自然效果等。

　　（3）建议：基于数据集的算法更新迭代。

2.8 人体关键点（CPM、DeeperCut）

　　（1）应用：关键动作抓拍、人体姿态估计、舞蹈难度评定。

　　（2）难点：多目标关键点定位、关键点遮挡、光线强弱等。

　　（3）建议：关键点遮挡（分块处理、三维构建找寻关键点）

3. FR的商业化

3.1 从时间上看商业化的不同阶段

3.2 从业务场景上看

　场景关键点：

盘子够大，支撑公司发展
数据回流，为公司所用
高频使用，需求占比高
可在行业中复制

3.3 垂直行业人脸解决方案（地产行业为例）

（1）地产行业分布

商业地产：办公楼宇+园区厂区+商业零售+酒店
住宅地产：生活小区+公寓

（2）地产行业的市场规模

（3）演变方向及客户痛点

视频监控：传统视频监控厂家正在进行智能化转型，从原先的“监控”视频，到现在的“读懂”视频当中的人、车、物、事；
门禁控制：传统门禁控制领域价值链低，所有厂家正在寻求新的方式来转型，绝大部分都在生物识别方式上进行摸索；人脸识别面板机、闸机及其它通行道闸雨后春笋般出现；
楼宇对讲：普通楼宇对讲功能已无法满足使用要求，结合人脸识别功能的门禁系统需求越来越多；
防盗告警：通过智能化手段，达到降本增效目的，已成为防盗告警、巡更检查等功能的重点迭代方向；
可视化系统：降低非专业人士的使用难度，使得多方数据为“我”所用，为多种决策提供依据；信息孤岛问题亟待解决，万物互联已是所有厂家达成的共识。
信息孤岛问题（痛点）：

智能化系统种类繁多，系统之间无法实现无缝连接，综合管理难度大，效率低；
智能化子系统数据采集离散，标准不一，数据价值大打折扣，无法为管理提供决策依据和帮助；
各子系统依靠人工管理，人员配备要求高、劳动强度大，人工成本居高不小；
绝大多数B端客户不懂具体业务或细节，需要具象化、可视化系统呈现。

（4）建设步骤及架构

步骤：

第一步：人员通信管理

基于人员通行管理的平台系统（功能性产品+后台系统管理）
员工、VIP、访客、陌生人、黑名单等人员权限管理；

第二步：传感网络融合

CCTV、车辆等；
基于“人员”、“车”、“监控”的三位一体智慧建筑场景应用；
其他子系统模块链接，形成整体传感网络，智能物联；

第三步：商业地产+新零售

人员、车辆、CCTV三功能在工作+消费场景融合；
构建以人为核心的商业综合体运营方案。

整体IoT架构：

（5）影响因素与优化方案

决定监控系统性能的几个主要因素：

模板库的人数：不宜大，包含关键人物即可；
经过摄像头的人数：同时出现在摄像头的人数决定了单位时间里的比对次数；
报警反馈时间：实时性越强，对系统性能要求越高；
摄像头采集帧数：帧数越高，人员经过摄像头前采集的次数越多，比对的次数也越多。

实战中的优化方案：

使用更先进的高清摄像头（3-5百万）；
室内均匀光线，或室外白天，无侧光和折射光；
人群面向同样的方向，朝向相机的方向运动；
恰当的监控点，如走廊、巷子或安检门/闸机口等（不要一群人同时出现）；
相机与人脸的角度小于20度。

3.4 顶尖公司的应用举例

　　（1）Google：2011年07月谷歌收购人脸识别软件公司PittPatt

　　（2）Facebook：2012年6月 Facebook收购以色列脸部识别公司Face.com

　　（3）微软：2012年6月微软亚洲研究院发布人脸检测算法，面部识别系统

　　（4）网易：2012年5月，网易人脸识别系统全国公测，用于邮箱登陆

　　（5）百度：2012年12月百度推出人脸识别，基于图像的全网人脸搜索

　　（6）阿里：2015年11月，在推出支付宝刷脸认证付款

　　（7）腾讯：2012年下半年，成立优图项目组

05 人脸识别（FR）的产品落地

1. FR技术产品的优势

1.1 非接触

　　人脸图像的采集不同于指纹、掌纹需要接触指掌纹专用采集设备，指掌纹的采集除了对设备有一定的磨损外，也不卫生，容易引起被采集者的反感，而人脸图像采集的设备是摄像头，无须接触。

1.2 非侵扰

　　人脸照片的采集可使用摄像头自动拍照，无须工作人员干预，也无须被采集者配合，只需以正常状态经过摄像头前即可。

1.3 友好

　　人脸是一个人出生之后暴露在外的生物特征，因此它的隐私性并不像指掌纹、虹膜那样强，因此人脸的采集并不像指掌纹采集那样难以让人接受。

1.4 直观

　　我们判断一个人是谁，通过看这个人的脸就是最直观的方式，不像指掌纹、虹膜等需要相关领域专家才可以判别。

1.5 快速

　　从摄像头监控区域进行人脸的采集是非常快速的，因为它的非干预性和非接触性，让人脸采集的时间大大缩短。

1.6 简便

　　人脸采集前端设备——摄像头随处可见，它不是专用设备，因此简单易操作。

1.7 可扩展性好

　　它的采集端完全可以采用现有视频监控系统的摄像设备，后端应用的扩展性决定了人脸识别可以应用在出入控制、黑名单监控、人脸照片搜索等多领域。

2. FR三大识别场景

2.1 人脸确认（1:1）

简介：将某人面像与指定人员面像进行一对一的比对，根据其相似程度来判断二者是否是同一人，相似程度一般以能否超过某一量化阀值为依据。简单的说就是A/B两张照片比对，产生的计算数值是否达到要求。
产品应用：快速的人脸识别比对，移动支付认证、安全性身份核对、作为身份确认的一种新方式，比如考生身份确认、公司考勤确认、各种证件照和本人确认。
实际问题：产品在系统设计的逻辑上，需要先考虑调取已储存对象信息的先验条件。通过界面/语音的提示，使得待认证者预先知道自己正处于被核对的过程中，且已预先了解拟核对对象的身份。
比对来源的三种主要方式：

用户自传照片，比如支付宝的人脸比对，用户自传的照片最大的问题是照片质量的合格率太低，拍照的光线、角度等因素会导致采集源的质量下降，不利于后期的大批量人脸特征码管理。
使用身份证读卡器，读取身份证上的照片，遗憾的是这张照片2K的大小，不过也是目前用最多的源照片提取方式，比较适合签到场合。
使用公安部旗下NCIIC的人脸比对接口（注意，不是网纹照片接口，这个接口已经不对外），使用的是直接的人脸比对接口。

2.2 人脸辨认（1:N）

（1）简介

将某人面像与数据库中的多人的人脸进行比对，并根据比对结果来鉴定此人身份，或找到其中最相似的人脸，并按相似程度的大小输出检索结果。

（2）产品应用

人脸开门、人脸检索，排查犯罪嫌疑人、失踪人口的全库搜寻、一人多证的重复排查等。

（3）实际问题

走失儿童的项目中去：这一类系统的部署需要两个条件：A. BCD基本库（比如1000万人）B.强大的算法硬件
零售店中的刷脸支付长江，需要用户预先输入全手机号，确定用户身份再进行人脸识别，将原本为1:N的问题转化为了1:1的问题。

（4）产品难点

a. 1:N中的N能够支持多大

场景多样化：从一个班级百号人刷脸签到，到一个公司千号人的刷脸打卡，再到一个学校的几万人，一个四线城市几十万人，一个一线城市的几千万人，难度是呈指数上升的。
公司实际情况：目前各家公司的成熟人脸识别应用能够支持几万到几百万人不等的应用场景，而且还有一个错误率的概念。比如，公司宣称千万分之一的错误率的情况下（1/10000000），人脸通过率其实只有93%，这是因为很难做到一定不发生错误，而且每个人都能识别通过。（假如一家公司说自己能做到亿分之一的错误率，通过率能做到98%以上，多半是虚假宣传，在实际使用中是很难达到的）

b. 非配合场景

在配合场景下：比如ATM机刷脸取款，用户会自主配合，将人脸以一个理想的角度通过识别。
而在非配合应用场景下，比如监控视频下的人脸识别，追踪违法犯罪分子的身份信息，情况就要困难得多。这种情况下，用户脸部会发生角度偏大，遮挡，光线不可控等问题。

c. 跨人种，跨年龄识别问题

研究发现，在一个数据集上训练好的模型，想到迁移到另外一个人种上，效果会出现较大程度的下降。另外，人脸随着年龄的变化带来的改变也给人脸识别带来不小的挑战。
要改善这样的问题，一个必要条件是需要建立一个足够完备的跨人种，跨年龄的人脸数据库；在国内的话，是以汉族人为主，同时跨年龄的人脸数据库也比较难收集，需要不短的时间跨度。

d. 产品体验

近来备受关注的刷脸支付，很多时候都会要求用户输入全手机号，或手机号后四位，以缩小用户搜索库大小，实际上这是比较影响体验的。
西安一高校晨读刷脸签到，由于系统实际响应匹配时间过长，导致学生排百米长队。

2.3 多人脸检索（N:N）

（1）简介

　　1：N同时作业就是N:N了，同时相应多张照片检索需求。

（2）实际产品问题中

在视频级N:N的校验中，如果要提高通过率，很多时候是采取降低准确率的方式，降低算法队列数量；同样在一些比赛中为了降低误识率，大大提高了准确率，所以算法在校验的过程中必须遵循至少一个固定标准，追求的是速度效率还是最高准确率。
视频流的帧处理所用，对服务器的计算环境要求严苛，目前的算法系统所支撑的输出率非常有限。

主要的限制如下：

　　海量的人脸照片解析需要大量运算（目前很少看到在采集端直接解析的，都是照片剪裁）海量的人脸照片传输需要大量的带宽（常见的720布控摄像头抓取最小的人脸照片为20K）海量的人脸照片在后台检索需要耗费大量的运算（国内主流主机为例，最多到24路摄像头）。

3. 产品实战中的物理问题

3.1 光照问题

（1）简介

　　光照问题是机器视觉重的老问题，在人脸识别中的表现尤为明显。由于人脸的3D结构，光照投射出的阴影，会加强或减弱原有的人脸特征。

（2）解决思路

　　A、对其进行包括光照强度和方向、人脸反射属性的量化，面部阴影和照度分析等，尝试建立数学模型，以利用这些光照模型，在人脸图像预处理或者归一化阶段尽可能的补偿乃至消除其对识别性能的影响，将固有的人脸属性（反射率属性、3D表面形状属性）和光源、遮挡及高光等非人脸固有属性分离开来。

　　B、基于光照子空间模型的任意光照图像生成算法，用于生成多个不同光照条件的训练样本，然后利用具有良好的学习能力的人脸识别算法，如子空间法，SVM等方法进行识别。

3.2 人脸姿态问题

（1）简介

　　与光照问题类似，姿态问题也是目前人脸识别研究中需要解决的一个技术难点。姿态问题涉及头部在三维垂直坐标系中绕三个轴的旋转造成的面部变化，其中垂直于图像平面的两个方向的深度旋转会造成面部信息的部分缺失。针对姿态的研究相对比较的少，目前多数的人脸识别算法主要针列正面、准正而人脸图像，当发生俯仰或者左右侧而比较厉害的情况下，人脸识别算法的识别率也将会急剧下降。面部幅度较大的哭、笑、愤怒等表情变化同样影像着面部识别的准确率。

（2）解决思路

第一种思路：是学习并记忆多种姿态特征，这对于多姿态人脸数据可以容易获取的情况比较实用，其优点是算法与正面人脸识别统一，不需要额外的技术支持，其缺点是存储需求大，姿态泛化能力不能确定，不能用于基于单张照片的人脸识别算法中等。
第二种思路：是基于单张视图生成多角度视图，可以在只能获取用户单张照片的情况下合成该用户的多个学习样本，可以解决训练样本较少的情况下的多姿态人脸识别问题，从而改善识别性能。
第三种思路：是基于姿态不变特征的方法，即寻求那些不随姿态的变化而变化的特征。中科院计算所的思路是采用基于统计的视觉模型，将输入姿态图像校正为正面图像，从而可以在统一的姿态空间内作特征的提取和匹配。

3.3 遮挡问题

　　对于非配合情况下的人脸图像采集，遮挡问题是一个非常严重的问题。特别是在监控环境下，往往彼监控对象都会带着眼镜，帽子等饰物，使得被采集出来的人脸图像有可能不完整，从而影响了后面的特征提取与识别，甚至会导致人脸检测算法的失效。

3.4 年龄变化

　　随着年龄的变化，面部外观也在变化，特别是对于青少年，这种变化更加的明显。对于不同的年龄段，人脸识别算法的识别率也不同。一个人从少年变成青年，变成老年，他的容貌可能会发生比较大的变化，从而导致识别率的下降。对于不同的年龄段，人脸识别算法的识别率也不同。

3.5 人脸相似性

　　不同个体之间的区别不大，所有的人脸的结构都相似，甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的，但是对于利用人脸区分人类个体是不利的。

3.6 图像质量

　　人脸图像的来源可能多种多样，由于采集设备的不同，得到的人脸图像质量也不一样，特别是对于那些低分辨率、噪声大、质量差的人脸图像(如手机摄像头拍摄的人脸图片、远程监控拍摄的图片等)如何进行有效地人脸识别是个需要关注的问题。同样的，对于高分辨图像对人脸识别算法的影响也需要进一步的研究。

3.7 样本缺乏

　　基于统计学习的人脸识别算法是目前人脸识别领域中的主流算法，但是统计学习方法需要大量的训练。由于人脸图像在高维空间中的分布是一个不规则的流形分布，能得到的样本只是对人脸图像空间中的一个极小部分的采样，如何解决小样本下的统计学习问题有待进一步的研究。

3.8 海量数据

　　传统人脸识别方法如PCA、LDA等在小规模数据中可以很容易进行训练学习。但是对于海量数据，这些方法其训练过程难以进行，甚至有可能崩溃。

3.9 大规模人脸识别

　　随着人脸数据库规模的增长，人脸算法的性能将呈现下降。

3.10 动态识别

　　非配合性人脸识别的情况下，运动导致面部图像模糊或摄像头对焦不正确都会严重影响面部识别的成功率。在地铁、高速公路卡口、车站卡口、超市反扒、边检等安保和监控识别的使用中，这种困难明显突出。

3.11 人脸防伪

　　伪造人脸图像进行识别的主流欺骗手段是建立一个三维模型，或者是一些表情的嫁接。随着人脸防伪技术的完善、3D面部识别技术、摄像头等智能计算视觉技术的引入，伪造面部图像进行识别的成功率会大大降低。

3.12 丢帧和丢脸问题

　　需要的网络识别和系统的计算机识别可能会造成视频的丢帧和丢脸现象，特别是监控人流量大的区域，由于网络传输的带宽问题和计算能力问题，常常引起丢帧和丢脸问题。

3.13 摄像机的头像问题

　　摄像机很多技术参数影响视频图像的质量，这些因素有感光器（CCD、CMOS）、感光器的大小、DSP的处理速度、内置图像处理芯片和镜头等，同时摄像机内置的一些设置参数也将影响质量，如曝光时间、光圈、动态白平衡等参数。

4. 实战中的数据标注

4.1 数据标注

（1）一般来说，数据标注部分可以有三个角色

标注员：标注员负责标记数据。
审核员：审核员负责审核被标记数据的质量。
管理员：管理人员、发放任务、统计工资。

　　只有在数据被审核员审核通过后，这批数据才能够被算法同事利用。

（2）数据标记流程

任务分配：假设标注员每次标记的数据为一次任务，则每次任务可由管理员分批发放记录，也可将整个流程做成“抢单式”的，由后台直接分发。
标记程序设计：需要考虑到如何提升效率，比如快捷键的设置、边标记及边存等等功能都有利于提高标记效率。
进度跟踪：程序对标注员、审核员的工作分别进行跟踪，可利用“规定截止日期”的方式淘汰怠惰的人。
质量跟踪：通过计算标注人员的标注正确率和被审核通过率，对人员标注质量进行跟踪，可利用“末位淘汰”制提高标注人员质量。

4.2 模型训练

　　数据标记完成后，交由算法同学进行模型的训练，期间发现的问题可与产品一起商讨。训练过程中，最好能可视化一些中间结果。一来可以检测代码实现是否有Bug，二来也可以通过这些中间结果，来帮助自己更好的理解这个算法的过程。

4.3 模型测试

　　测试同事（一般来说算法同事也会直接负责模型测试）将未被训练过的数据在新的模型下做测试。

　　如果没有后台设计，测试结果只能由人工抽样计算，抽样计算繁琐且效率较低。模型的效果，需要在精确率（识别为正确的样本数/识别出来的样本数）和召回率（识别为正确的样本数/所有样本中正确的数）中达到某一个平衡。

　　测试同事需要关注特定领域内每个类别的指标，比如针对识别人脸的表情，里面有喜怒哀乐等分类，每一个分类对应的指标都是不一样的。测试同事需要将测试的结果完善地反馈给算法同事，算法同事才能找准模型效果欠缺的原因。同时，测试同事将本次模型的指标结果反馈给产品，由产品评估是否满足上线需求。

（1）测试环境说明

例如：

CPU：Intel(R) Core(TM) i7-4790 CPU @ 3.60 GHz
内存：8GB
系统：Ubuntu 14.04 x86_64/Windows 7 SP1 64bit
GCC版本：4.8.2

（2）测试集和测试需求说明

　　比如“图片包含人脸大小应超过96*96像素，测试结果达到XX程度满足需求。

经典人脸身份识别测试集LFW，共包含13233 张图片 5749 种不同身份；世界记录99.7%。
CK+ （一个人脸表情数据集），包含固定表情和自发表情，包含123个人的593个表情序列。每个序列的目标表情被FACS编码，同时添加了已验证的情感标签（生气、厌恶、害怕、快乐、悲伤、惊讶）。

（3）需要说明“有效距离，左右角度，上下角度，速度”等参数值（范围）

　　注：这和“部署的灵活性”相关——由于不同客户不同场景的需求不同，所以技术方的人脸检测模块，一般可以通过调整参数得到N种亚型，以适应不同应用场景(光照、角度、有效距离、速度) 下对运算量和有效检测距离的需求。

（4）测试结果——欠拟合

定义：模型没有很好地捕捉到数据特征，不能够很好地拟合数据

　　左图表示size与prize关系的数据，中间的图就是出现欠拟合的模型，不能够很好地拟合数据，如果在中间的图的模型后面再加一个二次项，就可以很好地拟合图中的数据了，如右面的图所示。

解决方法

添加其他特征项，有时候我们模型出现欠拟合的时候是因为特征项不够导致的，可以添加其他特征项来很好地解决。例如，“组合”、“泛化”、“相关性”三类特征是特征添加的重要手段，无论在什么场景，都可以照葫芦画瓢，总会得到意想不到的效果。
添加多项式特征，这个在机器学习算法里面用的很普遍，例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。例如上面的图片的例子。
减少正则化参数，正则化的目的是用来防止过拟合的，但是现在模型出现了欠拟合，则需要减少正则化参数。
尝试非线性模型，比如核SVM 、决策树、DNN等模型。

（5）测试结果——过拟合

定义：模型把数据学习的太彻底，以至于把噪声数据的特征也学习到了，这样就会导致在后期测试的时候不能够很好地识别数据，即不能正确的分类，模型泛化能力太差。例如下面的例子。

　　上面左图表示size和prize的关系，我们学习到的模型曲线如右图所示，虽然在训练的时候模型可以很好地匹配数据，但是很显然过度扭曲了曲线，不是真实的size与prize曲线。

解决方法

从产品角度：

重新清洗数据，导致过拟合的一个原因也有可能是数据不纯导致的，噪音太多影响到模型效果，如果出现了过拟合就需要我们重新清洗数据。
增大数据的训练量，还有一个原因就是我们用于训练的数据量太小导致的，训练数据占总数据的比例过小。

从算法角度：

交叉检验，通过交叉检验得到较优的模型参数;
特征选择，减少特征数或使用较少的特征组合，对于按区间离散化的特征，增大划分的区间;
正则化，常用的有 L1、L2 正则。而且 L1正则还可以自动进行特征选择;
如果有正则项则可以考虑增大正则项参数 lambda;
增加训练数据可以有限的避免过拟合;
Bagging ,将多个弱学习器Bagging 一下效果会好很多，比如随机森林等.

4.5 标注流程中遇到的问题

（1）项目过程中的不确定性

a. 出现原因：

　　一般情况下，只要数据标注的规范清晰，对规则的界定从一而终，标注工作的流程还是比较简单的。

　　数据标注规范可能会在测试后根据结果情况进行调整，那么，规则修改前后“数据标注的一致性”就出现了问题，会导致多次返工，在时间和人工成本上颇有影响。

b. 解决方法：

1）如是分类性质的解析工作，建议标注规则先从非常肯定的非黑即白开始；规则设定由简到繁，带有疑虑数据再另外作记号。随着规则一步步深入，可能会出现交叉影响，此时就需要放弃一些低频问题的规则，余下的未标注的数据就根据新的规则标注。
2）如是多类规则同时进行的标注工作，需要把每类规则定得足够细致。
3）实例：

如询问机器人会干什么的语料中出现，“你说你会干什么？”可以理解为询问，也可能是嫌弃，这两类应对的策略不同，有歧义，所以不能把它归纳如询问类，需要把它从训练集里剔除。
如人脸情绪识别中，一个人在流眼泪，有时可以理解为伤心落泪，有时可以理解为喜极而泣，还有时可以理解为激动落泪，甚至是感动落泪等，所以在看到此类照片时，不能简单的凭借惯性化思维将其归纳到悲伤一类中，当人眼都很难判别清楚时，需要把它从训练集里剔除。

5. 实际案例分析

5.1 某领域的人脸识别监测与身份确认

（1）案例问题

　　光照影响：过暗或过亮等非正常光照环境，会对模型的效果产生很大干扰。

（2）解决方案

a. 从产品角度控制

在用户可以更换环境的前提下（比如银行刷脸取钱等），可语音/界面提示用户目前环境不理想（头歪、头发、眼镜等），建议进行正确的正脸取照。
在用户不能控制更换环境的情况下（比如人脸识别、车辆识别等摄像头固定的场景），只能通过调试硬件设施弥补这个问题。
晚上：由于摄像头在晚上会自动切换到黑夜场景（从图片上看就是从彩色切换为黑白），因此在晚上强光下（例如路灯照射）人脸就会过曝，这时，我们可以通过强制设置摄像头环境为白天（图像为彩色）来避免。而过暗的情况，从节省成本角度看，可以在摄像头旁边增加一个光线发散、功率不高的灯来弥补。当然这两个问题也可以通过购买高质量的摄像头解决，但这样做也意味着更高的成本。
白天：白天也会出现光线过亮的情况，这种情况可以考虑用滤光片等等。

b. 从算法角度控制

　　用算法将图片进行处理，可以将图片恢复得让人眼看清的程度。

5.2 某款人脸年龄识别产品

（1）案例问题

　　一款识别人脸年龄的产品对女性某个年龄阶段（25—35）的判断，误差较大，经过发现，是因为该年龄阶段有以下特点：

女性在这个年龄阶段面貌变化不是很大，有时人眼给出的判断误差都很离谱。
在这个年龄层次的女性注重打扮，化妆品很大程度上掩盖了其真实年龄，有时30多的跟20岁没多大差别；C. 精装打扮的和素颜的差别不是很大。

（2）解决方案

补充数据：针对该年龄层次的人脸图片数据做补充。不仅补充正例（“XXX”应为多少岁），还应补充负例（“XXX”不应为多少岁）。
优化数据：修改大批以往的错误标注。
数据总结：对化妆和不化妆的人脸图片进行分析，以便调整算法参数。

（3）需求研究

自拍：如女性群体一般都希望自拍时，年龄的判别在心里预期中能越小越好，当在和一群人自拍中可以适当的将主人公的年龄判别结果调低至达到用户心理满足感。此时可适当降低算法的参照度。
婚恋交友：在婚恋网站交友过程中，双方都希望知道彼此的真实年龄信息，此时运用人脸年龄识别可以分析双方的年龄、皮肤等物理信息为彼此提供参考。此时的信息就不能以达到心理满足感为主了，应当追求准确度。

5.3 某款AR美颜相机

　　（1）无法定位出人脸

　　在背景出现多人或宠物时，相机有时并未能精确定位出目标用户，而定位到背景图片中的人、宠物、身旁的其他人；有时屏幕一片漆黑；有时显示未检测出人脸。

从产品角度：界面提醒用户远离复杂背景，或美颜时最好屏幕中只出现一人，或给出方框图让用户自己手动选择主要定位区域进行AR美颜；屏幕一片漆黑时可提醒用户是否是光线太暗，或是摄像头被障碍物遮挡等；
从算法角度：可对人脸关键点进行定位，计算目标用户与摄像头的距离或计算人脸在频幕的区域占比来确定目标用户（一般几何距离近的、频幕区域占比较大的为美颜目标），结合活体检测来排除背景图片人物的干扰等。

（2）图像模糊昏暗

　　光线太暗、运动、对焦等造成模糊（摄像头距离因素，造成图像低频存在，高频流失等）

从产品角度：可提醒用户在光线较温和的区域进行美颜操作；或是擦除前置摄像头的障碍物；或文字提示动作太快；或是更换高清前置摄像头；或提示对焦失败，给与对焦框图让用户手动对焦等。
从算法角度：在美颜前可在后台中调取手机亮度调节功能，用算法调节光线的亮暗程度以适应美颜所需的物理条件；用算法设法补齐高频部分从，而减少对照片的干扰。

（3）人脸关键动作抓捕太慢

　　在进行AR美颜搞怪时（如张嘴动作，屏幕出现音符、唾沫星子等）对动作抓捕太慢（半天才抓捕到张嘴动作）。

从产品角度：文字提示不支持快速移动或提示缓慢移动（如，亲！您的动作太快了，奴家还未反应过来等）
从算法角度：人脸姿态估计、关键点定位来捕捉人脸动作。

（4）关键位置添加虚拟物品失败（如在嘴上叼烟、耳朵吊耳环、眼镜戴墨镜、脸显红晕）

从产品角度：文字/图片提醒用户摆正人脸位置。
从算法角度：可利用算法对人脸关键区域进行分割并定位，来达到人脸精准定位添加虚拟物品

5.4 人脸开门和人脸检索

（1）人脸开门等跨网方案需要关注的因素

远程算法更新：远程算法更新必然会造成本地局域网功能暂时性无法使用。因此远程算法更新的频率、时间、更新效果都需要产品在更新前精确评估。
增删改人脸数据与本地数据的同步：本地局域网和互联网是无法直接交互的，因此用户在互联网一旦对人脸数据库进行增删改的操作，下发程序的稳定性和及时性都需要重点关注。
硬件环境：本地存储空间的大小和GPU直接影响到本地识别的速度。服务器的稳定性影响到功能地正常使用。
守护程序：断电等外置情况意外情况发生又被处理完善后，程序能自动恢复正常。

（2）人脸检索等某一局域网方案需要关注的因素

速度：除了算法识别需要消耗一定时间外，该局域网下的网速会影响到识别结果输出的速度。
数据库架构：通过检索结果关联结构化数据。
阈值的可配置性：在界面设置阈值功能，从产品层面输入阈值后，改变相对应的结果输出。
输出结果排序：根据相似度排序或结构化数据排序内容地抉择
云服务的稳定性。

5.5 旷视科技官网产品体验（多图预警）

　　（1）年龄略有差距，自我估计+-5，性别基本无误，头部状态略有误差，人种误差在30-40%（样本量10，白种人和黄种人误差明显），情绪基本无误，眼镜种类识别有误差（商品识别的范畴），强光状态下表现不佳。

　　（2）逻辑错误：左眼（睁眼、普通眼镜）、右眼（墨镜）；相似度大（下图为张一山和夏雨）的较难区分（双胞胎估计很难区分）

　　（3）远距离检测较难：左图检测出一张，右图检测出两张（估计10米开外检测不到）

　　（4）能够识别蜡像、海报等非真人场景，因此在一些场合可欺骗摄像头，如在金融领域里的身份识别，海关检查等关键性应用中，将会有风险。

（5）佩戴的口罩无法检测出人脸

（6）公司体验对比结果

6. 项目虚拟实战（以AR美颜APP为例，过程为理论经验推理所得，自己并未实习）

　　人脸检测系统下，有很多FR相关的应用，比如人脸属性识别（年龄、表情、性别、种族等）、人脸美颜/美妆、人脸聚类等等。我们从AR美颜/美妆这一个例子着手，探索项目的具体流程。

6.1 项目前期准备

（1）需求调研

　　场景及痛点：现在大多数美颜相机拍照后，都只有添加各种滤镜、加几个字、变白一点，早已经不能满足广大女性群体对于美颜的需求；加上如今年轻女性和男性的审美标准和猎奇心理都在发生改变，社交方式的趣味性也变得不同，比如原来大家可能在空间、朋友圈、直播上看到美女帅哥都会觉得很吸睛，点赞粉丝直奔而来，但随着快手和抖音的出现，可以发现不仅仅是俊男靓女的照片和视频能引起围观，同样的各种普通群众的搞怪合成视频或合成照片（虚拟的AR特效带来的各种浮夸造型）同样能吸引无数粉丝的追捧，让普通人也能享受被人膜拜的满足感，而这些都需要用到人脸识别的相关技术。

（2）目标用户画像分析

了解目标用户的主流群体：学生（大学生、高中生、初中生）群体对月美颜美妆的心理需求、时尚人士的美妆需求、长相普通的人和长相突出的人对于美颜的心理需求等。
了解用户的年龄组成、地域分布对应美妆的特点。
不同收入群体（白领、金领、蓝领等）的美颜美妆需求关注点。

（3）市场分析

　　美颜美妆的市场规模，产业链，潜在的边际效应利益等。

6.2 文档准备

（1）需求文档

　　详细的分析目前的用户需求，针对不同群体，设计不同的产品解决方案，包括市场的需求文档。

（2）数据文档

　　前期的人脸图片收集、分发、标注总结文档（确定什么样的图片能要，什么样的不能要），各种脸型（长的、宽的、圆的、前额凸出的、眼睛深陷的等等）的分类，多少人完成眼睛美颜图片的分类等。

（3）产品文档

场景落地文档：如听歌时头上戴虚拟耳机，叹气时嘴上叼烟，说话时唾沫星子等针对不同的人脸姿态场景研究可能的落地产品形式。
产品的设计文档：如美颜APP的页面交互设计、导航设计、视觉呈现设计等；直播APP中的弹幕呈现设计、点赞分享按钮设计等。
产品开发流程文档：如PM先提交需求、可行性分析、立项、设计流程、开发流程，算法搭建、模型训练、测试训练等一系列流程的步骤及跟进。
模型训练及测试文档：数据标注好后，喂给算法，搭建人脸识别美颜的模型框架，如前期用成千上万的照片训练机器的人脸关键点定位，让机器找准鼻子、眼睛、耳朵、嘴等位置等。

6.3 数据标注

（1）数据图片的采集

　　在文档的指引下，从公开网站上爬取收集符合模型训练的人脸图片、或是运用公司的数据图片等

（2）数据图片的标注

　　在标注规范文档的指引下，将图片分发给标注团队进行数据的标注，对一些模棱两可的图片，如图片中的人脸较模糊，此时该照片是要还是不要，期间应与算法同事保持沟通，有时暗的图片在算法的优化中能准确识别，这样增加实际情况的容错率（实际中较暗的人脸图像也能定位出关键部位），那么这张图片则视为有效数据；有时较暗的图片经过算法之后并不能达到要求（及无法定位出人脸关键点），此时这照片则视为无效数据，直接剔除；但是标注团队并不知道这张图片是有效还是无效，所以标注过程中，算法同事也需间接参与进来。

（3）数据的反馈

　　在部分图片标注过程后，交于算法同事训练模型调节参数，期间将测试后的数据（精确率和召回率的计算，来反映数据的标注结果）反馈给还在标注的人员，有时可能造成过拟合有时可能造成欠拟合等方便对数据进行重新操作。

6.4 项目流程跟踪

　　（1）产品立项后，每天的任务管理，流程进度跟踪，产出时间管理，开会反馈工作成果等。

　　（2）软硬件端：在开发流程文档的指引下，按照常规的软硬件跟踪开发。

　　（3）算法流程：人脸采集、人脸检测、图像的预处理（模糊的则用算法去模糊等）、人脸特征提取、图像的匹配识别、AR虚拟等。

6.5 项目测试

手机摄像头测试
平台后台程序测序
算法与平台后台测试
模型识别时间、准确率、召回率测试
服务器稳定性测试
网络带宽限制测试
其他平台、硬件产品常规测试
目标用户使用测试

6.6 项目优化

　　经过各种测试之后，针对反馈回来的数据进行产品的优化。

　　如一张嘴就给你来根烟，结果烟插到鼻子上了，这就明显是没有定位到人脸关键点，是数据的原因还是算法的原因，这些都要经过优化处理；经过种子用户测试后，反馈得知这个点赞按钮操作起来有点别扭，应该怎样怎样，这时可能要与设计的同学讨论一下，该怎样优化产品的设计和体验。

6.7 项目验收上线

　　产品按照流程功能进行验收后上线。

　　下面附上总结这篇系列文章的思路导图：

《崛起的超级智能》一书主要阐述当今天人类为人工智能的春天到来而兴奋，为人工智能是否超越人类而恐慌的时候，一个更为庞大、远超人类预期的智能形态正在崛起，种种迹象表明50年来，互联网正在从网状结构进化成为类脑模型，数十亿人类智慧与数百亿机器智能通过互联网大脑结构，正在形成自然界前所未有的超级智能形式。这个新的超级智能的崛起正在对人类的科技，产业、经济，军事，国家竞争产生重要而深远的影响。

作者：刘锋推荐专家：张亚勤、刘慈欣、周鸿祎、王飞跃、约翰、翰兹

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能，互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

你可能感兴趣的:(关于人脸识别的最全研究！)

【MySQL】性能优化实战指南：释放数据库潜能的艺术
文章目录MySQL性能优化实战指南：释放数据库潜能的艺术引言为什么需要MySQL性能优化？性能优化基础知识MySQL性能瓶颈分析1.硬件资源瓶颈2.MySQL内部瓶颈优化配置策略大全内存配置优化InnoDB缓冲池配置查询缓存配置连接和线程配置磁盘I/O优化InnoDB存储引擎配置临时表配置独特优化创意配置创意1：分层存储优化创意2：动态配置自适应创意3：负载感知配置高级优化技巧并行处理优化索引和查
空指针异常是Java中很常见的异常，如何避免？破碎的天堂鸟 Java学习 java 数据库 jvm
在Java编程中，空指针异常（NullPointerException）是一种常见的运行时异常，通常发生在尝试访问一个空对象的属性或调用其方法时。为了避免这种异常，可以采取以下几种方法：在使用对象之前，先判断该对象是否为null。例如：if(obj!=null){//对obj进行操作}这种方法是最直接且最常用的方法。Java8引入了Optional类，它提供了一种更优雅的方式来处理可能为空的对象。
Java:实现朴素模式匹配算法（附带源码） Katie。 Java算法完整教程算法 java python
1.项目背景详细介绍在文本处理、信息检索和生物序列分析等领域，“字符串模式匹配”是最基础也是最核心的操作之一。朴素模式匹配（NaiveStringMatching）算法，作为最直观的实现方式，通过逐个字符对比，查找模式串在目标文本中出现的位置。虽然现代应用中普遍采用更高效的KMP、Boyer–Moore、Sunday算法等，但理解并掌握朴素算法有助于：打牢基础：从最简单的实现入手，帮助初学者理解匹
闺女成长日记3月22日很爱闺女
今天继续和闺女的磨蹭作斗争，下午闺女回家特别开心的告诉我，今天的作业不多又在学校里做了一些，这次是绝对会一个小时就做完。然后又是吃水果又是上厕所的，你要开始写作业吗？她还在那没吃够又想吃奶糖了，看看家里没有了，想要又不敢说，我借机说写作业认真可以吃糖，这娃娃一听眼睛立马就放光了，开始写的时候已经磨叽了半个小时了，写作业再少时间也不够了又着急出门买糖，写作业马虎的错的太多改了好几次，待写完作业已经六
（34）FPGA原语设计（BUFGMUX）宁静致远dream FPGA就业技能 ux 开发语言 r语言
（34）FPGA原语设计（BUFGMUX）1.1目录1）目录2）FPGA简介3）VerilogHDL简介4）FPGA原语设计（BUFGMUX）5）结语1.2FPGA简介FPGA（FieldProgrammableGateArray）是在PAL、GAL等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门
毕业设计基于python + flask +mysql + Layui新闻系统项目源码 love0everything flask python 课程设计
毕业设计基于python+flask+mysql+Layui新闻系统项目源码介绍该项目采用Flask框架开发，数据库采用mysql。这是一个作业项目。该项目采用Flask框架开发的一个新闻、论坛、博客系统。。前端采用的是layui框架，后端模板是X-admin下载地址：毕业设计基于python+flask+mysql+Layui新闻系统项目源码模块版本PyMysql1.0.2Flask1.1.2M
在Java中String类为什么不可以修改？
目录一、语言设计与实现层面的原因二、设计目标与优势三、如何绕过限制？（异常情况）四、替代方案：可变字符串总结在Java中，String类的不可变性（Immutable）是其核心设计之一，这种设计源于多方面的技术考量和实际需求。以下从多个角度解析String为什么不可以修改：一、语言设计与实现层面的原因final修饰类：String类被声明为final，意味着它不能被继承。这避免了子类通过重写方法或
超级实用！汇总pytest中那些常用的参数测试开发Kevin Python 自动化测试测试开发单元测试 pytest
刚开始使用pytest的同学，可能感觉最复杂的点就是其提供的各种参数，丰富的命令行参数在带来了灵活控制测试行为的同时也增加了对于新手的上手难度。在这里，我总结了一下pytest常用参数的分类，并提供详细的使用方法！如果读者是pytest小白，可以参考下面的文章，快速上手pytest：用最精简的例子带您快速了解Pytest框架中最核心的功能-CSDN博客一、基础运行参数指定运行范围pytest运行指
洪武四大案之胡惟庸案鹤舞春风
朱元璋力战陈友谅，在实力悬殊的情况下以少胜多，以弱胜强，奇迹般的取得了胜利，再往后消灭张士诚，拿下日薄西山的元朝统治者，反而越来越轻松了。然后农民出身的和尚朱元璋一不小心当了皇帝。朱元璋是个伟大的开国皇帝，天下一统之后，他励精图治，开拓疆土，征讨大漠，鼓励种田，恢复生产，让这个国家很快从战乱中又变得生机勃勃，走上了强盛之路。朱元璋又是一位残暴的皇帝，这与他的出身和性格密不可分。国家稳定之后，朱元璋
大学生创业有什么扶持政策吗？大学生创业指南古楼
现在很多的高校都鼓励大学生自主创业，也是锻炼大家的创新创意能力。而且也有很多的自主创业可以说是非常有必要的，也是为国家输送更加优质的年轻力量，年轻企业，对国家的发展都是很重要额。那么高校毕业生自主创业有什么政策辅助呢?政府投资开发的孵化器等创业载体应安排30%左右的场地，免费提供给高校毕业生。有条件的地方可对高校毕业生到孵化器创业给予租金补贴。高校毕业生从事个体经营的，自办理个体工商户登记当月起，
新年舞步学习录迎恩
图片发自App听说过“鬼步舞”吧，是不是觉得是小青年的运动，动感的节奏配上烗酷的舞步，踢、点、旋转，跳起来极具喧染力，关健是能减肥。为了减掉爱人的大肚腩，终于在再次去市政府广场散步的时候报名加入。第一天，老师教我们基本小步，一开始就夸我俩姿势正确，学的快。嘿嘿，她不知道这之前我俩已在家就着视频自学了几次。抢跑了，当然上手比较快。只是步伐显的很笨重，好像全身的重量都压在腿上，一小会便会气喘吁吁，汗流
Paimon：Range Partition and Sort优化无主键表（Append-Only Table）查询 lifallen Paimon 数据库大数据数据结构 java apache
这个优化是通过对数据进行全局排序，从而让查询时能够跳过大量不相关的数据文件（DataSkipping），极大地减少I/O，提升查询速度。只需要在执行INSERT语句时，通过OPTIONSHint来启用和配置这个功能即可。RangePartitionAndSortForUnawareBucketTableITCase测试文件本身就是最好的例子。比如测试中的这句SQL：INSERTINTOtest_t
近期书法学习心得德凝
1、看完钱老师视频+做笔记2、微博上看到的书法博主好的内容做笔记3、看黄简老师的视频+做笔记4、不着急写、交作业、完成任务5、掌握方法，重在质量，前面写的慢一点的话技术上来了，后面自然应该会快一点吧
兔子夏天你看那谁和那谁谁
今天的阳光格外得暖，路旁的小草们抽空伸了伸懒腰，却差点被一路狂奔的兔子一脚踩扁，大惊失色问道：“嘿，夏天，你急急忙忙是去哪呀？”“我也不知道呀，好像有谁在找我呢，再见呀，小草。”说着，兔子夏天回了下头，又匆匆地跑远了。夏天又跑过小雏菊的苗圃前，“早呀，小雏菊，你今天真可爱，”夏天边说边跑了过去。“夏天你在晨跑吗？”“我嘛？”夏天摸了摸竖起来的两只长耳朵，“我应该是在找什么东西吧。”夏天继续向前跑，
Paimon 删除向量 lifallen Paimon 数据库大数据 java 数据结构 apache
RowKind可以标记删除，但它和DeletionVector（删除向量）是为解决不同场景下的问题而设计的两种机制，它们工作在不同的层面。简单来说：RowKind是“逻辑层”的变更指令，主要用于primary-key表的LSM-Tree合并过程。DeletionVector是“物理层”的读时过滤优化，用于在不重写数据文件的前提下，快速地“标记”某些行为无效，极大地提升了DELETE/UPDATE操
java并发编程LockSupport之park/unpark jmysql java java
【尚学堂】Java300集零基础适合初学者视频教程_Java300集零基础教程_Java初学入门视频基础巩固教程_Java语言入门到精通_哔哩哔哩_bilibili一、简介1.1主要方法Park/UnPark方法是LockSupport当中的方法。其常用方法有如下：park()：暂停当前线程。park(Objectblocker)：暂停当前线程，并指定负责此线程停放的同步对像。parkNanos(
我已经二婚了，难道还要从一个火坑跳到另一个火坑吗林姑娘与波斯猫
点击右上角关注我，为你带来情感解惑01从一个火坑跳到另一个火坑说得大概就是二婚，依然不幸福的人。可是已经是二婚了，依然没有得到自己曾经渴望的幸福，似乎又重复了当初的悲哀，又一次站到了婚姻的十字路口，难道还要从一个火坑跳到另一个火坑吗？网友小雅，就站在这样的十字路口。现在的她，常常有一个念头盘踞在脑海：我到底还要不要再离婚？如果离，可是我已经二婚了，在婚姻市场的价值就又贬值一次，这是无可争议的事实，
【C# in .NET】17. 探秘类成员-构造函数与析构函数：对象生命周期管理阿蒙Armon C#in .NET c#.net java
探秘类成员-构造函数与析构函数：对象生命周期管理在C#的类成员体系中，构造函数与析构函数承担着对象生命周期管理的核心职责。它们看似简单，却蕴含着与.NET运行时（CLR）深度交互的底层逻辑。本文将从IL代码解析、内存操作机制、CLR调度原理三个维度，全面揭秘这对特殊成员的工作原理，并结合实战场景提炼最佳实践。一、构造函数：对象诞生的幕后推手构造函数是类实例化过程中执行初始化操作的特殊方法，它的底层
测试学习之——Pytest Day3 别在内卷了测试学习 pytest python
引言Pytest作为Python中最受欢迎的测试框架之一，以其简洁的语法、强大的功能和丰富的插件生态系统，极大地提升了自动化测试的效率和可维护性。在本文中，我们将深入探讨Pytest的两大核心特性：Fixture和插件管理，帮助您更高效地编写和管理您的测试用例。一、夹具fixtureFixture是Pytest中一个非常强大的特性，它允许您定义在测试用例执行之前或之后自动运行的代码。这对于设置测试
【C# in .NET】9. 探秘委托：函数抽象的底层机制阿蒙Armon C#in .NET c#.net java
探秘委托：函数抽象的底层机制在C#的类型系统中，委托（Delegate）作为函数的抽象容器，架起了面向对象与函数式编程的桥梁。它不仅是事件驱动编程的核心，更是LINQ、异步编程等现代C#特性的基础。与类和结构体相比，委托的底层实现融合了引用类型的内存管理与函数指针的调用特性，涉及CLR对方法调度的深度优化。本文将从IL指令解析到JIT编译细节，全面揭示委托的本质机制，带你理解这一特殊类型如何在.N
日更还是？周威威小猪
说到日更，有时觉得就好像签到，每天这样坚持的意义在哪里？日更到自己都感觉要吐，才几天，就这样了。但又没办法，不日更吧又怕落后，日更了吧，没东西写。有时侯忙也写不出什么来。这个购物？满大街走，人来人往，最后累得狗带。差不多一百字，够数。完成日更。
【C# in .NET】2. 探秘数据类型：构建程序的基石阿蒙Armon C#in .NET c#.net java
探秘数据类型：构建程序的基石在C#编程中，数据类型是构建程序的基石。无论是简单的整数计算还是复杂的对象交互，都离不开对数据类型的精准运用。然而，大多数开发者对数据类型的理解往往停留在表面语法层面，忽视了其在.NET框架底层的运行机制。本文将从CLR（公共语言运行时）的视角，深入剖析C#数据类型的本质、内存布局与核心机制，带你看透数据类型背后的底层逻辑。一、数据类型的本质：CLR类型系统的双轨制.N
Julia视频教程 Bounce_aaba
在网易云课堂上直接搜索：Julia教程，就可以找到，教程的全名是：Julia教程从入门到进阶这是国内第一个免费的完整的Julia视频教程，非常适合Julia的入门。有兴趣的朋友可以去学习一下。教程链接：https://study.163.com/course/courseMain.htm?share=2&shareId=480000001854445&courseId=1208959805&_tr
《诗经》204-2小雅•谷风之什•四月（2）无色生香
《四月》，遭祸被逐士大夫写的抒愤诗。冬日烈烈，飘风发发。民莫不穀，我独何害？冬日天冷刺骨寒，疾风呼呼似利剑。天下人儿都好命，为何独我遭受不幸？山有嘉卉，侯栗侯梅。废为残贼，莫知其尤！山上长有名贵木，既有栗树也有梅。如今却遭大残害，没人知道谁之罪。烈烈：即“冽冽”，严寒的样子。飘风：疾风。发发：状狂风呼啸的象声词。榖：善、好。何：通“荷”，承受。侯：有。废：大。残贼：残害。尤：错，罪过。《诗经》是中
Flink双流处理：实时对账实现1
Flink双流处理：实时对账实现1去发现同类优质开源项目:https://gitcode.com/资源描述本资源文件详细介绍了Flink双流处理的实时对账实现。内容涵盖了基础概念、双流处理的方法以及实战案例，帮助开发者深入理解Flink在实时对账场景中的应用。内容概述基础概念介绍了Flink的基本概念和架构，为后续的双流处理打下基础。双流处理方法详细讲解了Flink中双流处理的核心方法和技巧，帮助
U盘直接拔出不在电脑上弹出有何影响姜暮儿单片机 stm32 嵌入式硬件
U盘直接拔出（未通过电脑系统“安全弹出”）可能会对U盘、电脑数据或设备本身造成多种影响，具体如下：一、数据丢失或损坏这是最常见的风险，原因在于：当U盘正在进行数据读写（如复制文件、保存修改、后台自动备份等）时，直接拔出会中断数据传输流程。此时，正在写入的文件可能只保存了部分内容，导致文件损坏（如文档打不开、图片/视频无法播放）。即使没有主动操作，系统可能在后台对U盘进行缓存读写（例如系统自动刷新文
同治皇帝对于学校的几道圣旨 gdlyz
同治皇帝对于学校的几道圣旨图片发自App伐木工狗狗15:26同治朝实录卷之五十二同治元年。壬戌。十二月十三日。庚寅条。谕内阁、我朝自列圣以来。于御极之初。令各直省督抚选举孝廉方正。原以振拔幽滞。用端风俗。典至钜也。朕于上年御极后。即诏各直省督抚秉公选举。并因知县黎庶昌条陈。复谕各督抚等迅速选举。现距上年颁诏之日。已阅年余。而各省选举者甚属寥寥。十室之邑。必有忠信。今各州县大者不下数万户。小者亦万余
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
AUTOSAR汽车电子嵌入式编程精讲300篇-基于 FPGA 的 CAN 控制器设计与验证（续）格图素书汽车 fpga开发
目录3CAN控制器的设计3.1CAN的模块构成3.2CPI模块3.2.1CPI模块总设计3.2.2位时序设计3.2.3发送模块设计3.2.4接收模块设计3.2.5错误处理模块设计3.2.6过载帧模块设计3.3CAN控制器的操作模式4CAN控制器的验证4.1基于Vivado软件的CAN控制器仿真4.1.1CAN控制器配置及地址打包4.1.2其余端口配置说明4.1.3Testbench编写说明4.1.
PHP MySQL 读取数据 froginwe11 开发语言
PHPMySQL读取数据引言在Web开发中，PHP和MySQL是两个常用的技术栈。PHP作为服务器端脚本语言，而MySQL作为关系型数据库管理系统，两者结合能够构建强大的动态网站。本文将详细介绍如何使用PHP从MySQL数据库中读取数据，包括连接数据库、执行查询、处理结果等关键步骤。连接MySQL数据库在PHP中，首先需要连接到MySQL数据库。以下是一个示例代码，展示了如何使用mysqli扩展连
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found