Eason.wxd

人脸检测（十三）--PICO，NPD算法

转自：blog.csdn.net/u010333076/article/details/51397332

pico参考论文：Object Detection with Pixel Intensity Comparisons Organized in Decision Trees.pdf

pico实现代码：https://github.com/nenadmarkus/pico

Pico（Pixel Intensity Comparison-based Object detection）发表于2014年，它也继承于Viola-Jones算法并对其做了一部分改进，最大的不同在于特征提取方式，不同于Viola-Jones的Haar特征，pico则是提取点对特征，对两个像素点进行对比。实验表明这种特征比Haar特征更为有效，且运算时间更短。

pico的亮点：

高运行速度、低模型尺寸
对图像无需预处理
无需计算积分图、HOG梯度直方图、图像放大、或其他的数据结构转换
所有的二叉决策树都基于同一种特征类型
对稍作修改就可以检测倾斜人脸

pico的训练逻辑：

初始化：
读入训练数据。
设置二叉决策树点对的取值范围
设置级连的层数
采样训练数据：
对于正例：读取中心点坐标、尺寸大小与其下标（正例与负例都存储于同一结构体，所以需要下标来得知正例位置）。
对于负例：中心点坐标会在负例图片上随机采样，尺寸则在正例图片的尺寸数组中随机采样，直至数量与正例相同。所有数据与正例一同存储，通过tvals的值判别其是正例还是负例。
无论正例还是负例，采样前会做筛选，对于第一次采样，所有数据都会通过，对于后面的采样，只有通过前一个层的筛选才可通过。
最后采样结束后会输出正例的通过率与负例的通过率，也就是其召回率与误检率。返回的值是误检率。
1. 训练新的层：
  参数包括该层的最低召回率和最高误检率，树的最大数量。特别注明o是训练数据的得分。
  层的训练结束条件是其误检率低于最高误检率，或树的数量大于该层树的最大数量，最低召回率决定该层的阈值。
  训练过程算法如下所示：
  1、初始化每个训练数据的权值并作归一化，其权值为其得分与其类别当前数据数目的比值，也就是说，假如负例较少，那么负例的数据权重会较大，假如某个数据的输出较高，说明该数据在之前的分类中表现较好（该数据在树上得到的叶子结点得分较高，某个叶子结点得分越高，说明其误差越低，分类效果越优），那么接下来它的权重也会较大。
  2、单棵树的训练
  参数tcodes、luts、thresholds是一棵树的基本组成部分，tcodes、luts是两个二维数组，thresholds是一维数组，这三个数组第一维都是树的下标，tcodes第二维是树上的所有非叶子结点，luts第二维是树上的所有叶子结点。
  参数nodeidx为当前结点的id，d为当前结点深度，maxd为树的最大深度。
  （a）首先随机生成检测点对
  （b）对所有检测点对依次计算在所有训练数据上的平均误差，误差越小，说明预测越准确。
  （c）找出使误差最大的检测点对，作为该结点的检测点对，将训练数据根据这个检测点对分布为两部分，一部分结果都为正，另一部分都为负。
  （d）生成两棵子树
  （e）当数据分到不能再分时，检测点对设为0，不做其他操作并直接生成两棵子树。
  （f）当树的深度达到最大值时，生成叶子结点的值，该值越大，说明该结点的预测越准确。
  （g）最后设置该树的阈值，若为该层最后一棵树，则其阈值为该层的阈值，否则为－1337。
  3、更新所有训练数据的得分。
  4、当召回率高于最小召回率，误检率低于最高误检率时，结束训练该层，同时生成该层的阈值。
存储模型：
模型信息包括：
version：版本
bbox：特征点对提取空间
tdepth：树的深度
ntrees：树的数量
和所有树的信息，每棵树包含：
非叶子结点特征点对
叶子结点分数
该树的阈值

pico的检测逻辑：

Pico 采用滑窗策略，图像大小维持不变，通过窗口不断移动与放大，实现对图像上所有区域的检测。
针对每一个窗口，使其通过所有树，每通过一棵树会得到一个结果，这个结果不断递加，当其小于阈值时，则拒绝该窗口，判定其非人脸。
若该窗口通过了所有树，其结果大于阈值，则接受该窗口，判定其为人脸，该结果为其置信度。
检测完所有窗口后做一次聚类，假如两个区域的交集比上并集大于0.3，则判定该为同一人脸，结果取其坐标与大小的均值，置信度选择累加。

pico训练数据准备

正例采用AFLW数据集，共包含25000张已手工标注的人脸图片，其中59%为女性，41%为男性，大部分的图片都是彩色，只有少部分是灰色图片。

负例采用ImageNet上的训练数据，挑选了约4万张完全不包含人脸的背景图片。

在训练前所有正例与负例数据被预整理为指定格式文件，将标注与图片数据整合在一个文件中，方便以后的训练，数据预处理代码如下：

background.py genki.py

genki用以加载正例数据，background用以加载负例数据。

step1:

python genki.py path/to/genki > trdata

genki.py中需要的修改参数有两个，lin138:imlist存储的是图片地址，lin140-143分别读取图片中心点的坐标(x,y)与半径（人脸图片长宽的2/3），顺序与imlist对应。

每张人脸会对其做镜面变换，以及长宽和大小的7次变换，总计15次变换。

一张正图片的存储格式如下：

长宽(h,w)

二进制格式的图片字符串数据（w*h大小）

变换次数

所有变换生成的label(r,c,s)

镜像后的二进制格式的图片字符串数据（w*h大小）

镜像后变换次数

镜像后所有变换生成的label(r,c,s)

step2:

python background.py path/to/background >> trdata

background.py会将path/to/background目录下的图片添加至trdata中，不做变换。

一张负例图片的存储格式如下：

长宽(h,w)

二进制格式的图片字符串数据（w*h大小）

负例标识：0

这两步之后trdata 就包含了所需的所有正例数据、正例数据标注以及所有负例数据了。

可能会遇到的问题：

1、buffer报错

数据写入过程中，buffer在python2中不被支持，删掉.buffer即可。

2、python依赖问题

genki.py和background.py需要numpy和scipy支持，numpy和scipy需要blas、lapack，安装过程参考如下网页：

http://www.centoscn.com/image-text/install/2014/0410/2765.html

3、打开aflw.sqlite

这里注意mksqlite的后缀对应着不同的操作系统，mac的是mexmaci64，如果是其它，则不会被识别。

NPD代替pico

由于Pico的特征设计比较简单，所以其抗噪声能力较弱，论文以高斯噪声测试Pico的抗噪声能力，并对比V-J和LBPs特征，结果如下：

可以看出，随着噪声级别的提升，Pico的召回率迅速下降。

论文持观点表示在现代摄像设备上，高模糊图像比较罕见，所以该测试并不是很有意义，但是在我们的测试中发现，Pico不仅对模糊图像鲁棒性较差，对遮挡和曝光图像的鲁棒性同样较差。

目前在目标特征提取上，主要方法有如下五种：

以这五种特征为基础，又演变出众多其它特征提取方法，分支如下

HOG
DPM, SIFT, PCA-SIFT, SURF
LBP
tLBP, dLBP, mLBP, Multi-block LBP, VLBP, RGB-LBP.
Haar-like
CNN
基于像素点比较
Pico, NPD

新的特征选取：

NPD同样是基于像素点之间的比较，但是其设计相较于Pico的二值比较来说更为复杂，其计算方式如下：

该特征有以下几个特点：

其特征是反对称的，也就是说 f (x, y) 或者f (y, x) 都可以表述 x 和 y 两点的特征，举个例子来说，对于一张 p = h*w 大小的图片，其特征池大小为 p * (p-1)/2 。
其特征是有符号的，也就是说其特征表述是有方向性的。
其特征是尺度鲁棒的，也就是说由于其特征分子是两像素点差值，所以对于光照具有较强的鲁棒性。
其特征值是归一化的。

最后指出，通过特征池是可以重建出原图的，也就是说特征池包含了原图片中的所有信息。

新的树形结构：深度二次树（Deep Quadratic Tree）：

以前的树形结构存在的局限，主要是以下两点：

没有获取到不同特征维度之间的联系。
简单的阈值设置忽略了其树内的分支流动顺序信息。

提出一种新的树内节点分裂计算方法：

其中，t为分裂阈值，联系一次二次方程的特性，通过设置系数，该函数用来检测x是否处于 [θ1 , θ2 ] 中， θ1 , θ2是两个已知的阈值，相比于 x < t 单边界比较, 该计算方法考虑到了两个边界，实现了一种更佳的分割策略。

由NPD这种特征设置，可以获得三种特征结构，分别是：

Eq（3）和Eq（4）分别表示了x的亮度低于y和x的亮度高于y（分别如下图f1和f2所示），这两种结构用传统的 x < t 这种方式就可以表达，但是对于Eq（5）来说， x < t 这种方式明显不可以，那么为何要提出Eq（5）这种结构呢？

如上图 f3 所示，对于脸部和背景图片的比较来说，其可能是脸部比背景暗也有可能比背景亮，所以单纯Eq（3）和Eq（4）这两种结构明显是不足以描述这种情况的，因此Eq（5）显得尤为重要，也因此要采用二次树这种结构。

在实践中，相比于 Eq（2）这种形式，更多的是将特征离散化到L大小的空间上（论文设置L＝256），然后通过穷举找出两个最优阈值。

NPD算法实现

新的算法采用了新的架构模式，采用C++ 作为编程语言，之前的代码过于简单，pico代码中存在着多处使用全局变量，对内存消耗大的问题，新的代码结构更加清晰，注释更加完善，架构更加稳定。

不同于pico的Gentle-boost结构，NPD采用soft-cascade级连结构，在每一层过滤负例图片。

算法采用三层架构模式：

最外层是一个wraper，用于调用训练，图片检测与实时监测。
中间层是Detector容器，其成员变量包含了model信息，成员函数包含了窗口检测、模型读写，以及训练决策树stage的一系列操作。
最内层是单棵树的训练内核，代码精简高效，在训练过程中频繁掉用，迭代训练单棵树，最后组成检测器的多层stage。

三层架构之外，数据单独存储，不依托于任意一层，在每层之间传递调用，保持着良好的独立性，权值与得分以及图片信息分为正例负例分别保存，之间相互独立又有着一致的类型，使得操作简便，训练流畅。

配置文件也独立于所有文件之外，在整个程序中静态存在一个option类且不可修改，保证配置文件的统一性，并可在程序任意处读取。

类图：

重新训练模型

1、数据的选择

训练数据采用AFLW，对所有原图做变换，最终训练过程中生成20万正例，负例的生成采用之前生成的无人脸背景图替换掉AFLW所有人脸图片，每轮做随机采用，生成20万负例

左半部分为正例图片，右半部分为负例图片，所有负例会在负例图片上随机采样，最终所有图片都会被转为灰度格式。

2、参数设置

recall为1，不过滤掉任意正例图片，也就是说每一轮的阈值设置为正例最低score。

最大分类器数量为1500个。

每个弱分类器的深度最深为8层。

模版大小为24*24。

权重最大值为100。

每个弱分类器最小叶子数量为100。

3、训练环境

采用16核线下机训练，内存7G，单层训练时间大概为250秒，预计整个训练流程持续三到四天。

4、训练结果

测试与调优

从结果来看，随着stage的增加，曲线正在收敛，但是收敛速度逐渐变慢，依次收敛速度，很难取得论文中模型的效果，推测问题出在负例采样上，因为采样方式采取随机patch，导致某些patch被多次采样，越到后期情况约为严重，所以导致了过拟合的情况，需要修改负例采样方式，降低负例拟合度，并重新训练模型。

改进：

1、修改mining策略为滑窗，随机尺度与步长。

2、初始负例采用hard样本。

模型训练结果：

可以看到，结果有了明显改善，FP的收敛明显提高，但是FP在150时，提升速度很慢，有停滞趋势，且每轮mining时间过长，到后面stage的训练过程显得难以为继，并且由于初始的hard负例有拟合性，需要重新采集hard样本，修改mining策略为周期mining，重新训练。

最终训练结果：

最终的调优总结：

1、修改NMS算法，采用score作为权重，合并重合人脸区域，对最终的定位有明显帮助。

2、拟合人脸框为矩形可辅助曲线提升。

3、尽量采用指针，少用vector，减少数据拷贝，能有效提升检测速度。

最后附上Git地址：https://github.com/wincle/NPD

转自：blog.csdn.net/cv_family_z/article/details/50037323

NPD人脸检测主要内容：
1.图像特征：Normalized Pixel Difference(NPD)，存在查找表中。
2.特征筛选：deep quadratic tree
3.分类：soft cascade classifier

1.NPD特征
就是两个像素的相对差值，根据Weber规则得到。
f(x,y)=x−yx+y
对于s*s的图像，p=s*s一维向量化，NPD特征维度为d=p(p−1)/2。作者用的20*20大小的人脸，特征维度为20*20（20*20-1）/2=79800。特征值的范围是[-1 1]。

2.DQT
stump:基本的树分类器，根据一个阈值将节点分成两个子节点。
DQT:对于特征x,树节点如下分割：
(ax2+bx+c)<t
给定合适的系数，这个方程对应检查x是否在[θ1,θ2]中，考虑到了x的一阶和二阶信息。对于NPD特征，可以学到如下三种结构：

下图显示了几种情况，f1对应（3），f2对应（4），f3，f4对应不能满足（5）出现的强对比边缘。

在论文的算法中，将特征的范围归一化到L=256个bin中，使用穷举法决定阈值[θ1,θ2]，加权均方误差作为分割标准。

此外，使用二次分割学习深度树，论文中树的深度是8。这样可以把几个NPD特征结合起来描述人脸，fig.3是一个例子。

3.Gentle Adaboost
学习基于NPD特征的DQT，soft cascade结构用来训练和拒绝负样本，每次迭代，学习到一个DQT作为弱分类器，以及一个目前AdaBoost分类器的阈值用于拒绝负样本。

Pose:不同的pose可自动划分到树的叶子节点。
对遮挡，光照变化，低分辨率都不敏感。

4.实验细节
对于非限制的模型，人脸模板是24*24。训练使用Annotated Facial Landmarks in the Wild（AFLW）数据库，包含25933个人脸，使用21730个样本及它们的镜像随机扰动构成217300个正样本。通过在人脸上贴非人脸构造了一些难得负样本。树的深度是8，每个树最多评价8个NPD特征，最终的检测器包含1226个DQT，46401个NPD特征。每个检测窗约需估计114.5个NPD特征。

对于正面人脸，12102，12315个正负样本，模板大小20*20，使用CART训练。

在FDDB上的实验结果

CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
基于YOLOV5人脸检测打上码赛克 Deep-white YOLO 人工智能深度学习
还在为自己的隐私而烦恼吗，还在为拍摄的视频因不想露脸而无法发布吗。yolov5检测人脸，并打上马赛克，保护自己的隐私。只需下载代码，解压缩后就可以传入你想要打马赛克的视频或者图片了。这个是需要你对代码有一些了解的，等我开发一下使大家都可以用。里面权重已经训练好了，也有一些人脸的数据集，数据量不多，训练完的权重不是很好，但是给自己的视频打上马赛克足够了。大家要是想去增加数据集，可以使用里面的权重利用
人脸识别技术框架 weixin_30314813 人工智能
1、人脸检测（确定人脸的位置）。2、人脸关键点（确定眼睛，嘴角等特征位置）。3、人脸几何校正（把人脸通过缩放、旋转、拉伸等图像变化到一个比较标准的大小位置）。4、人脸光学校正（滤波，去除一些对光照敏感的面部特征）。5、人脸特征提取（包括LBP,HOG,Gabor等）。6、人脸识别转载于:https://www.cnblogs.com/lanye/p/3620621.html
人脸识别概述 TreeFish2012 FaceRecognition
欢迎关注微博：http://weibo.com/facerecog一人脸识别系统结构图1显示了人脸识别系统所包含的各个模块，其中，图像采集模块用于采集包含人脸的图像；人脸检测跟踪模块用于确定视频中人脸的位置和大小，并确定同一个人在帧间的对应关系；而特征点定位模块用于定位眼睛、嘴巴等脸部特征点的位置；图像质量评估模块，用于从采集的同一个人的多张人脸图像中，根据人脸姿态和光照条件选择最适合识别的一张或
MTCNN人脸检测算法 samuelwang_ccnu 深度学习
人脸检测是指识别数字图像中的人脸。人脸检测可以视为目标检测的一种特殊情况。在目标检测中，任务是查找图像中特定类的所有对象的位置和大小。例如行人和汽车。在人脸检测中应用较广的算法就是MTCNN（Multi-taskCascadedConvolutionalNetworks的缩写）。MTCNN算法是一种基于深度学习的人脸检测和人脸对齐方法，它可以同时完成人脸检测和人脸对齐的任务，相比于传统的算法，它的
MTCNN训练迷若烟雨人脸识别 tensorflow 深度学习 caffe
MTCNN是当前效果最好的开源人脸检测算法之一，作者只提供了训练好的模型以及matlab部署代码，其训练和优化却没有放出来，引发了很多好事者复现如果只是要部署的话可以使用MTCNN，其提供了部署全平台实现，包括C++、python、ncnn和tensorflow，还有加速版本和opencv直接加载版本，是所有版本中的集大成者如果想了解算法原理，可以参考MTCNN_Step_by_Step本文的训练
人脸识别界面设计Android,人脸识别系统的设计及Android平台实现代码侠士人脸识别界面设计Android
摘要：近些年来,随着人们对信息安全问题的日益重视,生物识别技术由于其自身具有传统身份技术所不具备的优势,被大量地用于身份认证中.人脸作为一种重要的生物特征,具有唯一性,随身携带的优点,而且人脸图像的采集条件相对宽松,因此人脸识别技术被大量地用作门禁,安检等相关领域.本文对人脸识别系统进行了相关研究.在人脸检测阶段,对人脸检测的两种方法进行了研究.使用肤色检测的方法检测速度较快,但检测范围不准确并且
javacv从入门到精通——第三章：基本使用 ayou_llf javacv java opencv 语音识别音视频视频编解码
了解javacv的基本结构JavaCV的基本结构如下：JavaCV核心类：JavaCV核心类是JavaCV库的核心，它包括了JavaCV的所有功能和特性，可以用来进行计算机视觉和人工智能任务的开发和实现。JavaCV核心类的主要功能包括：视频捕获、视频编解码、图像处理、人脸检测、特征提取等。基本数据类型：JavaCV库支持多种基本数据类型，包括整数、浮点数、布尔类型等，这些基本数据类型是进行计算机
盒子滤波（BOX FILTER）方框滤波学习笔记 Hilary煜学习笔记 matlab 数据结构
功能：在给定的滑动窗口大小下，对每个窗口内的像素值进行快速相加求和。应用：图像的局部矩形内像素的和、平方和、均值、方差等特征也可以用类似Haar特征的计算方法来计算Haar特征是一种用于物体识别的数字图像特征，特别是在人脸检测领域中得到了广泛应用。Haar特征得名于其与原始的Haar小波变换在计算方式上的相似性。这种特征通过计算图像中相邻矩形区域的像素强度差来捕捉图像的某些特性，如边缘、线条和中心
吴恩达深度学习笔记(24)-为什么要使用深度神经网络？极客Array
为什么使用深层表示？（Whydeeprepresentations?）我们都知道深度神经网络能解决好多问题，其实并不需要很大的神经网络，但是得有深度，得有比较多的隐藏层，这是为什么呢？我们一起来看几个例子来帮助理解，为什么深度神经网络会很好用。首先，深度网络在计算什么？如果你在建一个人脸识别或是人脸检测系统，深度神经网络所做的事就是，当你输入一张脸部的照片，然后你可以把深度神经网络的第一层，当成一
OpenCV小练习：人脸检测 happydeer opencv 人脸检测
OpenCV自带人脸检测模型，拿来就能用。所以“人脸检测”这个任务对于OpenCV而言真是太简单了——感叹一下：OpenCV太强大了！相关的介绍文章在网上可以搜到很多，原本我觉得没必要再写一篇了。结果我在写练习代码的时候，还是碰到了一些新问题，值得记录一下。人脸检测需要用到opencv_objdetect模块。我们在之前介绍OpenCV编译的时候没有用到这个模块，这次就要补充编译一下了。需要注意这
基于x86 平台opencv的图像采集和seetaface6的口罩人脸检测识别功能小菜鸟学开发图像处理相关移植及应用 opencv 人工智能计算机视觉
目录一、概述二、环境要求2.1硬件环境2.2软件环境三、开发流程3.1编写测试3.2配置资源文件3.2验证功能一、概述本文档是针对x86平台opencv的图像采集和seetaface6的口罩人脸检测识别功能，opencv通过摄像头采集视频图像，将采集的视频图像送给seetaface6的口罩人脸检测识别模块从而实现口罩人脸检测识别功能。测试结果如下图所示：戴口罩的口罩人脸检测识别结果未戴口罩的口罩人
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测模型介绍 Hello_WOAIAI CV 人脸识别目标检测计算机视觉视觉检测图像处理 YOLO opencv
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测器介绍前言DeepFace库人脸检测器OpenCV人脸检测器RetinaFace人脸检测器mtcnn人脸检测器sdd人脸检测器dlib人脸检测器mediapipe人脸检测器yolov8人脸检测器人脸识别系列其他文章【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别—第一部
微信小程序-人脸检测飞奔的裸羊羊微信小程序小程序
微信小程序的人脸检测功能，配合蓝牙，配合ESP32可以实现一些有趣的玩具本文先只说微信小程序的人脸检测功能1、人脸检测使用了摄像头，就必须在用户隐私权限里面声明。修改用户隐私声明后，还需要等待审核，大概一天2、app.json文件中也必须声明"permission":{"scope.bluetooth":{"desc":"获取蓝牙用于硬件链接"},"scope.camera":{"desc":"获
[OPENCV]009.目标检测酷咪哥 OPENCV 目标检测计算机视觉 opencv
1.级联分类器在这里，我们学习如何使用objdetect来寻找我们的图像或视频中的对象在本教程中,我们将学习Haar级联目标检测的工作原理。我们将看到使用基于Haar特征的级联分类器进行人脸检测和眼睛检测的基础知识我们将使用cv::CascadeClassifier类来检测视频流中的对象。特别地，我们将使用以下功能:cv::CascadeClassifier::load加载一个.xml分类器文件。
如何使用 Opencv 实现人脸检测和人脸识别？学习不断
1.人脸检测CascadeClassifier加载Opencv自带的人脸检测haarcascade_frontalface_alt.xml分类器。图像预处理cvtColor（灰度化）equalizeHist（直方图均衡化）。使用detectMultiScale函数进行识别。使用rectangle函数绘制找到的目标矩形框。在原图像上ROI截取彩色的人脸保存。2.人脸识别FaceRecognizerF
OpenCV识别人脸案例实战 superdont 计算机视觉 opencv python 人工智能计算机视觉矩阵
使用级联函数基本流程函数介绍在OpenCV中，人脸检测使用的是cv2.CascadeClassifier.detectMultiScale()函数，它可以检测出图片中所有的人脸。该函数由分类器对象调用，其语法格式为：objects=cv2.CascadeClassifier.detectMultiScale(image[,scaleFactor[,minNeighbors[,flags[,minS
python 人脸检测器 laocooon523857886 计算机视觉 opencv 图像处理
importcv2#加载人脸检测器关键文件haarcascade_frontalface_default.xmlface_cascade=cv2.CascadeClassifier('haarcascade_frontalface_default.xml')#读取图像分析图片ren4.pngimage=cv2.imread('ren4.png')gray=cv2.cvtColor(image,cv
m基于深度学习网络的活体人脸和视频人脸识别系统matlab仿真,带GUI界面我爱C编程 Matlab深度学习 matlab 深度学习活体人脸和视频人脸识别
目录1.算法仿真效果2.算法涉及理论知识概要3.MATLAB核心程序4.完整算法代码文件获得1.算法仿真效果matlab2022a仿真结果如下：2.算法涉及理论知识概要随着人工智能技术的快速发展，人脸识别技术已经广泛应用于身份验证、安全监控、智能支付等领域。活体人脸和视频人脸识别系统是其中的重要分支，旨在通过深度学习网络对人脸进行高效、准确的识别，并区分真实人脸与伪造的人脸。人脸检测是活体人脸和视
K210的入手试玩程序介绍我先去打把游戏先 K210 硬件 stm32 c语言开发语言 K210
目录前言一、人脸检测二、物体检测三、RGB控制四、录音播放前言入手试玩程序下载好后，界面长这个样K210如何下载程序一、人脸检测1、点击进入人脸检测2、将其对准人脸，可以识别到人脸3、把右上角的按键向左拨动，可以返回主界面二、物体检测1、点击进入物体检测2、可以识别到物体3、同样的，右上角的按键向左波动退回到主界面三、RGB控制1、点击进入RGB控制2、点击对应的颜色，RGB就会亮对应的颜色3、L
Android原生人脸识别Camera2+FaceDetector 快速实现人脸跟踪心气儿
title:Android原生人脸识别Camera2+FaceDetector快速实现人脸跟踪categories:Androidtags:人脸识别FaceDetectorCamera2date:2020-05-2714:02:13前言本人博客本篇主要介绍Android原生Api人脸检测FaceDetector的使用，该方法检测人脸可以做到的是，检测到屏幕有无人脸，有多少个人脸，人脸的双眼眉心位置
OpenCV 人脸检测（易上手版）第欧根尼的酒桶 opencv
在丰富多彩的计算机视觉世界中，人脸检测是最有趣和最广泛应用的领域之一。无论是在安全系统、用户界面控制，还是在社交媒体中应用过滤器，准确有效地检测人脸的能力都是至关重要的。今天，很高兴与大家分享如何在Python中使用OpenCV轻松实现人脸检测。一、介绍OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。对于任何想深入研究图像处理的
百度AI人脸识别与检测六：学生人脸识别打卡签到系统之班级的增删查陈一月的编程岁月百度AI人脸检测与识别《百度AI人脸识别与检测》Python 百度人脸识别学生人脸识别打卡签到系统
《百度AI人脸识别与检测》专栏为项目专栏，从零到一，从无到有开发一个学生人脸识别签到系统；主要用到的技术有百度开放平台中的人脸检测、人脸识别、Python图形界面开发PyQt5、线程的管理、以及通过python调用百度接口实现人脸检测、百度开放平台中人脸检测技术文档的理解等，由浅入深、由局部到整体的一个项目学习过程，如果你想对人脸识别感兴趣，对python的图形界面设计感兴趣，可以订阅本专栏，因为
百度AI人脸识别与检测七：学生人脸识别打卡签到系统之学生人脸信息的添加陈一月的编程岁月百度AI人脸检测与识别《百度AI人脸识别与检测》Pyhton 百度学生人脸识别打卡签到系统
《百度AI人脸识别与检测》专栏为项目专栏，从零到一，从无到有开发一个学生人脸识别签到系统；主要用到的技术有百度开放平台中的人脸检测、人脸识别、Python图形界面开发PyQt5、线程的管理、以及通过python调用百度接口实现人脸检测、百度开放平台中人脸检测技术文档的理解等，由浅入深、由局部到整体的一个项目学习过程，如果你想对人脸识别感兴趣，对python的图形界面设计感兴趣，可以订阅本专栏，因为
手工设计特征方法指的是什么算法？是什么意思？ legendarylin 算法计算机视觉图像处理
手工设计特征方法是指在目标检测算法中，通过人工设计图像特征来识别目标物体的算法。相对于基于深度学习的方法，手工设计特征方法需要对图像特征进行人工选择和设计，需要大量的专业知识和经验，但在一些场景中仍然有广泛的应用。下面是一些常用的手工设计特征方法和举例：Haar特征：Haar特征是一种用于目标检测的特征，它通过计算图像中的灰度差异来识别目标物体。Haar特征被广泛应用于人脸检测算法中，如Viola
Python中使用opencv-python进行人脸检测雪域迷影 OpenCV Python编程编程语言学习 opencv python 人工智能
Python中使用opencv-python进行人脸检测之前写过一篇VC++中使用OpenCV进行人脸检测的博客。以数字图像处理中经常使用的lena图像为例，如下图所示：使用OpenCV进行人脸检测十分简单，OpenCV官网给了一个Python人脸检测的示例程序，objectDetection.py代码如下：from__future__importprint_functionimportcv2as
如何实现视线(目光)的检测与实时跟踪云博士的AI课堂视线跟踪目光跟踪视线检测目光检测视线追踪目光追踪 opencv
如何实现视线(目光)的检测与实时跟踪核心步骤展示说明找到人脸检测人脸特征点根据特征点找到人眼区域高精度梯度算法检测瞳孔中心根据眼睛周边特征点计算眼睛中心瞳孔中心和眼睛中心基于视线模型计算视线方向视线方向可视化详细实现与说明：https://student-api.iyincaishijiao.com/t/iN6m1rEg/
opencv深度学习人工智能技术打假抖音“伪娘“之性别实时检测人工智能研究所人工智能之计算机视觉人工智能 opencv 深度学习
抖音的美颜功能强大到能把男人变成伪娘，甚至还有年轻小伙刷礼物，疯狂追求，殊不知，你追求的大美女在生活中却是一个油腻大叔。本期文章带你如何使用人工智能技术打假抖音伪娘人脸年龄的检测步骤0、打开摄像头，获取图片数据1、对图片进行人脸的检测，需要人脸检测模型2、把检测到的人脸数据给性别检测模型去检测，需要性别检测模型3、把检测结果实时呈现到图片上importnumpyasnpimporttimeimpo
深度学习知识点汇总-目标检测（1）深度学习模型优化
8.1R-FCNR-FCN属于two-stage的目标检测算法。backbone部分RPN，这里使用ResNet。head部分R-FCN，使用全连接网络。其中ResNet-101+R-FCN的方法在PASCALVOC2007测试数据集的mmAP达到83.6%。图1人脸检测R-FCN的核心思想得到目标多个特征。假设我们只有一个特征图用来检测右眼。那么我们可以使用它定位人脸吗？应该可以。因为右眼应该在
AdaBoost 算法 Rnan-prince 机器学习算法 Adaboost 机器学习
AdaBoost算法是一种经典的集成学习算法，它将多个弱分类器集成起来，以达到较高的分类准确率，广泛应用于数据分类、人脸检测等应用中。尤其在人脸检测方面，AdaBoost是非常经典、成功的一个算法。弱分类器被线性组合成为一个强分类器。一、面临两个问题：在每一轮，如何改变训练数据的概率分布或者权值分布。如何将弱分类器组合成强分类器。二、AdaBoost的思路：提高那些被前一轮弱分类器错误分类样本的权
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul