Eason.wxd

人脸检测（十二）--DDFD算法

转自：blog.csdn.net/qq_14845119/article/details/52564519

DDFD(Deep Dense Face Detector)是一种基于AlexNet进行微调（finetune）改进的一种深度学习的网络模型。是雅虎公司2015年的作品，并发表在了cvpr，论文名为Multi-view Face Detection Using Deep Convolutional Neural Networks。可以实现基于多角度，遮挡，关照下的人脸检测。是一种unconstrain的人脸检测算法。

传统的人脸检测途径有3种:

(1)基于Cascade级联分类器的人脸检测，例如Viola Jones，NPD(Normalized Pixel Difference)等。

(2)基于DPM(deformable part models)的人脸检测，即将人脸分割成好几个部件进行检测的算法，例如DPM。

(3)基于神经网络的方法，例如，DDFD，RCNN等、

该模型由5个卷积层，3个全连接层组成，在最后一个全连接层直接输出，没有经过SVM分类器处理。网络结构face_full_conv.prototxt如下所示：

从下面左图的人脸检测，可以看出，DDFD对各种姿势有很强的抵抗能力，从右侧的能量图(heat-map)，也叫特征图（就像ITTI模型提取的那样），可以看出对于正前方的人脸有着最高的score，而随着偏转角度、姿势的变换越大，score就会越低，但是都可以满足高于周围的背景区域，从而实现多角度，多姿态的人脸检测。

程序github网址https://github.com/watersink/caf_face_detection，模型文件下载地址https://pan.baidu.com/s/1i4Qokhn

由于原作者没有给出其CMakelists，这里贴出我自己的CMakeLists，将其中cafferoot替换为自己的caffe根目录，opencvroot替换为自己的opencv根目录。

[plain] view plain copy

cmake_minimum_required (VERSION 2.8)
project (caf_face_detection)
add_executable(caf_face_detection data_transformer.hpp face_detection.cpp face_detection.hpp main.cpp)
include(CheckCXXCompilerFlag)
CHECK_CXX_COMPILER_FLAG("-std=c++11" COMPILER_SUPPORTS_CXX11)
CHECK_CXX_COMPILER_FLAG("-std=c++0x" COMPILER_SUPPORTS_CXX0X)
if(COMPILER_SUPPORTS_CXX11)
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11")
elseif(COMPILER_SUPPORTS_CXX0X)
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++0x")
else()
message(STATUS "The compiler ${CMAKE_CXX_COMPILER} has no C++11 support. Please use a different C++ compiler.")
endif()
include_directories ( /cafferoot/include
/usr/local/include
/usr/local/cuda/include
/usr/include)
target_link_libraries(caf_face_detection / cafferoot /build/lib/libcaffe.so
/usr/local/lib/libglog.so.0
/usr/lib/x86_64-linux-gnu/libboost_system.so
/opencvroot /build/lib/libopencv_highgui.so
/ opencvroot /build/lib/libopencv_core.so
/ opencvroot /build/lib/libopencv_imgproc.so
)

运行该程序会发现，在程序的运行过程中，其会自动的跟新face_full_conv2.prototxt，有种增量学习(incremental learning)和在线学习(online learning)的味道，网络结构face_full_conv2.prototxt如下

程序运行效果如下：

补充：

1- 构建深度学习训练数据集

AFLW原始数据集：[百度云链接——链接：http://pan.baidu.com/s/1czZXme 密码：rw3g)

尺寸归一化为224×224的正负训练样本：百度云链接——密码：zf98

深度学习需要大量的数据，否则根本无法发挥出深度神经网络的优势。雅虎的文章中为了训练一个性能优异的人脸分类器，制作了超过20W的正样本（人脸）和超过2000W的负样本（非人脸）。此外，为了有效解决遮挡、不同角度、光照的人脸检测，文章还强调训练样本中应包含大量这类的样本。这就需要应用一些特殊Data Augmentation方法，一方面扩充训练样本，另一方面改善样本的分布（即增加那些存在遮挡、倾斜、偏转等的人脸样本）。通常，我们可以采用随机平移、翻转、随机旋转、泛红泛绿等操作来完成上述扩充，但是需要注意人为的添加一些遮挡或者噪声通常是不可取的，因为深度网络很有可能学习到这些人为的“操作”。

1-1 制作训练正样本

我和原文一样，使用了AFLW数据集作为正负样本的来源。AFLW数据集中有大概2.1W张图片（基本都是高清的图片），其中标记了大概2.4W个人脸的矩形框、3维旋转角度、是否遮挡、是否戴眼镜等信息。因此，生成正样本时，我的主要操作就是将原有的矩形框进行随机的平移和旋转，如果操作之后的矩形框和原来矩形框相交面积比（IOU）大于某个阈值（如，我使用了0.64），那么就可以认为经过“采样”得到了一个新的正样本。如果原矩形框下的人脸是存在遮挡或者戴眼镜或者低头仰头的，那么“采样”的次数就会加倍。

关于正样本IOU阈值，原文设定的是0.5，我觉得这不是一个很好的数值。首先，AFLW数据集中标定的矩形框也不是特别准确，如果IOU太小，很容易生成较多的弱正样本，一方面这将增加未来训练分类器的难度，另一方面实际检测的时候也会在目标周围生成许多影响我们判断的矩形框（这一点后面会再次说明）。但是，IOU阈值过大也不好，因为这将降低未来我们对缺失人脸（部分人脸）的检测率。

1-2 制作训练负样本

制作负样本时，我设定了一个新的IOU阈值为0.1，然后对整个图像进行滑动窗口，如果窗口与原人脸矩形框的相交面积比小于0.1，就认为该窗口为负样本。窗口大小和滑动步长是根据图片大小来确定的，平均下来一张图片会滑动产生200个窗口，最终被认定为负样本的大概有120左右。

需要特别说明的是，AFLW数据集中存在这样的问题：一张图片中有多个人，但只标注了少数几个明显的目标；背景存在密集人群。这将导致我们滑动窗口产生的负样本中包含一些“正样本”。因此，对于负样本我们需要人工审核一遍来剔除那些“异常”。（因为我是一个人，而且还在上课，这部分剔除工作就花费了我半个月之多 T_T）

最终，我获得了352240的正样本和1600128的负样本（负样本本来有200W+,但我没有时间全部校验一遍了）。下面看几个正负样本的例子。

2- 训练一个深度人脸分类器

训练一个深度人脸分类器，也就是利用深度卷积神经网络训练一个图片二分类器，该分类器可以将输入图片分类为人脸或者非人脸。考虑到人脸检测的召回率和准确率以及时间花费，下面我尝试了多种网络结构。

2-1 ImageNet或者AlexNet网络

原文作者是在AlexNet上进行finetune的。AlexNet的输入图片尺寸是227×227，ImageNet的输入图片尺寸是224×224，二者的结构类似。以ImageNet网络为例，该网络共有8层，包含5个卷积层和3个全连接层（某些层后面还跟有pooling层和LRN层）。整个网络下来，有大概60millon 个参数，65W个神经元，其caffemodel大概有220M之大。

下面说一下，实际使用ImageNet模型做人脸和非人脸分类的感受：

模型太大，我实际用的caffemodel大概有225M大小，这也就导致运行模型时需要很大的系统内存，同时也导致时间花费增大。我用笔记本4G内存，跑这个模型基本无望。
输入图片尺寸太大，ImageNet要求输入224×224大小的图片，这也就意味着如果你需要检测到最小40×40左右大小的人脸时，你必须首先将你的图片放大至少5倍。这将带来更大的内存消耗和时间花费。

2-2 Cifar10网络

这里尝试了Cifar10-quick网络结构，该网络输入图片尺寸为32×32，包含3个卷积层和2个全连接层（某些层后面有pooling层）。最终的caffemodel大小不足600K，是一个轻量级的网络模型。

模型过小，分类能力不足。

2-3 NIN_Cifar10网络

NIN，也即是Network in Network. 。这篇文章，主要讲

传统的线性卷积+非线性激活的方式不能很好地描述一个高度非线性的图像分类空间；
在每一层网络之间添加一个具有良好非线性表示能力的“多层感知机”可以改善上述问题。
图示如下：

因为每层之间又添加了一个“多层感知机”网络，因此称为Network in Network.

其实，这个方法只是名字叫的特别好听，其本质只不过是加深了网络深度，但确实又是work的（关于这一点，大家可以通过查看NIN模型的train_val.prototxt来认识）

NIN_Cifar10的cafemodel大小约3M，但在测试集上的准确率要高于单纯的Cifar10，接近ImageNet的测试准确率。

2-4 自定义滑窗网络SlipW

这是我自己定义的一个网络结构，输入大小32×32，caffemodel大小约2.2M，测试集分类准确率97.2%，接近NIN_Cifar10的表现。为什么我最终要自己设计这样一个名为“滑窗”的网络？接下来我将说明原因。

将一个人脸分类器升级为一个人脸检测器的最简单直接的方法就是滑动窗口。但是，假如我的待检测图片大小为640×480，当以16的步长去滑动32×32的窗口时，那么将产生39×29=1131个窗口，如果把这些窗口一个一个去送到神经网络中做分类，那么可想而知效率会有多低。为了加快这个滑窗检测的过程，有人采用了下面的一种“全卷积”网络的方法：

2-4-1 全卷积网络

了解卷积神经网络的都应该知道，在卷积层中有“卷积核大小：kernel_size”、“卷积步长：stride”等参数。大家是否觉得卷积整个图像的过程和滑窗有点类似？于是，有人就从这个角度出发，去改造已有的网络使之只包含卷积层，从而使得网络可以接受任意尺寸大小的图片输入，并自动完成“滑窗”的过程。具体改造如下：（以ImageNet改造为例）
改造即是将全连接层改为卷积层，原来的ImageNet最后的3个全连接层，参数维度分别为fc6: 4096×9216×1×1，fc7: 4096×4096×1×1，fc8: 2×4096×1×1（分2类）。

1- 在deploy文件中将最后2层重写为卷积核大小为1，卷积步长为1的卷积层。以最后一层的改造为例，下图左边是改造之前，右图是改造之后的结果。
2- 倒数第3层fc6稍微有点不同，为了和上一个卷积层的输出个数256对齐，因此需要将9216拆解成6×6的卷积核（256×6×6=9216）。如下图：
3- 完成上述改造之后，实际使用的时候还要做一点工作。因为我们在deploy.prototxt中已经固定了输入图片的尺寸，如下图：
```
  如果我们想要输入一张451×451的图片，那么你需要修改deploy文件为：
```
这样看起来很麻烦，因为直接在deploy文件中修改的话，你需要改完之后保存deploy文件然后重新读取caffemodel。幸亏这里还有简单的方法：

    %读取我的图片的尺寸
    [newM,newN,newD]=size(myimage);
    blobdata = imNet.blob_vec(imNet.name2blob_index('data'));
    newshape=[newM newN newD 1];
    %将data层reshape为我的尺寸
    blobdata.reshape(newshape);

上面的方法使得我们只需创建一次网络，便可以通过快速reshape来应对各种不同尺寸的输入图片。

最终，我们可以直接将一张大小为451×451的图片输入到神经网络当中，而得到一个8×8×2的输出。其中8=（451-224）/32+1。也就是说改造之后的网络相当于以滑动步长32的进行窗口大小为224×224的滑动。（其中滑动步长等于网络中所有卷积步长stride的乘积）。

更加详细的介绍也可参考这里：http://nbviewer.ipython.org/github/BVLC/caffe/blob/master/examples/net_surgery.ipynb

但是，上述改造的网络其实并不等于滑动窗口。因为该网络中的每一个卷积层中卷积步长都小于卷积核的大小，这也就意味着上述过程中产生的窗口其实都有着相互之间的影响。于是，本来不存在人脸的地方就可能由于“滑动窗口”而受到远处的人脸影响，最终被检测为人脸

为此，我设计了下面的滑窗网络

2-4-2 我自己设计的滑窗网络SlipW

我这个网络主要就是针对上面的问题而设计的，方法很简单：只要出现卷积核的地方，卷积步长一定等于卷积核大小。至于整体结构，主要参考了NIN的设计思想，多次使用了卷积核为大小1的卷积层。
下面是第一层的示例：

layers {
  name: "conv1"
  type: CONVOLUTION
  bottom: "data"
  top: "conv1"
  convolution_param {
    num_output: 256
    stride: 4
    kernel_size: 4
  }
}

最终，模型大小2.2M，测试集上分类准确率为97.5%。
具体可参考我打包的源代码中的SlipW_net2文件夹。

3- 应用分类器进行人脸检测

所有代码，包括样本制作、以及一些尝试等等：百度云链接密码：m3zw

前面也提到过，将一个人脸分类器转化为人脸检测器的最简单直接的方法就是“滑动窗口”，所幸我们的神经网络可以“自动滑窗”。现在还有一个问题，我们的窗口是32×32的，但实际当中的人脸尺寸可能远大于此。为了检测到更大的人脸，我们需要按照一定比例缩小图片，然后再用固定窗口检测。文章中建议该比例因子为0.7937.

3-1 NMS-多窗口融合

上面多尺度检测之后，同一个目标一般会得到多个框，就像下面这样：

所以接下来我们还要做一点最后的处理工作，使得每一个目标只有一个矩形框。

这一部分到目前为止，我还没有特别理想的方法，我觉得这是一个很有挑战和技巧性的佛你工作。主要因为：

为了检测到侧脸和遮挡的人脸，我们在训练样本中增加了很多“部分”人脸。但是，这也导致实际应用时会在目标周围产生各种偏离的框。
经过深度卷积神经网络分类器，正面好的人脸的输出得分并不一定就比侧面较差人脸的得分高。这将导致，很多按照得分进行排序合并的NMS算法不能正常工作
由于存在偏离的框比较多，当目标比较密集或者一个较大目标旁边有一个较小目标时，合并的难度可想而知

检测的入口函数为face_detection.m，下面我就依照该函数来简要说明最终的检测流程：

下面的代码只是简单的流程，大家可以只看红色注释部分，就可以快速把握检测的流程

caffe_('reset');%caffe初始化

%构建滑窗网络
imNet=Net('SlipW_net2\SlipW_deploy.prototxt','SlipW_net2\SlipW_2_iter_444000','test');

%再建立另外两个网络，用于最后对检测结果做校验        
test_net1=Net('Cifar10\cifar10_deploy.prototxt','Cifar10\cifar10_iter_270000','test');
test_net2=Net('SlipW_net1\SlipW_deploy.prototxt','SlipW_net1\SlipW_1_iter_553000','test');

%一些参数设置
winsize=32;%窗口大小
stride=16; %滑动步长
mean_data=[94.6683 104.1116 117.5282];%像素均值BGR
img=imread([PathName,FileName]);%读取待检测图片
[M,N,~]=size(img);%图片尺寸
factor= 0.793700526; %图像的缩小比例因子0.5^(1/3)
minL=min(M,N);
scales=factor.^(0:fix(-log(minL/winsize)/log(factor))); %缩放比例表

%依据缩放比例表，来循环对图像进行缩放，然后检测
for i=1:length(scales)
    imimg=imresize(img,scales(i)*[M N]);%按表缩放
    intemp =io.load_image(imimg);%图像预处理（RBG->BGR，Width<->Height）
    [newM,newN,newD]=size(intemp);

    %减去均值
    intemp(:,:,1)=intemp(:,:,1)-mean_data(1);
    intemp(:,:,2)=intemp(:,:,2)-mean_data(2);

    %reshape网络data层，使之可以接受当前尺寸的输入
    blobdata= imNet.blob_vec(imNet.name2blob_index('data'));
    newshape=[newM newN newD 1];
    blobdata.reshape(newshape);

    %前向传播，输出分类结果
    out=imNet.forward({intemp});

    %对分类结果判断整理，并依据缩放比例还原出包围框位置
    mboundingBox=generateBoundingBox(out);
    boundingBox=[boundingBox;mboundingBox]; %存储所有的矩形框
end

%处理得到的大量矩形框：NMS+验证
if ~isempty(boundingBox)
    boundingBox=sortrows(boundingBox,-6);%将矩形框按照得分降序排列
    leftboxes=nms_gauss(double(boundingBox),0.15);%应用基于gauss的NMS方法，进行窗口合并
    [numboxes,~]=size(leftboxes);

    %利用2个test CNNs来对最后的检测结果进一步进行验证，减少误检
    for i=1:numboxes
        ...
        out1=test_net1.forward({intemp});
        out2=test_net2.forward({intemp});
        %如果2个网络验证为人脸的概率都大于0.1或者概率之和大于1.2，则确定为人脸
        if out2{1}(2)>0.1 && out1{1}(2)>0.1 && blobout1(2)>0.5 || out1{1}(2)+out2{1}(2)>1.2
        ...
    end
end

下面放一些检测结果,大家可以发现,准确率和召回率没有太大问题,对遮挡,光照,偏转的鲁棒性也挺高,但就是定位不够准确.各位读者有好的方法,我们也可以相互交流一下.

人脸识别【java-基于OpenCV】思维导图-java架构用心去追梦 java opencv 架构
为了创建一个关于基于OpenCV的Java人脸识别项目的思维导图，可以围绕项目的主要组成部分进行组织：环境搭建、数据准备、人脸检测、特征提取、模型训练、识别与验证、以及优化和部署。以下是一个结构化的建议框架，你可以根据这个框架使用任何思维导图软件来创建具体的图形化版本。Java+OpenCV人脸识别项目-思维导图1.环境搭建安装依赖安装Java开发工具包（JDK）。下载并配置OpenCV库及其Ja
【计算机视觉】人脸识别油泼辣子多加计算机视觉计算机视觉 opencv 人工智能
一、简介人脸识别是将图像或者视频帧中的人脸与数据库中的人脸进行对比，判断输入人脸是否与数据库中的某一张人脸匹配，即判断输入人脸是谁或者判断输入人脸是否是数据库中的某个人。人脸识别属于1：N的比对，输入人脸身份是1，数据库人脸身份数量为N，一般应用在办公室门禁，疑犯追踪；人脸验证属于1:1的比对，输入人脸身份为1，数据库中为同一人的数据，在安全领域应用比较多。一个完整的人脸识别流程主要包括人脸检测、
Python AI教程之二十一：监督学习之支持向量机（SVM）算法潜洋人工智能 Python中级支持向量机算法机器学习 python
支持向量机（SVM）算法支持向量机(SVM)是一种功能强大的机器学习算法，广泛用于线性和非线性分类以及回归和异常值检测任务。SVM具有很强的适应性，适用于各种应用，例如文本分类、图像分类、垃圾邮件检测、笔迹识别、基因表达分析、人脸检测和异常检测。SVM特别有效，因为它们专注于寻找目标特征中不同类别之间的最大分离超平面，从而使其对二分类和多分类都具有鲁棒性。在本大纲中，我们将探讨支持向量机(SVM)
如何利用OpenCV和yolo实现人脸检测音视频牛哥大牛直播SDK opencv 人工智能计算机视觉 yolo11 人脸检测 opencv人脸检测 yolo人脸检测
在之前的blog里面，我们有介绍OpenCV和yolo的区别，本文就人脸检测为例，分别介绍下OpenCV和yolo的实现方式。OpenCV实现人脸检测一、安装OpenCV首先确保你已经安装了OpenCV库。可以通过以下方式安装：使用包管理工具安装：在Python环境中，可以使用pip安装：pipinstallopencv-python。二、加载预训练的人脸检测模型OpenCV提供了基于Haar特征
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
基于YOLOV5人脸检测打上码赛克 Deep-white YOLO 人工智能深度学习
还在为自己的隐私而烦恼吗，还在为拍摄的视频因不想露脸而无法发布吗。yolov5检测人脸，并打上马赛克，保护自己的隐私。只需下载代码，解压缩后就可以传入你想要打马赛克的视频或者图片了。这个是需要你对代码有一些了解的，等我开发一下使大家都可以用。里面权重已经训练好了，也有一些人脸的数据集，数据量不多，训练完的权重不是很好，但是给自己的视频打上马赛克足够了。大家要是想去增加数据集，可以使用里面的权重利用
人脸识别技术框架 weixin_30314813 人工智能
1、人脸检测（确定人脸的位置）。2、人脸关键点（确定眼睛，嘴角等特征位置）。3、人脸几何校正（把人脸通过缩放、旋转、拉伸等图像变化到一个比较标准的大小位置）。4、人脸光学校正（滤波，去除一些对光照敏感的面部特征）。5、人脸特征提取（包括LBP,HOG,Gabor等）。6、人脸识别转载于:https://www.cnblogs.com/lanye/p/3620621.html
人脸识别概述 TreeFish2012 FaceRecognition
欢迎关注微博：http://weibo.com/facerecog一人脸识别系统结构图1显示了人脸识别系统所包含的各个模块，其中，图像采集模块用于采集包含人脸的图像；人脸检测跟踪模块用于确定视频中人脸的位置和大小，并确定同一个人在帧间的对应关系；而特征点定位模块用于定位眼睛、嘴巴等脸部特征点的位置；图像质量评估模块，用于从采集的同一个人的多张人脸图像中，根据人脸姿态和光照条件选择最适合识别的一张或
MTCNN人脸检测算法 samuelwang_ccnu 深度学习
人脸检测是指识别数字图像中的人脸。人脸检测可以视为目标检测的一种特殊情况。在目标检测中，任务是查找图像中特定类的所有对象的位置和大小。例如行人和汽车。在人脸检测中应用较广的算法就是MTCNN（Multi-taskCascadedConvolutionalNetworks的缩写）。MTCNN算法是一种基于深度学习的人脸检测和人脸对齐方法，它可以同时完成人脸检测和人脸对齐的任务，相比于传统的算法，它的
MTCNN训练迷若烟雨人脸识别 tensorflow 深度学习 caffe
MTCNN是当前效果最好的开源人脸检测算法之一，作者只提供了训练好的模型以及matlab部署代码，其训练和优化却没有放出来，引发了很多好事者复现如果只是要部署的话可以使用MTCNN，其提供了部署全平台实现，包括C++、python、ncnn和tensorflow，还有加速版本和opencv直接加载版本，是所有版本中的集大成者如果想了解算法原理，可以参考MTCNN_Step_by_Step本文的训练
人脸识别界面设计Android,人脸识别系统的设计及Android平台实现代码侠士人脸识别界面设计Android
摘要：近些年来,随着人们对信息安全问题的日益重视,生物识别技术由于其自身具有传统身份技术所不具备的优势,被大量地用于身份认证中.人脸作为一种重要的生物特征,具有唯一性,随身携带的优点,而且人脸图像的采集条件相对宽松,因此人脸识别技术被大量地用作门禁,安检等相关领域.本文对人脸识别系统进行了相关研究.在人脸检测阶段,对人脸检测的两种方法进行了研究.使用肤色检测的方法检测速度较快,但检测范围不准确并且
javacv从入门到精通——第三章：基本使用 ayou_llf javacv java opencv 语音识别音视频视频编解码
了解javacv的基本结构JavaCV的基本结构如下：JavaCV核心类：JavaCV核心类是JavaCV库的核心，它包括了JavaCV的所有功能和特性，可以用来进行计算机视觉和人工智能任务的开发和实现。JavaCV核心类的主要功能包括：视频捕获、视频编解码、图像处理、人脸检测、特征提取等。基本数据类型：JavaCV库支持多种基本数据类型，包括整数、浮点数、布尔类型等，这些基本数据类型是进行计算机
盒子滤波（BOX FILTER）方框滤波学习笔记 Hilary煜学习笔记 matlab 数据结构
功能：在给定的滑动窗口大小下，对每个窗口内的像素值进行快速相加求和。应用：图像的局部矩形内像素的和、平方和、均值、方差等特征也可以用类似Haar特征的计算方法来计算Haar特征是一种用于物体识别的数字图像特征，特别是在人脸检测领域中得到了广泛应用。Haar特征得名于其与原始的Haar小波变换在计算方式上的相似性。这种特征通过计算图像中相邻矩形区域的像素强度差来捕捉图像的某些特性，如边缘、线条和中心
吴恩达深度学习笔记(24)-为什么要使用深度神经网络？极客Array
为什么使用深层表示？（Whydeeprepresentations?）我们都知道深度神经网络能解决好多问题，其实并不需要很大的神经网络，但是得有深度，得有比较多的隐藏层，这是为什么呢？我们一起来看几个例子来帮助理解，为什么深度神经网络会很好用。首先，深度网络在计算什么？如果你在建一个人脸识别或是人脸检测系统，深度神经网络所做的事就是，当你输入一张脸部的照片，然后你可以把深度神经网络的第一层，当成一
OpenCV小练习：人脸检测 happydeer opencv 人脸检测
OpenCV自带人脸检测模型，拿来就能用。所以“人脸检测”这个任务对于OpenCV而言真是太简单了——感叹一下：OpenCV太强大了！相关的介绍文章在网上可以搜到很多，原本我觉得没必要再写一篇了。结果我在写练习代码的时候，还是碰到了一些新问题，值得记录一下。人脸检测需要用到opencv_objdetect模块。我们在之前介绍OpenCV编译的时候没有用到这个模块，这次就要补充编译一下了。需要注意这
基于x86 平台opencv的图像采集和seetaface6的口罩人脸检测识别功能小菜鸟学开发图像处理相关移植及应用 opencv 人工智能计算机视觉
目录一、概述二、环境要求2.1硬件环境2.2软件环境三、开发流程3.1编写测试3.2配置资源文件3.2验证功能一、概述本文档是针对x86平台opencv的图像采集和seetaface6的口罩人脸检测识别功能，opencv通过摄像头采集视频图像，将采集的视频图像送给seetaface6的口罩人脸检测识别模块从而实现口罩人脸检测识别功能。测试结果如下图所示：戴口罩的口罩人脸检测识别结果未戴口罩的口罩人
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测模型介绍 Hello_WOAIAI CV 人脸识别目标检测计算机视觉视觉检测图像处理 YOLO opencv
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测器介绍前言DeepFace库人脸检测器OpenCV人脸检测器RetinaFace人脸检测器mtcnn人脸检测器sdd人脸检测器dlib人脸检测器mediapipe人脸检测器yolov8人脸检测器人脸识别系列其他文章【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别—第一部
微信小程序-人脸检测飞奔的裸羊羊微信小程序小程序
微信小程序的人脸检测功能，配合蓝牙，配合ESP32可以实现一些有趣的玩具本文先只说微信小程序的人脸检测功能1、人脸检测使用了摄像头，就必须在用户隐私权限里面声明。修改用户隐私声明后，还需要等待审核，大概一天2、app.json文件中也必须声明"permission":{"scope.bluetooth":{"desc":"获取蓝牙用于硬件链接"},"scope.camera":{"desc":"获
[OPENCV]009.目标检测酷咪哥 OPENCV 目标检测计算机视觉 opencv
1.级联分类器在这里，我们学习如何使用objdetect来寻找我们的图像或视频中的对象在本教程中,我们将学习Haar级联目标检测的工作原理。我们将看到使用基于Haar特征的级联分类器进行人脸检测和眼睛检测的基础知识我们将使用cv::CascadeClassifier类来检测视频流中的对象。特别地，我们将使用以下功能:cv::CascadeClassifier::load加载一个.xml分类器文件。
如何使用 Opencv 实现人脸检测和人脸识别？学习不断
1.人脸检测CascadeClassifier加载Opencv自带的人脸检测haarcascade_frontalface_alt.xml分类器。图像预处理cvtColor（灰度化）equalizeHist（直方图均衡化）。使用detectMultiScale函数进行识别。使用rectangle函数绘制找到的目标矩形框。在原图像上ROI截取彩色的人脸保存。2.人脸识别FaceRecognizerF
OpenCV识别人脸案例实战 superdont 计算机视觉 opencv python 人工智能计算机视觉矩阵
使用级联函数基本流程函数介绍在OpenCV中，人脸检测使用的是cv2.CascadeClassifier.detectMultiScale()函数，它可以检测出图片中所有的人脸。该函数由分类器对象调用，其语法格式为：objects=cv2.CascadeClassifier.detectMultiScale(image[,scaleFactor[,minNeighbors[,flags[,minS
python 人脸检测器 laocooon523857886 计算机视觉 opencv 图像处理
importcv2#加载人脸检测器关键文件haarcascade_frontalface_default.xmlface_cascade=cv2.CascadeClassifier('haarcascade_frontalface_default.xml')#读取图像分析图片ren4.pngimage=cv2.imread('ren4.png')gray=cv2.cvtColor(image,cv
m基于深度学习网络的活体人脸和视频人脸识别系统matlab仿真,带GUI界面我爱C编程 Matlab深度学习 matlab 深度学习活体人脸和视频人脸识别
目录1.算法仿真效果2.算法涉及理论知识概要3.MATLAB核心程序4.完整算法代码文件获得1.算法仿真效果matlab2022a仿真结果如下：2.算法涉及理论知识概要随着人工智能技术的快速发展，人脸识别技术已经广泛应用于身份验证、安全监控、智能支付等领域。活体人脸和视频人脸识别系统是其中的重要分支，旨在通过深度学习网络对人脸进行高效、准确的识别，并区分真实人脸与伪造的人脸。人脸检测是活体人脸和视
K210的入手试玩程序介绍我先去打把游戏先 K210 硬件 stm32 c语言开发语言 K210
目录前言一、人脸检测二、物体检测三、RGB控制四、录音播放前言入手试玩程序下载好后，界面长这个样K210如何下载程序一、人脸检测1、点击进入人脸检测2、将其对准人脸，可以识别到人脸3、把右上角的按键向左拨动，可以返回主界面二、物体检测1、点击进入物体检测2、可以识别到物体3、同样的，右上角的按键向左波动退回到主界面三、RGB控制1、点击进入RGB控制2、点击对应的颜色，RGB就会亮对应的颜色3、L
Android原生人脸识别Camera2+FaceDetector 快速实现人脸跟踪心气儿
title:Android原生人脸识别Camera2+FaceDetector快速实现人脸跟踪categories:Androidtags:人脸识别FaceDetectorCamera2date:2020-05-2714:02:13前言本人博客本篇主要介绍Android原生Api人脸检测FaceDetector的使用，该方法检测人脸可以做到的是，检测到屏幕有无人脸，有多少个人脸，人脸的双眼眉心位置
OpenCV 人脸检测（易上手版）第欧根尼的酒桶 opencv
在丰富多彩的计算机视觉世界中，人脸检测是最有趣和最广泛应用的领域之一。无论是在安全系统、用户界面控制，还是在社交媒体中应用过滤器，准确有效地检测人脸的能力都是至关重要的。今天，很高兴与大家分享如何在Python中使用OpenCV轻松实现人脸检测。一、介绍OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。对于任何想深入研究图像处理的
百度AI人脸识别与检测六：学生人脸识别打卡签到系统之班级的增删查陈一月的编程岁月百度AI人脸检测与识别《百度AI人脸识别与检测》Python 百度人脸识别学生人脸识别打卡签到系统
《百度AI人脸识别与检测》专栏为项目专栏，从零到一，从无到有开发一个学生人脸识别签到系统；主要用到的技术有百度开放平台中的人脸检测、人脸识别、Python图形界面开发PyQt5、线程的管理、以及通过python调用百度接口实现人脸检测、百度开放平台中人脸检测技术文档的理解等，由浅入深、由局部到整体的一个项目学习过程，如果你想对人脸识别感兴趣，对python的图形界面设计感兴趣，可以订阅本专栏，因为
百度AI人脸识别与检测七：学生人脸识别打卡签到系统之学生人脸信息的添加陈一月的编程岁月百度AI人脸检测与识别《百度AI人脸识别与检测》Pyhton 百度学生人脸识别打卡签到系统
《百度AI人脸识别与检测》专栏为项目专栏，从零到一，从无到有开发一个学生人脸识别签到系统；主要用到的技术有百度开放平台中的人脸检测、人脸识别、Python图形界面开发PyQt5、线程的管理、以及通过python调用百度接口实现人脸检测、百度开放平台中人脸检测技术文档的理解等，由浅入深、由局部到整体的一个项目学习过程，如果你想对人脸识别感兴趣，对python的图形界面设计感兴趣，可以订阅本专栏，因为
手工设计特征方法指的是什么算法？是什么意思？ legendarylin 算法计算机视觉图像处理
手工设计特征方法是指在目标检测算法中，通过人工设计图像特征来识别目标物体的算法。相对于基于深度学习的方法，手工设计特征方法需要对图像特征进行人工选择和设计，需要大量的专业知识和经验，但在一些场景中仍然有广泛的应用。下面是一些常用的手工设计特征方法和举例：Haar特征：Haar特征是一种用于目标检测的特征，它通过计算图像中的灰度差异来识别目标物体。Haar特征被广泛应用于人脸检测算法中，如Viola
Python中使用opencv-python进行人脸检测雪域迷影 OpenCV Python编程编程语言学习 opencv python 人工智能
Python中使用opencv-python进行人脸检测之前写过一篇VC++中使用OpenCV进行人脸检测的博客。以数字图像处理中经常使用的lena图像为例，如下图所示：使用OpenCV进行人脸检测十分简单，OpenCV官网给了一个Python人脸检测的示例程序，objectDetection.py代码如下：from__future__importprint_functionimportcv2as
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在