用Python在25行以下代码实现人脸识别

在本文中,我们将看到一种使用Python和开放源码库开始人脸识别的非常简单的方法。

OpenCV

OpenCV是最流行的计算机视觉库。最初是用C/C++编写的,现在它提供了Python的API。

OpenCV使用机器学习算法来搜索图片中的面孔。因为脸是如此复杂,没有一个简单的测试可以告诉你它是否找到了一张脸。相反,有成千上万的小模式和特征必须匹配。这些算法将识别人脸的任务分解为数千个较小的、适合大小的任务,每个任务都很容易解决。这些任务也称为分类器.

用Python在25行以下代码实现人脸识别_第1张图片

 

 

对于脸像这样的东西,可能有6000个或更多的分类器,所有这些都必须匹配才能检测到人脸(当然,在错误限制范围内)。但问题就在这里:对于人脸检测,算法从图片的左上角开始,向下移动到小块数据中,查看每个块,不断地问:“这是一张脸吗?…这是张脸吗?…这是张脸吗?“由于每个块有6000或更多的测试,您可能需要进行数百万的计算,这将使您的计算机陷入瘫痪。

为了避免这种情况,OpenCV使用级联。

就像一系列瀑布一样,OpenCV级联将人脸检测问题分解为多个阶段。对于每个块,它做了一个非常粗糙和快速的测试。如果通过,它会进行稍微详细的测试,依此类推。该算法可能有30到50个这样的阶段或级联,只有当所有阶段都通过时,它才能检测到一张脸。

它的优点是,大多数图片在最初的几个阶段会返回一个负值,这意味着算法不会浪费时间来测试它上的所有6000个特性。现在可以实时进行人脸检测,不用花上几个小时。

实践中的级联

虽然这个理论听起来很复杂,但在实践中却相当容易。级联本身只是一堆XML文件,其中包含用于检测对象的OpenCV数据。你用你想要的级联初始化你的代码,然后它为你做工作。

由于人脸检测是如此常见的情况,OpenCV附带了许多内置的级联,用于检测从脸到眼睛、手到腿的所有东西。对于非人类的事物,甚至还有级联。例如,如果你经营一家香蕉店,想追踪偷香蕉的人,为此造了一个!

安装OpenCV

首先,您需要找到正确的安装文件你的操作系统.

我发现安装OpenCV是这项任务中最困难的部分。如果出现奇怪的无法解释的错误,可能是由于库冲突、32/64位差异等原因造成的。我发现只使用Linux虚拟机并从头安装OpenCV是最简单的。

安装完成后,可以通过触发Python会话并键入:

>>> import cv2>>>

>>>

如果你没有任何错误,你可以继续下一部分。

理解方法

让我们来分析一下实际的代码,可以从这网站https://github.com/shantnu/FaceDetect/下载这些代码。获取face_detect.py脚本、abba.png pic和haarcascade_frontalface_default.xml

# Get user supplied valuesimagePath = sys.argv[1]cascPath = sys.argv[2]

首先将图像和串级名称作为命令行参数传递。我们将使用ABBA图像以及默认级联来检测OpenCV提供的面孔。

# Create the haar cascadefaceCascade = cv2.CascadeClassifier(cascPath)

现在我们创建这个级联并用我们的脸级联初始化它。这会将脸级联加载到内存中,这样就可以使用了。记住,级联只是一个XML文件,它包含用于检测面孔的数据。

# Read the imageimage = cv2.imread(imagePath)gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

在这里,我们读取图像并将其转换为灰度。OpenCV中的许多操作都是以灰度形式完成的。

# Detect faces in the imagefaces = faceCascade.detectMultiScale(    gray,    scaleFactor=1.1,    minNeighbors=5,    minSize=(30, 30),    flags = cv2.cv.CV_HAAR_SCALE_IMAGE)

这个函数检测实际的外观,是代码的关键部分,所以让我们来看看下面的选项:

  1. 这个detectMultiScale功能是一个检测对象的通用函数。因为我们叫它在面部级联,这就是它检测到的。

  2. 第一个选项是灰度图像。

  3. 第二个是scaleFactor...因为有些脸可能离摄像机更近,所以看起来比后面的脸要大。比例因子对此进行补偿。

  4. 该检测算法使用移动窗口检测物体。minNeighbors定义在当前对象声明找到的脸之前,在当前对象附近检测到多少个对象。minSize同时,给出每个窗口的大小。

注:我取了这些字段常用的值。在现实生活中,您将尝试不同的窗口大小、比例因子等值,直到找到最适合您的值为止。

该函数返回一个矩形列表,其中它认为它找到了一张脸。接下来,我们将循环到它认为它发现了什么东西的地方。

print "Found {0} faces!".format(len(faces))
# Draw a rectangle around the facesfor (x, y, w, h) in faces:    cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)

此函数返回4个值:xy矩形的位置,以及矩形的宽度和高度(w , h).

使用这些值绘制一个矩形。rectangle()功能。

​​​​​​​

cv2.imshow("Faces found", image)cv2.waitKey(0)

最后,我们显示图像,等待用户按下键。

检查结果

让我们根据ABBA的照片进行测试:

 

$ python face_detect.py abba.png haarcascade_frontalface_default.xml

 

 

用Python在25行以下代码实现人脸识别_第2张图片

 

这起作用了。再来一张照片怎么样:

 

用Python在25行以下代码实现人脸识别_第3张图片

 

那个…不是一张脸。我们再试一次。我更改了参数,发现设置scaleFactor把错误的脸去掉了。

 

用Python在25行以下代码实现人脸识别_第4张图片

What?

第一张照片是用高质量的相机拍的。第二个似乎是从远处拿来的,可能是用手机拍的。这就是为什么scaleFactor必须修改。正如我说过的,你必须在逐个案例的基础上设置算法,以避免误报。

但是,请注意,由于这是基于机器学习,结果永远不会是100%的准确性。在大多数情况下,您将获得足够好的结果,但有时算法会将不正确的对象识别为Faces。

最后的代码可以找到。https://github.com/shantnu/FaceDetect

你可能感兴趣的:(用Python在25行以下代码实现人脸识别)