在本文中,我们将看到一种使用Python和开放源码库开始人脸识别的非常简单的方法。
OpenCV
OpenCV是最流行的计算机视觉库。最初是用C/C++编写的,现在它提供了Python的API。
OpenCV使用机器学习算法来搜索图片中的面孔。因为脸是如此复杂,没有一个简单的测试可以告诉你它是否找到了一张脸。相反,有成千上万的小模式和特征必须匹配。这些算法将识别人脸的任务分解为数千个较小的、适合大小的任务,每个任务都很容易解决。这些任务也称为分类器.
对于脸像这样的东西,可能有6000个或更多的分类器,所有这些都必须匹配才能检测到人脸(当然,在错误限制范围内)。但问题就在这里:对于人脸检测,算法从图片的左上角开始,向下移动到小块数据中,查看每个块,不断地问:“这是一张脸吗?…这是张脸吗?…这是张脸吗?“由于每个块有6000或更多的测试,您可能需要进行数百万的计算,这将使您的计算机陷入瘫痪。
为了避免这种情况,OpenCV使用级联。
就像一系列瀑布一样,OpenCV级联将人脸检测问题分解为多个阶段。对于每个块,它做了一个非常粗糙和快速的测试。如果通过,它会进行稍微详细的测试,依此类推。该算法可能有30到50个这样的阶段或级联,只有当所有阶段都通过时,它才能检测到一张脸。
它的优点是,大多数图片在最初的几个阶段会返回一个负值,这意味着算法不会浪费时间来测试它上的所有6000个特性。现在可以实时进行人脸检测,不用花上几个小时。
实践中的级联
虽然这个理论听起来很复杂,但在实践中却相当容易。级联本身只是一堆XML文件,其中包含用于检测对象的OpenCV数据。你用你想要的级联初始化你的代码,然后它为你做工作。
由于人脸检测是如此常见的情况,OpenCV附带了许多内置的级联,用于检测从脸到眼睛、手到腿的所有东西。对于非人类的事物,甚至还有级联。例如,如果你经营一家香蕉店,想追踪偷香蕉的人,为此造了一个!
安装OpenCV
首先,您需要找到正确的安装文件你的操作系统.
我发现安装OpenCV是这项任务中最困难的部分。如果出现奇怪的无法解释的错误,可能是由于库冲突、32/64位差异等原因造成的。我发现只使用Linux虚拟机并从头安装OpenCV是最简单的。
安装完成后,可以通过触发Python会话并键入:
>>> import cv2
>>>
>>>
如果你没有任何错误,你可以继续下一部分。
理解方法
让我们来分析一下实际的代码,可以从这网站https://github.com/shantnu/FaceDetect/下载这些代码。获取face_detect.py脚本、abba.png pic和haarcascade_frontalface_default.xml
# Get user supplied values
imagePath = sys.argv[1]
cascPath = sys.argv[2]
首先将图像和串级名称作为命令行参数传递。我们将使用ABBA图像以及默认级联来检测OpenCV提供的面孔。
# Create the haar cascade
faceCascade = cv2.CascadeClassifier(cascPath)
现在我们创建这个级联并用我们的脸级联初始化它。这会将脸级联加载到内存中,这样就可以使用了。记住,级联只是一个XML文件,它包含用于检测面孔的数据。
# Read the image
image = cv2.imread(imagePath)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
在这里,我们读取图像并将其转换为灰度。OpenCV中的许多操作都是以灰度形式完成的。
# Detect faces in the image
faces = faceCascade.detectMultiScale(
gray,
scaleFactor=1.1,
minNeighbors=5,
minSize=(30, 30),
flags = cv2.cv.CV_HAAR_SCALE_IMAGE
)
这个函数检测实际的外观,是代码的关键部分,所以让我们来看看下面的选项:
-
这个
detectMultiScale
功能是一个检测对象的通用函数。因为我们叫它在面部级联,这就是它检测到的。 -
第一个选项是灰度图像。
-
第二个是
scaleFactor
...因为有些脸可能离摄像机更近,所以看起来比后面的脸要大。比例因子对此进行补偿。 -
该检测算法使用移动窗口检测物体。
minNeighbors
定义在当前对象声明找到的脸之前,在当前对象附近检测到多少个对象。minSize
同时,给出每个窗口的大小。
注:我取了这些字段常用的值。在现实生活中,您将尝试不同的窗口大小、比例因子等值,直到找到最适合您的值为止。
该函数返回一个矩形列表,其中它认为它找到了一张脸。接下来,我们将循环到它认为它发现了什么东西的地方。
print "Found {0} faces!".format(len(faces))
# Draw a rectangle around the faces
for (x, y, w, h) in faces:
cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)
此函数返回4个值:x
和y
矩形的位置,以及矩形的宽度和高度(w
, h
).
使用这些值绘制一个矩形。rectangle()
功能。
cv2.imshow("Faces found", image)
cv2.waitKey(0)
最后,我们显示图像,等待用户按下键。
检查结果
让我们根据ABBA的照片进行测试:
这起作用了。再来一张照片怎么样:
那个…不是一张脸。我们再试一次。我更改了参数,发现设置scaleFactor
把错误的脸去掉了。
What?
第一张照片是用高质量的相机拍的。第二个似乎是从远处拿来的,可能是用手机拍的。这就是为什么scaleFactor
必须修改。正如我说过的,你必须在逐个案例的基础上设置算法,以避免误报。
但是,请注意,由于这是基于机器学习,结果永远不会是100%的准确性。在大多数情况下,您将获得足够好的结果,但有时算法会将不正确的对象识别为Faces。
最后的代码可以找到。https://github.com/shantnu/FaceDetect