OpenCV是如今最流行的计算机视觉库,而我们今天就是要学习如何安装使用OpenCV,以及如何去访问我们的摄像头。然后我们一起来看看写一个人脸检测程序是如何地简单,简单到只需要几行代码。
在开始之前,我假设你已经对Python有一定的了解。当然,如果你觉得你还不够格,这里有推荐一些学习Python的电子书,你可以先学习下Python,如此可以让你更好地理解接下来的步骤。另外,这里还推荐一本电子书来学习OpenCV。
好,不浪费时间,开始吧。
To setup opencv in python environment you will need these things ready ( match the versions to follow along with this tutorial),
首先我们需要先准备好这些环境(版本记得配好):
- Python 2.x
- OpenCV 2.x
- Numpy库 (这个可以在稍后用pip下载)
首先,对于下载Python,我们可以先到官网上下对应的版本,如果是Windows就可能是msi格式的版本,如果是Mac就可能是pkg格式的安装包,如果是Linux则可能是源码包。
安装和Python后打开命令行就可以使用pip命令进行Python包的安装了,如:
由于OpenCV使用Numpy库,因此先通过命令pip install numpy
安装Numpy库。安装完后,尝试导入,没有报错则ok:
然后进入OpenCV官网下对应的版本并安装,尝试导入:
尝试人脸检测
万事俱备,只欠东风。我们来写代码检测人脸吧,来一发OpenCV的Hello world。
在这里我们准备使用pre-trained的XML文件,这些XML文件都较难训练,但是我们不需要担心,因此OpenCV已经为我们提供了很多人脸检测相关的pre-trained分类器。
想要使用这写分类器,我们需要将分类器的XML文件haarcascade_frontalface_default.xml
从opencv文件夹/sources/data/haarcascades/
下复制到我们的项目目录下,就是我们将要写程序的目录下。如果没有opencv文件夹/sources/data/haarcascades/
这个目录,可以尝试找一下opencv文件夹/share/OpenCV/haarcascades/
。只要找到如下文件即可:
然后如果我们要加载这个分类器的话,如此就好:
detector = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
然后接下来我们先来测试一下摄像头吧,
cap = cv2.VideoCapture(0)
ret, img = cap.read()
cv2.imshow('windowname', img)
cv2.waitKey(0)
# 释放摄像头资源
cap.release()
以上的代码是调用你电脑的0号摄像头,并展示出来。当然,如果你有多个摄像头,那么你也可以试试别的id,修改VideoCapture函数的参数即可。
其中cap.read()就是从摄像头获取到图像,这个函数返回了两个变量,第一个为布尔值表示成功与否,以及第二个是图像。
然后程序通过imshow()展示图片,其第一个传入的参数为窗口的名称,而第二个就是要展示的图片,以上代码传入的就是我们的自拍。
而waitKey是用来停在图片的展示界面,让你看清楚,参数可以是10、100、1000等,单位是毫秒,这里填0就是一直停着。注意了,如果停留的时间不够久,就可能看不见imshow的照片了。
运行了这段代码,你将会看到摄像头所拍摄的画面,一般来说就是你自己了。
接下来我们将图片先转换为灰度图片,
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
然后就开始了人脸检测之旅:
faces = detector.detectMultiScale(gray, 1.3, 5)
以上的这句代码会等到一串list,list中的每个都有x, y, height, width四个变量。其中list表示检测到的人脸,即list的size就是人脸的个数,而每个人脸在图片中的位置是(x, y, height, width)。
为了能让我们更直观地看出来检测结果,我们将这些人脸框出来:
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x + w, y + h), (255, 0, 0), 2)
更进一步
现在我们已经通过摄像头检测到人脸了,但是我们真正需要的是不是一张静态的图片,我们需要的是一个能检测的实时动态视频流。因此我们加一个循环,然后不断的检测,最终在显示在新窗口中。
detector = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
cap = cv2.VideoCapture(0)
while True:
ret, img = cap.read()
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
faces = detector.detectMultiScale(gray, 1.3, 5)
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x + w, y + h), (255, 0, 0), 2)
cv2.imshow('frame', img)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
需要注意的是,结尾用了waitKey和ord实现了按q退出的功能,就是每一毫秒都在检测键盘有没有按下了q,要是按下了就退出循环了。接下来就释放资源。
总结
在本文中,我们学习了如何使用Python中的OpenCV,即通过代码写了一个人脸检测的程序。我们温习或学习了这些知识点:
- 使用OpenCV的分类器
- 从摄像头中读取照片
- 在图片上换框框
- 在新窗口上展示图片
- 实时地进行人脸检测
P.S. 你们发现了XML那里有一个叫猫脸识别的文件吗!!!
先这样吧
原文,若有错误之处请指出,更多地关注煎鱼。