人脸检测的目标是找出图像中所有的人脸对应的位置,算法的输出是人脸外接矩形在图像中的坐标,可能还包括姿态如倾斜角度等信息。作为机器学习深度学习的重要组成部分,人脸检测的基本算法至关重要。
安装OpenCV的主要目的是下载调用做人脸检测的XML文件。
首先在OpenCV官网上下载OpenCV Home - OpenCV,然后点击Library的Releases:
然后将会出现下图界面,选择你想下载的OpenCV的windows版本进入下载:
点进入等待五秒会自动下载,不过有的人可能会下载速度很慢,可能是外网的限制,出现如下图这种下载十几个小时的情况:
在这里我推荐一种下载方法,下载一个迅雷下载器,然后将你选择的版本的OpenCV下载的链接复制:
然后打开迅雷,在迅雷中搜索,然后点击下载会快很多大概几分钟就下好了。
下载完成后,会有一个OpenCV的应用程序,其实是一个压缩包,双击运行(其实就是解压),然后会生成一个opencv文件,打开里面有如下内容:
build里面是OpenCV使用时的一些库文件,sources是OpenCV官方为我们提供的demo源码。然后在sources的data文件夹下面有一个haarcascades的文件夹,其中包含了OpenCV人脸检测的XML文件,可用于检测静态图片、视频和摄像头所得到的图像中的人脸,打开结果如下:
具体的一些用处如下图:
然后要记住这个文件所在的路径,因为在编写代码的时候会调用这些XML文件。
首先 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python下载cv2
图片中的人脸识别,需要对图片进行读取,灰度化,然后在进行级联算法(也就是调用XML文件),然后将结果加载到一个变量里面去,通过cv.retangle用矩形对人脸进行标记,具体代码如下,相关解释在代码中有注释:
import cv2 as cv
# 读取照片,转换成灰度图
def face_detect_img():
gray_img = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
# 将级联算法加载到一个变量中
haar_face_cascade = cv.CascadeClassifier('haarcascade_frontalface_default.xml')
faces = haar_face_cascade.detectMultiScale(gray_img, scaleFactor=1.1,minNeighbors=3)
# 在图像中画上矩形框和圆框
for (x, y, w, h) in faces:
print(x,y,w,h)
cv.rectangle(img, (x, y), (x + w, y + h), (156, 114, 32), 2)
cv.circle(img,(x+w//2,y+h//2),w//2,(56,146,212),2)
cv.imshow("detect",img)
# 加载图片
img = cv.imread('lovely.jpg')
face_detect_img()
cv.waitKey(0) # 无限次循环使图片一直在屏幕显示
cv.destroyAllWindows() # 释放内存
这段代码中,最容易出错的地方时XML文件和图片的路径问题,我这个写法是因为把XML文件和图片复制在了和代码同一文件夹下面,所以只用写相对路径,具体编程序的时候自己要修改路径到自己的图片路径和XML文件路径。同时注意文件夹名字不能有汉字,而且文件目录区分的"\"应改为“/”,例如我的XML文件的绝对路径格式如下:
D:/OpenCV package/opencv/sources/data/haarcascades/haarcascade_frontalface_default.xml
运行结果如下图:
视屏中的人脸识别与图像本质上没什么区别。视频是图片的一帧一帧的播放的结果,用OpenCV里面的读取视频的函数获取视频文件:cv.VideoCapture(文件名),具体代码如下:
import cv2 as cv
# 读取照片,转换成灰度图
def face_detect_img(img):
gray_img = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
# 将级联算法加载到一个变量中
#scaleFactor为缩放比例,minNeighbors为至少迭代多少次确定结果
haar_face_cascade = cv.CascadeClassifier('haarcascade_frontalface_default.xml')
faces = haar_face_cascade.detectMultiScale(gray_img, scaleFactor=1.1,minNeighbors=3)
# 在图像中画上矩形框和圆框
for (x, y, w, h) in faces:
print(x,y,w,h)
cv.rectangle(img, (x, y), (x + w, y + h), (156, 114, 32), 2)
# cv.circle(img,(x+w//2,y+h//2),w//2,(56,146,212),2)
cv.imshow("detect",img)
# 加载图片
cap = cv.VideoCapture('me.mp4')
while True:
flag,frame=cap.read()
if not flag:
break
face_detect_img(frame)
if ord('q') == cv.waitKey(10):
break
cv.destroyAllWindows() # 释放内存
cap.release()
同样要特别注意XML文件和图片的调用路径问题。