首先,我们需要大量的正样本图像(人脸图像)和负样本图像(没有人脸的图像)来训练分类器。 我们需要从中提取特征。 下图中会用到Haar特征,就像我们的卷积核一样,每个特征都是一个值,等于黑色矩形中的像素值减去白色矩形中的像素值之和。
Haar 特征值反映了图像的灰度变化。 例如,人脸的某些特征可以简单地用矩形特征来描述。 眼睛比脸颊更黑,鼻子两侧比鼻梁更黑,嘴巴比周围更黑。 Haar特征可以用在图像的任意位置,大小也可以任意改变,所以矩形特征值是矩形模板类型、矩形位置和矩形大小三个因素的函数。 因此,类别、大小和位置的变化使得一个小的检测窗口包含很多矩形特征。
得到图像的特征后,训练一个由决策树构建的AdaBoost级联决策器识别人脸。
OpenCV为我们提供了一些检测物体的文件,如人脸、眼睛、猫脸等。
检测过程如下:
1. 读取图片并将其转换为灰度图像。
2. 为人脸检测实例化分类器对象。
3. 执行人脸检测。
# 实例化级联分类器
classifier =cv.CascadeClassifier( "haarcascade_frontalface_default.xml" )
# 加载分类器
classifier.load('haarcascade_frontalface_default.xml')
# 执行检测
rect = classifier.detectMultiScale(gray, scaleFactor, minNeighbors, minSize,maxSize)
参数:
gray:待检测图像。
scaleFactor:前后两次扫描中搜索窗口的比例因子。
minNeighbors: 目标只有在至少被检测到 minNeighbors 次时才会被认为是目标。
minSize 和 maxSize:目标的最小尺寸和最大尺寸。
最后显示输出图像即可。
例1:在图像中识别人脸。
import cv2 as cv
import matplotlib.pyplot as plt
# 1.以灰度图的形式读取图片
img = cv.imread("mht.jpg")
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 2.实例化OpenCV人脸识别的分类器
root_path = 'D:\\anaconda3\\Lib\\site-packages\\cv2\\data\\'
face_cas = cv.CascadeClassifier(root_path + "haarcascade_frontalface_default.xml")
face_cas.load(root_path + 'haarcascade_frontalface_default.xml')
# 3.调用识别人脸
faceRects = face_cas.detectMultiScale(gray, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
for faceRect in faceRects:
x, y, w, h = faceRect
# 框出人脸
cv.rectangle(img, (x, y), (x + h, y + w), (0, 255, 0), 3)
# 5. 检测结果的绘制
plt.figure(figsize=(8, 6), dpi=100)
plt.imshow(img[:, :, ::-1])
plt.xticks([]), plt.yticks([])
plt.show()
输出:
例2:在视频中识别人脸。
import cv2 as cv
import matplotlib.pyplot as plt
# 1.读取视频
cap = cv.VideoCapture("image/KartRider.mp4")
# 2.在每一帧数据中进行人脸识别
root_path = 'D:\\anaconda3\\Lib\\site-packages\\cv2\\data\\'
while cap.isOpened():
ret, frame = cap.read()
if ret:
gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
# 3.实例化OpenCV人脸识别的分类器
face_cas = cv.CascadeClassifier(root_path + "haarcascade_frontalface_default.xml")
face_cas.load(root_path + 'haarcascade_frontalface_default.xml')
# 4.调用识别人脸
faceRects = face_cas.detectMultiScale(gray, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
for faceRect in faceRects:
x, y, w, h = faceRect
# 框出人脸
cv.rectangle(frame, (x, y), (x + h, y + w), (0, 255, 0), 3)
cv.imshow("frame", frame)
if cv.waitKey(1) & 0xFF == ord('q'):
break
# 5. 释放资源
cap.release()
cv.destroyAllWindows()