这篇博客将介绍如何使用预训练好的OpenCV Haar级联人脸、眼睛、嘴部检测器,并将它们应用于图片及实时视频流的检测。
人脸检测结果是最稳定和准确的。不幸的是,在许多情况下,眼睛检测和嘴巴检测结果是不可用的——对于面部特征/部分提取,强烈建议使用python,dlib,OpenCV提取眼睛,鼻子,嘴唇及下颌,dlib的检测要比眼睛Haar级联,嘴巴Haar级联本身更稳定,甚至更快。
Haar级联算法是OpenCV最流行的目标检测算法,主要优点是速度太快了,尽管许多算法(如HOG+线性SVM、SSDs、更快的R-CNN、YOLO等等)比Haar级联算法更精确。但如果需要纯粹的速度,就是无法打败OpenCV的Haar cascades。
Haar Cascades尤其是在资源受限的设备中工作时,当无法使用更昂贵的计算对象检测器时,效果显著。Haar级联的缺点是容易出现假阳性检测,应用于推理/检测时需要进行参数调整。
Haar级联检测的效果如下:
可以看到图中有固定大小的面在移动,就可以“训练”分类器来识别图像的给定区域是否包含人脸。
面部、眼睛、嘴部检测效果图如下:
有时候会有假阳性结果,如下图:
可以看到检测并不是最准确的,脸部是准确的,但嘴和眼睛级联发生好几个假阳性。当眨眼时,有两种情况发生:(1)眼睛区域不再被检测到,或者(2)它被错误地标记为嘴巴,在许多帧中往往有多个嘴巴检测结果。
Haar级联检测5个特征:边缘特征、线特征、四角-矩形的特征,计算特征需要从黑色区域下的像素总和中减去白色区域下的像素总和。有趣的是,这些特征在人脸检测中具有实际的重要性:
给定这五个矩形区域及其相应的和差,就可以形成能够对人脸的各个部分进行分类的特征。
Haar级联的一些好处是,由于使用了积分图像(也称为求和面积表),它们在计算类似Haar的特征时非常快。通过使用AdaBoost算法,它们对特征选择也非常有效。最重要的是,它们可以检测图像中的人脸,而不考虑人脸的位置或比例。
Haar级联检测器的问题与局限主要有3点:
OpenCV库维护一个预先训练好的Haar级联库。包括:
还提供了其他经过预训练的Haar级联,包括一个用于俄罗斯牌照,另一个用于猫脸检测。
可以使用cv2.CascadeClassifer从磁盘加载预先训练好的Haar级联检测器:
detector = cv2.CascadeClassifier(path)
可以使用detectMultiScale对其进行预测:
results = detector.detectMultiScale(
gray, scaleFactor=1.05, minNeighbors=5,
minSize=(30, 30), flags=cv2.CASCADE_SCALE_IMAGE)
# USAGE
# python opencv_haar_cascades_images.py --cascades cascades --image ml.jpg
# 导入必要的包
import argparse
import os # 不同系统路径分隔符
import cv2 # opencv绑定
import imutils
# 构建命令行参数及解析
# --cascades 级联检测器的路径
ap = argparse.ArgumentParser()
ap.add_argument("-c", "--cascades", type=str, default="cascades",
help="path to input directory containing haar cascades")
ap.add_argument("-i", "--image", type=str, default="ml2.jpg",
help="path to input image")
args = vars(ap.parse_args())
# 初始化字典,并保存Haar级联检测器名称及文件路径
detectorPaths = {
"face": "haarcascade_frontalface_default.xml",
"eyes": "haarcascade_eye.xml",
"smile": "haarcascade_smile.xml",
}
# 初始化字典以保存多个Haar级联检测器
print("[INFO] loading haar cascades...")
detectors = {}
# 遍历检测器路径
for (name, path) in detectorPaths.items():
# 加载Haar级联检测器并保存到map
path = os.path.sep.join([args["cascades"], path])
detectors[name] = cv2.CascadeClassifier(path)
# 从磁盘读取图像,缩放,并转换灰度图
print(args['image'])
image = cv2.imread(args["image"])
image = imutils.resize(image, width=500)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 使用合适的Haar检测器执行面部检测
faceRects = detectors["face"].detectMultiScale(
gray, scaleFactor=1.05, minNeighbors=5, minSize=(30, 30),
flags=cv2.CASCADE_SCALE_IMAGE)
# 遍历检测到的所有面部
for (fX, fY, fW, fH) in faceRects:
# 提取面部ROI
faceROI = gray[fY:fY + fH, fX:fX + fW]
# 在面部ROI应用左右眼级联检测器
eyeRects = detectors["eyes"].detectMultiScale(
faceROI, scaleFactor=1.1, minNeighbors=10,
minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)
# 在面部ROI应用嘴部检测
smileRects = detectors["smile"].detectMultiScale(
faceROI, scaleFactor=1.1, minNeighbors=10,
minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)
# 遍历眼睛边界框
for (eX, eY, eW, eH) in eyeRects:
# 绘制眼睛边界框(红色)
ptA = (fX + eX, fY + eY)
ptB = (fX + eX + eW, fY + eY + eH)
cv2.rectangle(image, ptA, ptB, (0, 0, 255), 2)
# 遍历嘴部边界框
for (sX, sY, sW, sH) in smileRects:
# 绘制嘴边界框(蓝色)
ptA = (fX + sX, fY + sY)
ptB = (fX + sX + sW, fY + sY + sH)
cv2.rectangle(image, ptA, ptB, (255, 0, 0), 2)
# 绘制面部边界框(绿色)
cv2.rectangle(image, (fX, fY), (fX + fW, fY + fH),
(0, 255, 0), 2)
# 展示输出帧
cv2.imshow("image", image)
cv2.waitKey(0)
# 清理工作
cv2.destroyAllWindows()
# USAGE
# python opencv_haar_cascades.py --cascades cascades
# 导入必要的包
import argparse
import os # 不同系统路径分隔符
import time # sleep 2秒
import cv2 # opencv绑定
import imutils
from imutils.video import VideoStream # 访问网络摄像头
# 构建命令行参数及解析
# --cascades 级联检测器的路径
ap = argparse.ArgumentParser()
ap.add_argument("-c", "--cascades", type=str, default="cascades",
help="path to input directory containing haar cascades")
args = vars(ap.parse_args())
# 初始化字典,并保存Haar级联检测器名称及文件路径
detectorPaths = {
"face": "haarcascade_frontalface_default.xml",
"eyes": "haarcascade_eye.xml",
"smile": "haarcascade_smile.xml",
}
# 初始化字典以保存多个Haar级联检测器
print("[INFO] loading haar cascades...")
detectors = {}
# 遍历检测器路径
for (name, path) in detectorPaths.items():
# 加载Haar级联检测器并保存到map
path = os.path.sep.join([args["cascades"], path])
detectors[name] = cv2.CascadeClassifier(path)
# 初始化视频流,允许摄像头预热2s
print("[INFO] starting video stream...")
vs = VideoStream(src=0).start()
time.sleep(2.0)
# 遍历视频流的每一帧
while True:
# 获取视频流的每一帧,缩放,并转换灰度图
frame = vs.read()
frame = imutils.resize(frame, width=500)
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 使用合适的Haar检测器执行面部检测
faceRects = detectors["face"].detectMultiScale(
gray, scaleFactor=1.05, minNeighbors=5, minSize=(30, 30),
flags=cv2.CASCADE_SCALE_IMAGE)
# 遍历检测到的所有面部
for (fX, fY, fW, fH) in faceRects:
# 提取面部ROI
faceROI = gray[fY:fY + fH, fX:fX + fW]
# 在面部ROI应用左右眼级联检测器
eyeRects = detectors["eyes"].detectMultiScale(
faceROI, scaleFactor=1.1, minNeighbors=10,
minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)
# 在面部ROI应用嘴部检测
smileRects = detectors["smile"].detectMultiScale(
faceROI, scaleFactor=1.1, minNeighbors=10,
minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)
# 遍历眼睛边界框
for (eX, eY, eW, eH) in eyeRects:
# 绘制眼睛边界框(红色)
ptA = (fX + eX, fY + eY)
ptB = (fX + eX + eW, fY + eY + eH)
cv2.rectangle(frame, ptA, ptB, (0, 0, 255), 2)
# 遍历嘴部边界框
for (sX, sY, sW, sH) in smileRects:
# 绘制嘴边界框(蓝色)
ptA = (fX + sX, fY + sY)
ptB = (fX + sX + sW, fY + sY + sH)
cv2.rectangle(frame, ptA, ptB, (255, 0, 0), 2)
# 绘制面部边界框(绿色)
cv2.rectangle(frame, (fX, fY), (fX + fW, fY + fH),
(0, 255, 0), 2)
# 展示输出帧
cv2.imshow("Frame", frame)
key = cv2.waitKey(1) & 0xFF
# 按下‘q’键,退出循环
if key == ord("q"):
break
# 清理工作
cv2.destroyAllWindows()
vs.stop()