因为我没有自己的摄像头,这里只是实现读取本地视频实现人脸检测,视频是抖音上下的。
import cv2
import sys
from PIL import Image
def CatchUsbVideo(window_name):
cv2.namedWindow(window_name)
# 视频来源,可以来自一段已存好的视频,也可以直接来自USB摄像头
cap = cv2.VideoCapture("/home/dong/Pictures/QQ视频20190417160108.mp4")
# 告诉OpenCV使用人脸识别分类器
classfier = cv2.CascadeClassifier("/home/dong/PycharmProjects/untitled/venv/lib/python3.6/site-packages/cv2/data/haarcascade_frontalface_alt2.xml")
# 识别出人脸后要画的边框的颜色,RGB格式
color = (0, 0, 0)
while cap.isOpened():
ok, frame = cap.read() # 读取一帧数据
if not ok:
break
# 将当前帧转换成灰度图像
grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=15, minSize=(32, 32), flags=4)
if len(faceRects) > 0: # 大于0则检测到人脸
for faceRect in faceRects: # 单独框出每一张人脸
x, y, w, h = faceRect
cv2.rectangle(frame, (x - 10, y - 10), (x + w, y + h), color, 2)
# 显示图像
cv2.imshow(window_name, frame)
c = cv2.waitKey(10)
if c & 0xFF == ord('q'):# 如果强制停止执行程序,结束视频放映
break
if __name__ == '__main__':
CatchUsbVideo("识别人脸区域")
运行结果
这里我介绍几个函数。
一 cv2.VideoCapture()
VideoCapture()中参数是0,表示打开笔记本的内置摄像头,参数是视频文件路径则打开视频,如
cap = cv2.VideoCapture(0)
是打开内置摄像头
cap = cv2.VideoCapture("/home/dong/Pictures/QQ视频20190417160108.mp4")
打开本地文件视频
二 cv2.CascadeClassifier()
告诉OpenCV使用人脸识别分类器
我的位置在/home/dong/PycharmProjects/untitled/venv/lib/python3.6/site-packages/cv2/data/
中,
有的在opencv中
/usr/local/share/OpenCV/haarcascades/haarcascade_frontalface_alt2.xml
三 ok, frame = cap.read()
cap.read()按帧读取视频,ok,frame是获cap.read()方法的两个返回值。其中ok是布尔值,如果读取帧是正确的则返回True,如果文件读取到结尾,它的返回值就为False。frame就是每一帧的图像,是个三维矩阵。
四 classfier.detectMultiScale
faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=15, minSize=(32, 32), flags=4)
1 grey 是输入图像
2 scaleFactor这个是每次缩小图像的比例,默认是1.1 ,我这里选用1.2
3 minNeighbors 它表明如果有15个框都重叠一起了,那这里肯定是脸部
我以前是 minNeighbors=3容易判断错误,有些不是脸部也给标记起来了,在我看来,minNeighbors可以提高精度。
4 minSize() 匹配物体的最小范围
maxSize()匹配物体的最大范围
5 flags=0:可以取如下这些值:
CASCADE_DO_CANNY_PRUNING=1, 利用canny边缘检测来排除一些边缘很少或者很多的图像区域
CASCADE_SCALE_IMAGE=2, 正常比例检测
CASCADE_FIND_BIGGEST_OBJECT=4, 只检测最大的物体
这个函数得到的
faceRects 是一个一维数组【x ,y ,w, h]分别代表着上左,上右,下左,下右的坐标
五 cv2.waitKey(10)
waitKey()函数的功能是不断刷新图像,频率时间为delay,单位为ms。
在此感谢博主https://blog.csdn.net/Zhou_yongzhe/article/details/80310537的宝贵经验