【python+OpenCV+dlib】实现从视频中检测人脸数并保存最清晰的人脸

运行环境:python 3.7.4+OpenCV 4.1.2.30+dlib 19.16.0+cmake 3.15.3,此外还有visual studio2019和boost必须也要有,这些都可以在百度上搜到并下载,注意版本,dlib和cmake是我无数次失败后才找到的对应的版本,不然会在配置时出错。
本程序的整体思路是先利用OpenCV加载视频,利用dlib提供的predictor和model获取人脸及特征,最后再利用cv2.Laplacian(face1,face2).var()方法获取清晰度评估。
利用dlib进行人脸识别时需要以下两个文件:1、shape_predictor_68_face_landmarks.dat;
2、dlib_face_recognition_resnet_model_v1.dat
下载地址:http://dlib.net/files/
如果对你有所帮助请点关注,谢谢!
提醒一下,2020年4月之前不要作为研究生结课作业使用

import cv2,dlib,os,glob,numpy,time


# 声明各个资源路径
super_path = os.path.abspath("..")+"/resourses/"
predictor_path = super_path + "shape_predictor_68_face_landmarks.dat"
model_path = super_path + "dlib_face_recognition_resnet_model_v1.dat"
img_path = super_path + "pictures"
video_path = super_path + "111.mp4"

# 加载视频
video = cv2.VideoCapture(video_path)

# 加载模型
detector = dlib.get_frontal_face_detector()
sp = dlib.shape_predictor(predictor_path)
facerec = dlib.face_recognition_model_v1(model_path)

# 创建窗口
cv2.namedWindow("人脸识别", cv2.WINDOW_KEEPRATIO)
cv2.resizeWindow("人脸识别", 300,540)

descriptors = []
faces = []
# 处理视频,按帧处理
suc,frame = video.read()
flag = True                  # 标记是否是第一次迭代
i = 0                        # 记录当前迭代到的帧位置
while suc:
    if i % 3 == 0:           # 每3帧截取一帧
        # 转为灰度图像处理
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        dets = detector(gray, 1)        # 检测帧图像中的人脸
        # 处理检测到的每一张人脸
        for k,d in enumerate(dets):
            shape = sp(gray,d)
            # print(d, d.left(), d.right(), d.bottom(), d.top())
            cv2.rectangle(frame, (d.left(), d.top()), (d.right(), d.bottom()), (0, 255, 0), 2)   # 对人脸画框
            face_descriptor = facerec.compute_face_descriptor(frame, shape)      # 提取特征
            v = numpy.array(face_descriptor)
            # 将第一张人脸照片直接保存
            if flag:
                descriptors.append(v)
                faces.append(frame)
                flag = False
            else:
                sign = True                 # 用来标记当前人脸是否为新的
                l = len(descriptors)
                for i in range(l):
                    distance = numpy.linalg.norm(descriptors[i] - v)    # 计算两张脸的距离
                    # 取阈值0.5,距离小于0.5则认为人脸已出现过
                    if distance < 0.5:
                        # print(faces[i].shape)
                        face_gray = cv2.cvtColor(faces[i], cv2.COLOR_BGR2GRAY)
                        # 比较两张人脸的清晰度,保存更清晰的人脸
                        if cv2.Laplacian(gray, cv2.CV_64F).var() > cv2.Laplacian(face_gray, cv2.CV_64F).var():
                            faces[i] = frame
                        sign = False
                        break
                # 如果是新的人脸则保存
                if sign:
                    descriptors.append(v)
                    faces.append(frame)
        cv2.imshow("人脸识别", frame)      # 在窗口中显示
        index = cv2.waitKey(1)
        if index == 27:
            video.release()
            cv2.destroyWindow("人脸识别")
            break
    suc,frame = video.read()
    i += 1

print(len(descriptors))     # 输出不同的人脸数

# 将不同的比较清晰的人脸照片输出到本地
j = 1
for fc in faces:
    cv2.imwrite(super_path + "/result/" + str(j) +".jpg", fc)
    j += 1

你可能感兴趣的:(【python+OpenCV+dlib】实现从视频中检测人脸数并保存最清晰的人脸)