简介:本项目主要使用python语言,主要的模块库有os,opencv-python,opencv-contrib-python。项目主要分为三个部分,人脸录入,训练数据,实现人脸的识别。本博客包含源代码,以及各个功能模块,需求分析的详细解释,当然本项目只是简单的实现人脸识别,可以在此基础上扩展。
我们项目的主要功能,也就是最终的实现效果是当我们打开摄像头后,在摄像头里会出现我的人脸头像,且对我的人脸进行识别,在画面中能够框出我的人脸部分并显示出画面中人脸的姓名。
项目主要包含以下三个大的模块:人脸录入、训练数据、人脸识别。
主要用到的模块:
主要目的:通过人脸录入模块去得到人脸的数据,然后通过已知数据去训练模型,得到人脸的姓名标签和人脸的一一对应关系,那么进行人脸的识别时,就能根据训练的数据去识别画面中的人脸是谁了,能够在画面中显示出它的名字。
主要功能:首先能打开摄像头,找到框出人脸的部分,且我们要对人脸部分截取保存,因为我们是训练姓名和人脸一一对应,所有别忘了保存图片的时候让用户输入姓名,为了减小图片大小,我们可以将截取的图片转化成灰度图片,不需要彩色的。步骤如下:
主要目的:通过保存的数据,使用模块自带的训练器,训练得到姓名和人脸的一一对应关系。
主要功能:读取文件的 图片和姓名,开始训练数据,训练结束将数据保存。步骤如下:
主要目的:根据所训练的数据,能够在我们打开摄像头的时候,标记出画面中的人脸部分,且在画面中显示人脸的姓名。
主要功能:能够打开摄像头,能够框出画面中的人脸部分,能够识别画面中的人脸并在画面中显示人脸的姓名。步骤如下:
我们将本项目中用到一些路径定义为宏,保存到python文件中,命名为hong,py。将人脸灰度照片保存到文件夹中,建立文件夹data。训练数据也需要保存到文本里面,新建文本文件命名为Training_data。新建三个python文件,分别用于三个模块的具体实现。项目目录如下:
宏文件源代码供参考:
INPUT_FACE_WINDOWS_NAME = 'input_face'
BGR_GREEN = (0, 255, 0)
BGR_RED = (0, 0, 255)
FACE_MIN_SIZE = (60, 60)
# 保存图片的路径
IMG_SAVE_PATH = './data'
# 级联人脸特征检测器
FACE_CLASSIFIER_PATH = 'D:/python_project/Lib/site-packages/cv2/data/haarcascade_frontalface_alt2.xml'
TRAIN_DATA_SAVE_PATH = './Training_data'
FACE_RECOGNITION_WINDOW_NAME = "Face recognition"
FONT_SCALE = 0.75 # 字体比例
TEXT_THICKNESS = 1 # 线条粗细
GRAPH_THICKNESS = 1
import cv2 as cv
from hong import *
import os
def img_extract_faces(img): # 将人脸图片转为灰度
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY) # 转成灰度图像
face_classifier = cv.CascadeClassifier(FACE_CLASSIFIER_PATH) # 加载级联检测器,人脸特征分类器
return face_classifier.detectMultiScale(gray, minSize=FACE_MIN_SIZE), gray
def get_image_name(name): # 获取图片的命名名字,格式:1.lihua.jpg
# 1.lihua.jpg 格式。如果文件中没有则加入,如果已有则替换
# 把读出来的图片名称,用字典存,然后用name去字典里面找有没有。
f = os.listdir(IMG_SAVE_PATH) # os.listdir(IMG_SAVE_PATH)返回目标路径里的文件列表
if len(f) == 0: # 文件列表f的长度为0则表示没有图片,编号为1
name_number = 1
else: # 说明原文件有人脸照片,如果出现相同人脸姓名替换成新的,没有编号为最大值max.name.jpg加入进去。
name_map = {f.split('.')[1] : int(f.split('.')[0]) for f in os.listdir(IMG_SAVE_PATH)}
name_number = name_map[name] if name in name_map else max(name_map.values())+1
# return IMG_SAVE_PATH + str(name_number) + "." + name + ".jpg"
return str(name_number) + "." + name + ".jpg"
def save_face(faces, img, name): # 保证只有一个人脸出现在画面中
if len(faces) == 0:
print('没有检测到人脸,请调整!!!')
if len(faces) > 1:
print('检测到多个人脸,请调整!!!')
x, y, w, h = faces[0]
# 保存人脸部分,保存到文件夹,格式为 1.李华.jpg 格式。如果文件中没有则加入,如果已有则替换
cv.imwrite('./data/' + get_image_name(name), img[y: y + h, x: x + w])
print('录入成功,按 q 键退出')
def main():
# 人脸录入部分是为了得到人脸的数据,然后后面对人脸进行训练。
# 人脸数据信息主要有三个部分。1、人脸图片。 2、人脸名字。 3、编号(编号需要和名字需要统一。以为训练数据是拿序号和人脸进行比对)
# 1、人脸图片(打开摄像头、只取人脸部分、给用户实时展示人脸的画面(把人脸框出来)、保存和退出)
# 2、人脸名字。(用户输入)
# 3、编号。(文件名称记录)
# 打开摄像头
cap = cv.VideoCapture(0)
if not cap.isOpened():
print('连接摄像头失败')
# 输入人脸的名字
name = input("请输入姓名:")
if name == ' ':
print('姓名不能为空,请重新输入!!!')
print('姓名输入完成:按 s 保存,按 q 退出。')
# 循环读取摄像头的每一帧画面,然后识别画面中的人脸,识别后只保存人脸部分,作为训练数据。
while True:
ret, frame = cap.read()
if not ret:
print('读取失败')
break
# 检测人脸,且提取人脸部分。这部分直接使用一个函数封装起来。
faces, gray = img_extract_faces(frame)
# 框出人脸
for x, y, w, h in faces:
cv.rectangle(
img=frame, pt1=(x, y), pt2=(x+w, y+h),
color=BGR_GREEN, thickness=1
)
cv.imshow(INPUT_FACE_WINDOWS_NAME, frame)
# 保存和退出
k = cv.waitKey(1)
if k == ord('s'):
# 保存图像,(只需保存灰度图像)
save_face(faces, gray, name)
elif k == ord('q'):
break
# 释放内存
cap.release()
cv.destroyAllWindows()
if __name__ == '__main__':
main()
运行imput_face.py录入人脸:
点击英文的s键,即可保存人脸到data文件中,如下图所示:
import cv2 as cv
import os
from hong import *
import numpy as np
def main():
# 获取图片完整路径
image_paths = [os.path.join(IMG_SAVE_PATH, f) for f in os.listdir(IMG_SAVE_PATH)]
# 遍历列表中的图片
faces = [cv.imread(image_path, 0) for image_path in image_paths]
# 获取训练对象
img_ids = [int(f.split('.')[0])for f in os.listdir(IMG_SAVE_PATH)]
recognizer = cv.face.LBPHFaceRecognizer_create()
recognizer.train(faces, np.array(img_ids))
print(faces, np.array(img_ids))
# 保存文件
recognizer.write(TRAIN_DATA_SAVE_PATH)
if __name__ == '__main__':
main()
运行train.py文件训练data文件夹里面的数据:
"""
通过摄像头识别人脸(LBPH识别器(训练的数据,和当前的人脸图片))得到编号。编号和人脸的对应关系,标记人脸和名字并展示画面
创建识别器,加载训练数据
读取文件构造编号和人脸的关系
打开摄像头
循环取每帧画面
人脸检测且提取人脸部分
遍历人脸进行识别
框出人脸部分且实时展示画面(画面上带有 )
关闭摄像头和窗口
"""
import os
import cv2 as cv
from cv2 import face
from hong import *
from train import *
from imput_face import img_extract_faces
def get_color_text(confidence, name):
if confidence > 85:
return BGR_RED, "unknown"
return BGR_GREEN, name
def main():
# 创建识别器
recognizer = cv.face.LBPHFaceRecognizer_create()
recognizer.read(TRAIN_DATA_SAVE_PATH)
# 读取文件构造编号和人脸的关系。以字典的形式保存编号和人脸名字的关系
name_map = {int(f.split('.')[0]): f.split('.')[1] for f in os.listdir(IMG_SAVE_PATH)}
# 打开摄像头
cap = cv.VideoCapture(0)
if not cap.isOpened():
print('连接摄像头失败')
print("按q退出")
# 循环取每帧画面
while True:
ret, frame = cap.read()
if not ret:
print('读取失败')
break
# 人脸检测,且提取人脸部分。
faces, gray = img_extract_faces(frame)
# 遍历人脸进行识别
for x, y, w, h in faces:
img_id, confidence = recognizer.predict(gray[y: y+h, x: x+w])
# 返回图片编号和置信度。置信度为两张图片的相似程度
# 框出人脸且实时展示画面
color, text = get_color_text(confidence, name_map[img_id])
cv.putText(
img=frame, text=text, org=(x, y),
fontFace=cv.FONT_HERSHEY_SIMPLEX, fontScale=FONT_SCALE,
color=color, thickness=TEXT_THICKNESS
)
cv.circle(
img=frame, center=(x+w//2, y+h//2),
radius=w // 2,
color=color, thickness=GRAPH_THICKNESS
)
cv.imshow(FACE_RECOGNITION_WINDOW_NAME, frame)
if cv.waitKey(1) == ord('q'):
break
# 关闭摄像头,释放空间
cap.release()
cv.destroyAllWindows()
if __name__ == '__main__':
main()
运行face_recognition.py文件进行人脸识别:
项目介绍到这里,感谢阅读!!!