face_recognition(face_recognition中文使用说明)号称是世界上最简单的开源人脸识别库,可以通过Python或命令行识别和操作人脸。本项目采用face_recognition开源库,利用网络摄像头(DroidCam,官网)实现人脸检测、人脸关键点提取、人脸识别对比、人脸识别之后在原图上标注姓名并语音播报识别成功后人的姓名,未识别的人实现报警提示。
dlib版本需要和Python版本相对应。由于我的Python版本是3.8.10,所以我去搜寻dlib-cp38。dlib版本如下:
dlib版本
如我将whl文件保存在 D:\data 中,则在命令行输入:
pip install D:\data\dlib-19.19.0-cp38-cp38-win_amd64.whl
使用pip安装(使用了国内镜像源),在命令行输入:
pip install face_recognition -i https://pypi.douban.com/simple
import face_recognition
import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont
#利用win32com来调用Windows操作系统内置的语音引擎实现文字的发音
import win32com.client as win
import winsound
import time
#这是一个从您的网络摄像头的实时视频上运行人脸识别的项目。
# 主要功能如下:
#1.人脸识别,并标记姓名
#2.标注人脸的关键点
#3.语音播报识别人脸的姓名,陌生人会播放报警声音。
# 获取webcam(网络摄像头) #0的引用(默认值)
video_capture = cv2.VideoCapture(0)
# 加载示例图片并学习如何识别它。
hxh_image = face_recognition.load_image_file("./photo/张三.jpg")
hxh_face_encoding = face_recognition.face_encodings(hxh_image)[0]
# 加载示例图片并学习如何识别它。
hmy_image = face_recognition.load_image_file("./photo/王五.jpg")
hmy_face_encoding = face_recognition.face_encodings(hmy_image)[0]
# 加载示例图片并学习如何识别它。
hyx_image = face_recognition.load_image_file("./photo/李四.jpg")
hyx_face_encoding = face_recognition.face_encodings(hyx_image)[0]
# 加载示例图片并学习如何识别它。
zcy_image = face_recognition.load_image_file("./photo/赵四.jpg")
zcy_face_encoding = face_recognition.face_encodings(zcy_image)[0]
# 加载示例图片并学习如何识别它。
wq_image = face_recognition.load_image_file("./photo/小明.jpg")
wq_face_encoding = face_recognition.face_encodings(wq_image)[0]
# 创建已知人脸编码及其名称的数组
known_face_encodings = [
hxh_face_encoding,
hmy_face_encoding,
hyx_face_encoding,
zcy_face_encoding,
wq_face_encoding
]
known_face_names = [
"张三",
"王五",
"李四",
"赵四",
"小明"
]
# 初始化一些变量
face_locations = []
face_encodings = []
face_names = []
process_this_frame = True
# 方法:解决中文乱码的方法
def addText(img, text, left, bottom):
# 判断图片是否为ndarray格式,转为RGB图片
if (isinstance(img, np.ndarray)):
img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
# 创建一个可以在给定图像上绘图的对象
draw = ImageDraw.Draw(img)
# 参数依次为 字体、字体大小、编码
fontStyle = ImageFont.truetype("./font/SIMYOU.TTF", 20, encoding="utf-8")
# 参数依次为位置、文本、颜色、字体
draw.text((left + 40, bottom + 25), text, (255, 255, 255), font=fontStyle)
# 转回BGR图片、ndarray格式
return cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)
#方法:绘制Landmars关键点
def show_landmarks(imge, landmarks):
for landmarks_dict in landmarks:
for landmarks_key in landmarks_dict.keys():
for point in landmarks_dict[landmarks_key]:
cv2.circle(imge, point, 2, (0, 0, 255), -1)
return imge
while True:
# 抓取一帧视频
ret, frame = video_capture.read()
# 只处理每一帧视频,以节省时间
if process_this_frame:
# 调整视频帧大小为1/4大小,以更快的人脸识别处理
small_frame = cv2.resize(frame, (0, 0), fx=0.25, fy=0.25)
# 将图像从BGR颜色(OpenCV使用)转换为RGB颜色(face_recognition使用)
rgb_small_frame = small_frame[:, :, ::-1]
# 找到当前帧视频中所有的人脸和人脸编码
face_locations = face_recognition.face_locations(rgb_small_frame)
face_encodings = face_recognition.face_encodings(rgb_small_frame, face_locations)
face_names = []
for face_encoding in face_encodings:
# 看看这张脸和已知的脸是否匹配
matches = face_recognition.compare_faces(known_face_encodings, face_encoding)
name = "非法闯入"
#计算距离
face_distances = face_recognition.face_distance(known_face_encodings, face_encoding)
# 使用与新面孔距离最小的已知面孔
best_match_index = np.argmin(face_distances)#0,1,2
if matches[best_match_index]:
name = known_face_names[best_match_index]
face_names.append(name)
#调用face_recognition库中的方法:
face_marks = face_recognition.face_landmarks(frame, None, "large")
#绘制关键点
frame = show_landmarks(frame, face_marks)
process_this_frame = not process_this_frame
# 显示结果
for (top, right, bottom, left), name in zip(face_locations, face_names):
# 缩放脸部位置,因为我们检测到的框架被缩放到1/4大小
top *= 4
right *= 4
bottom *= 4
left *= 4
# 在脸周围画一个框
cv2.rectangle(frame, (left, top), (right, bottom), (0, 0, 255), 2)
#绘制名字
frame = addText(frame, name, left, bottom)
#播放语音
speak = win.Dispatch("SAPI.SpVoice")
if(name == "非法闯入"):
speak.Speak(name)
time.sleep(1)
winsound.Beep(frequency=1440, duration=1000)#其中,FREQ是频率(以赫兹为单位),而持续时间是毫秒(毫秒)。
else:
speak = win.Dispatch("SAPI.SpVoice")
speak.Speak(name)
speak.Speak("欢迎回家")
# 显示结果图像
cv2.imshow('Video', frame)
# 按键盘上的“q”退出!
if cv2.waitKey(1) & 0xFF == ord('q'):
break
# 释放网络摄像头手柄
video_capture.release()
cv2.destroyAllWindows()
本项目为新手学习的一点记录,不足之处请各路大神指点!