Python实现人脸识别

文章目录

  • 前言
  • 一、face_recognition的安装
    • 1.安装dlib
    • 1.安装face_recognition
  • 二、上源码
  • 总结


前言

face_recognition(face_recognition中文使用说明)号称是世界上最简单的开源人脸识别库,可以通过Python或命令行识别和操作人脸。本项目采用face_recognition开源库,利用网络摄像头(DroidCam,官网)实现人脸检测、人脸关键点提取、人脸识别对比、人脸识别之后在原图上标注姓名并语音播报识别成功后人的姓名,未识别的人实现报警提示。

一、face_recognition的安装

1.安装dlib

dlib版本需要和Python版本相对应。由于我的Python版本是3.8.10,所以我去搜寻dlib-cp38。dlib版本如下:
dlib版本
如我将whl文件保存在 D:\data 中,则在命令行输入:

pip install D:\data\dlib-19.19.0-cp38-cp38-win_amd64.whl

1.安装face_recognition

使用pip安装(使用了国内镜像源),在命令行输入:

pip install face_recognition -i https://pypi.douban.com/simple

二、上源码

import face_recognition
import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont
#利用win32com来调用Windows操作系统内置的语音引擎实现文字的发音
import win32com.client as win
import winsound
import time

#这是一个从您的网络摄像头的实时视频上运行人脸识别的项目。
# 主要功能如下:
#1.人脸识别,并标记姓名
#2.标注人脸的关键点
#3.语音播报识别人脸的姓名,陌生人会播放报警声音。


# 获取webcam(网络摄像头) #0的引用(默认值)
video_capture = cv2.VideoCapture(0)

# 加载示例图片并学习如何识别它。
hxh_image = face_recognition.load_image_file("./photo/张三.jpg")
hxh_face_encoding = face_recognition.face_encodings(hxh_image)[0]

# 加载示例图片并学习如何识别它。
hmy_image = face_recognition.load_image_file("./photo/王五.jpg")
hmy_face_encoding = face_recognition.face_encodings(hmy_image)[0]

# 加载示例图片并学习如何识别它。
hyx_image = face_recognition.load_image_file("./photo/李四.jpg")
hyx_face_encoding = face_recognition.face_encodings(hyx_image)[0]

# 加载示例图片并学习如何识别它。
zcy_image = face_recognition.load_image_file("./photo/赵四.jpg")
zcy_face_encoding = face_recognition.face_encodings(zcy_image)[0]

# 加载示例图片并学习如何识别它。
wq_image = face_recognition.load_image_file("./photo/小明.jpg")
wq_face_encoding = face_recognition.face_encodings(wq_image)[0]


# 创建已知人脸编码及其名称的数组
known_face_encodings = [
    hxh_face_encoding,
    hmy_face_encoding,
    hyx_face_encoding,
    zcy_face_encoding,
    wq_face_encoding

]
known_face_names = [
    "张三",
    "王五",
    "李四",
    "赵四",
    "小明"
]

# 初始化一些变量
face_locations = []
face_encodings = []
face_names = []
process_this_frame = True

# 方法:解决中文乱码的方法
def addText(img, text, left, bottom):
    # 判断图片是否为ndarray格式,转为RGB图片
    if (isinstance(img, np.ndarray)):
        img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))

    # 创建一个可以在给定图像上绘图的对象
    draw = ImageDraw.Draw(img)
    # 参数依次为 字体、字体大小、编码
    fontStyle = ImageFont.truetype("./font/SIMYOU.TTF", 20, encoding="utf-8")
    # 参数依次为位置、文本、颜色、字体
    draw.text((left + 40, bottom + 25), text, (255, 255, 255), font=fontStyle)
    # 转回BGR图片、ndarray格式
    return cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)

#方法:绘制Landmars关键点
def show_landmarks(imge, landmarks):
    for landmarks_dict in landmarks:
        for landmarks_key in landmarks_dict.keys():
            for point in landmarks_dict[landmarks_key]:
                cv2.circle(imge, point, 2, (0, 0, 255), -1)
    return imge

while True:
    # 抓取一帧视频
    ret, frame = video_capture.read()
    # 只处理每一帧视频,以节省时间
    if process_this_frame:
        # 调整视频帧大小为1/4大小,以更快的人脸识别处理
        small_frame = cv2.resize(frame, (0, 0), fx=0.25, fy=0.25)

        # 将图像从BGR颜色(OpenCV使用)转换为RGB颜色(face_recognition使用)
        rgb_small_frame = small_frame[:, :, ::-1]

        # 找到当前帧视频中所有的人脸和人脸编码
        face_locations = face_recognition.face_locations(rgb_small_frame)
        face_encodings = face_recognition.face_encodings(rgb_small_frame, face_locations)

        face_names = []
        for face_encoding in face_encodings:
            # 看看这张脸和已知的脸是否匹配
            matches = face_recognition.compare_faces(known_face_encodings, face_encoding)
            name = "非法闯入"
            #计算距离
            face_distances = face_recognition.face_distance(known_face_encodings, face_encoding)
            # 使用与新面孔距离最小的已知面孔
            best_match_index = np.argmin(face_distances)#0,1,2
            if matches[best_match_index]:
                name = known_face_names[best_match_index]

            face_names.append(name)
        #调用face_recognition库中的方法:
        face_marks = face_recognition.face_landmarks(frame, None, "large")
        #绘制关键点
        frame = show_landmarks(frame, face_marks)
    process_this_frame = not process_this_frame

    # 显示结果
    for (top, right, bottom, left), name in zip(face_locations, face_names):
        # 缩放脸部位置,因为我们检测到的框架被缩放到1/4大小
        top *= 4
        right *= 4
        bottom *= 4
        left *= 4

        # 在脸周围画一个框
        cv2.rectangle(frame, (left, top), (right, bottom), (0, 0, 255), 2)
        #绘制名字
        frame = addText(frame, name, left, bottom)
        #播放语音
        speak = win.Dispatch("SAPI.SpVoice")
        if(name == "非法闯入"):
            speak.Speak(name)
            time.sleep(1)
            winsound.Beep(frequency=1440, duration=1000)#其中,FREQ是频率(以赫兹为单位),而持续时间是毫秒(毫秒)。
        else:
            speak = win.Dispatch("SAPI.SpVoice")
            speak.Speak(name)
            speak.Speak("欢迎回家")

    # 显示结果图像
    cv2.imshow('Video', frame)

    # 按键盘上的“q”退出!
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放网络摄像头手柄
video_capture.release()
cv2.destroyAllWindows()

总结

本项目为新手学习的一点记录,不足之处请各路大神指点!

你可能感兴趣的:(opencv,python,opencv,pycharm,计算机视觉,人工智能)