本人本科在校大二学生,编程小菜鸟。近期做了期末课程设计,我选择的题目就是人脸识别。第一次写博客,想把做系统的整个过程记录下来,方便后续使用。我是站在巨人的肩膀上做成人脸识别的,下面是我参考的博客。
https://www.cnblogs.com/xp12345/p/9818435.html(最终参考)
https://blog.csdn.net/WALRE_HUNTER_RICO/article/details/88361212
上代码来(未知大神的)
import numpy as np
import cv2
# 人脸识别分类器
faceCascade = cv2.CascadeClassifier(r'F:/face_test01/haarcascade_frontalface_default.xml')
# 识别眼睛的分类器
eyeCascade = cv2.CascadeClassifier(r'F:/face_test01/haarcascade_eye.xml')
# 开启摄像头
cap = cv2.VideoCapture(0)
ok = True
result = []
while ok:
# 读取摄像头中的图像,ok为是否读取成功的判断参数
ok, img = cap.read()
# 转换成灰度图像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 人脸检测
faces = faceCascade.detectMultiScale(
gray,
scaleFactor=1.2,
minNeighbors=5,
minSize=(32, 32)
)
# 在检测人脸的基础上检测眼睛
for (x, y, w, h) in faces:
fac_gray = gray[y: (y+h), x: (x+w)]
result = []
eyes = eyeCascade.detectMultiScale(fac_gray, 1.3, 2)
# 眼睛坐标的换算,将相对位置换成绝对位置
for (ex, ey, ew, eh) in eyes:
result.append((x+ex, y+ey, ew, eh))
# 画矩形
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
for (ex, ey, ew, eh) in result:
cv2.rectangle(img, (ex, ey), (ex+ew, ey+eh), (0, 255, 0), 2)
cv2.imshow('video', img)
k = cv2.waitKey(1)
if k == 27: # press 'ESC' to quit
break
cap.release()
cv2.destroyAllWindows()
注:注意上面两个分类器的路径要改成自己文件所在路径
上代码!(大神的)
import cv2
import os
# 调用笔记本内置摄像头,所以参数为0,如果有其他的摄像头可以调整参数为1,2
cap = cv2.VideoCapture(0)
# CascadeClassifier,是Opencv中做人脸检测的时候的一个级联分类器
face_detector = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
face_id = input('\n enter user id:')
print('\n Initializing face capture. Look at the camera and wait ...')
count = 0
while True:
# 从摄像头读取图片
sucess, img = cap.read()
# 转为灰度图片
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 检测人脸
faces = face_detector.detectMultiScale(gray, 1.3, 5)
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x+w, y+w), (255, 0, 0))
count += 1
# 保存图像
cv2.imwrite("Facedata/User." + str(face_id) + '.' + str(count) + '.jpg', gray[y: y + h, x: x + w])
cv2.imshow('image', img)
# 保持画面的持续。
k = cv2.waitKey(1)
if k == 27: # 通过esc键退出摄像
break
elif count >= 1000: # 得到1000个样本后退出摄像
break
# 关闭摄像头
cap.release()
cv2.destroyAllWindows()
注:1.在运行该程序前,请先创建一个Facedata文件夹并和你的程序放在一个文件夹下。
(友情提示:请将程序和文件打包放在一个叫人脸识别的文件夹下。可以把分类器也放入其中。)
2.程序运行过程中,会提示你输入id,请从0开始输入,即第一个人的脸的数据id为0,第二个人的脸的数据id为1,运行一次可收集一张人脸的数据。(这个很重要,将会影响到后面人脸识别中人名列表)
3.程序运行时间可能会比较长,可能会有几分钟,如果嫌长,可以将1000改为100。
4.关于训练样本,我训练了15000张,三个人。有一个问题还没弄明白:样本数量变多(例如训练两万)是,在后面人脸识别时会报错。
如果实在等不及,可按esc退出,但可能会导致数据不够模型精度下降。
上代码(大神的)
import numpy as np
from PIL import Image
import os
import cv2
# 人脸数据路径
path = "F:/face_test01/Facedata"
# 使用OpenCV中LBPH算法的方法建立人脸数据模型
recognizer = cv2.face.LBPHFaceRecognizer_create()
detector = cv2.CascadeClassifier("haarcascade_frontalface_default.xml")
def getImagesAndLabels(path):
imagePaths = [os.path.join(path, f) for f in os.listdir(path)] # join函数的作用?
faceSamples = []
ids = []
for imagePath in imagePaths:
PIL_img = Image.open(imagePath).convert('L') # convert it to grayscale
img_numpy = np.array(PIL_img, 'uint8') # 图片格式转换
id = int(os.path.split(imagePath)[-1].split(".")[1])
faces = detector.detectMultiScale(img_numpy) # 人脸检测
for (x, y, w, h) in faces:
faceSamples.append(img_numpy[y:y + h, x: x + w])
ids.append(id)
return faceSamples, ids
print('Training faces. It will take a few seconds. Wait ...')
faces, ids = getImagesAndLabels(path)
recognizer.train(faces, np.array(ids))
recognizer.write(r'face_trainer\trainer.yml')
print("{0} faces trained. Exiting Program".format(len(np.unique(ids))))
注:运行该程序前,请在人脸识别文件夹下创建face_trainer文件夹,并修改文件路径。(1处)
代码(大神的)
import cv2
recognizer = cv2.face.LBPHFaceRecognizer_create()
recognizer.read('face_trainer/trainer.yml')
cascadePath = "haarcascade_frontalface_default.xml"
faceCascade = cv2.CascadeClassifier(cascadePath)
font = cv2.FONT_HERSHEY_SIMPLEX
idnum = 0
names = ['Allen', 'Bob']
cam = cv2.VideoCapture(0)
minW = 0.1*cam.get(3)
minH = 0.1*cam.get(4)
while True:
ret, img = cam.read()
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
faces = faceCascade.detectMultiScale(
gray,
scaleFactor=1.2,
minNeighbors=5,
minSize=(int(minW), int(minH))
)
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
idnum, confidence = recognizer.predict(gray[y:y+h, x:x+w])
if confidence < 100:
idnum = names[idnum]
confidence = "{0}%".format(round(100 - confidence))
else:
idnum = "unknown"
confidence = "{0}%".format(round(100 - confidence))
cv2.putText(img, str(idnum), (x+5, y-5), font, 1, (0, 0, 255), 1)
cv2.putText(img, str(confidence), (x+5, y+h-5), font, 1, (0, 0, 0), 1)
cv2.imshow('camera', img)
k = cv2.waitKey(10)
if k == 27:
break
cam.release()
cv2.destroyAllWindows()
注:names列表中存储人的名字,若该人id为0则他的名字在第一位,id位1则排在第二位,以此类推。另外,这儿很容易出现这个错误:
这个问题我想有两个原因:
1.在前面采集样本输入ID时,输了字母,而不是索引数字(0,1,…)。
2.训练人数与列表中数量不对应。
总体来说,由于站在巨人的肩膀上,用了网上的开源代码,并且基本不需要改动,所以做出整个人脸识别系统还是比较容易和快速的。我所做的工作就是针对出现的小问题,例如文件路径等做些调试。最后真的很感谢网上程序员们,他们无私的分享给我们这些小白撑起了一片天。