python人脸识别理论_Python人脸识别

“人脸识别”是人工智能的一个重要应用,听起来技术含量很高,貌似非常复杂,具体的实现也的确非常复杂,目前的算法一般都基于深度学习神经网络。但如果仅仅是使用识别功能,目前已有封装好的功能模块,并不需要训练模型,甚至不需要了解任何算法原理,只需调用Python的三方模块,几行代码即可实现人脸识别。

face_recognition是目前使用方法最简单,效果也非常好的人脸识别库,它的离线识别率高达99.38%。除了检测面部位置,它还能快速识别出面部特征:如眉毛、眼睛、鼻子、嘴,识别具体的人,对比两张脸的相似度等等。从后面例程可以看到,识别位置相当准确。

一、安装和原理

face_recognition底层基于dlib实现。dlib是一个人脸关键点检测库,它的核心功能由C++实现,适用于多个平台。不同于一般的Python三方模块,它在安装时需要编译,其Github上主要介绍了它在Linux和MacOS系统的安装方法。在Windows系统下编译安装过程比较复杂,需要安装Visual Studio的 Visual C++ for Linux环境,相关工具几十个G,安装步骤和注意事项也很多,因此还是建议使用Linux系统(尽管这可能让一些读者望而却步)。

在Linux下安装方法非常简单:

$ pip install face_recognition

Linux将自动安装face_recognition及其依赖的三方工具集。同时,建议下载源码:

$ git clone https://github.com/davisking/dlib.git

$ git clone https://github.com/ageitgey/face_recognition_models

$ git clone https://github.com/ageitgey/face_recognition

下载源码主要为了通过其示例学习三方模块的使用方法,以及了解底层调用的库和具体的实现方法,以及相关的文档。

dlib模块实现最核心的功能——人脸关键点检测,从源码中可以看到,它主要由C++语言实现,并提供了C++和Python接口,因此,可以在不同环境下开发和使用,目前也有开发者将其移植到android手机上。

face_recognition_models存储了训练好的模型,供face_recognition模块调用,模型的扩展名为“.dat”。

face_recognition模块的功能代码并不多,主要是封装了dlib,简化了开发者的调用步骤。其example中有很多有趣的例程,比如:虚化人脸(类似于马赛克效果),化妆,追踪视频中的人脸,甚至还启动WebService,识别用户上传的图片;还包括与机器学习模型KNN,SVM结合使用的例程,其原理也是用dlib提取人脸特征,再加入机器学习模型训练,根据需求,生成新的模型。可将其看作图像识别在人脸识别垂直领域的细化和封装。

dlib的使用方法并不复杂,而face_recognition则更加简单,face_recognition还提供了直接运行的两个工具:人脸检测face_dection和人脸识别face_recognition。

二、face­_recognition例程

本例程调用face_recognition模块,实现了人脸识别,画眉、画眼线和涂口线的功能。

from PIL import Image, ImageDraw

import face_recognition

image = face_recognition.load_image_file("face2.png")

face_landmarks_list = face_recognition.face_landmarks(image)

for face_landmarks in face_landmarks_list:

color = [238,42,68]

pil_image = Image.fromarray(image)

d = ImageDraw.Draw(pil_image, 'RGBA')

print(face_landmarks.keys())

d.polygon(face_landmarks['left_eyebrow'], fill=(68, 54, 39, 50))

d.polygon(face_landmarks['right_eyebrow'], fill=(68, 54, 39, 50))

d.polygon(face_landmarks['top_lip'], fill=(color[0], color[1], color[2], 80))

d.polygon(face_landmarks['bottom_lip'], fill=(color[0], color[1], color[2], 80))

d.line(face_landmarks['left_eye'] + [face_landmarks['left_eye'][0]], fill=(0, 0, 0, 50), width=3)

d.line(face_landmarks['right_eye'] + [face_landmarks['right_eye'][0]], fill=(0, 0, 0, 50), width=3)

pil_image.show()

pil_image.save('out4.png')

三、dlib例程

本例程直接调用dlib模块,使用face_recognition_models中训练好的模型,识别人脸上的68个特征点。

import dlib

import cv2

detector = dlib.get_frontal_face_detector()

predictor = dlib.shape_predictor('/exports/git/face_recognition_models/face_recognition_models/models/shape_predictor_68_face_landmarks.dat')

img = cv2.imread("/tmp/face2.png")

dets = detector(img, 1)

for k, d in enumerate(dets):

print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format(

k, d.left(), d.top(), d.right(), d.bottom()))

shape = predictor(img, d)

for index, pt in enumerate(shape.parts()):

print('Part {}: {}'.format(index, pt))

pt_pos = (pt.x, pt.y)

cv2.circle(img, pt_pos, 1, (255, 0, 0), 2)

font = cv2.FONT_HERSHEY_SIMPLEX

cv2.putText(img, str(index+1),pt_pos,font, 0.3, (0, 0, 255), 1, cv2.LINE_AA)

cv2.imshow('img', img)

k = cv2.waitKey()

cv2.destroyAllWindows()

四、总结

对于大多数的Python程序,开发者需要的90%功能三方模块都已经实现完成,很多功能都已非常成熟,剩余的10%由开发者根据需求进行适配即可完成。这使得开发者在短时间内即可实现基本功能,并且看起来非常强大,但是后期效果提升比较困难。

个人觉得:人脸识别工具真的很适合美妆卖家,买家上传一张相片,合成各种色号的效果;在视频通话过程中察言观色;图片识别,刷脸支付,美颜相机;稍加一些艺术处理,自动生成漫画等等。

五、参考

你可能感兴趣的:(python人脸识别理论)