人脸检测是实现人脸识别的第一步,之前讲解了Mtcnn实现人脸检测平台的原理和实战,答应大家下期就讲解如何借助Mtcnn人脸检测算法和facenet算法搭建人脸识别平台,话不多说,安排!
01 Mtcnn人脸检测模型
02 facenet人脸特征提取编码模型
03 项目整体实现总结
04 具体实现流程
1.数据库的图像编码
2.实时图片的预测处理( Mtcnn模型实现人脸检测+5个关键点)
05 代码下载和环境配置
06 人脸识别效果展示
MTCNN,英文全称是Multi-task convolutional neural network,中文全称是多任务卷积神经网络,该神经网络将人脸区域检测与人脸关键点检测放在了一起。总体可分为P-Net、R-Net、和O-Net三层网络结构。
Mtcnn网络的原理和代码实现具体可看:
原理讲解-项目实战 <-> Keras搭建Mtcnn人脸检测平台
谷歌人脸检测算法,发表于 CVPR 2015,利用相同人脸在不同角度等姿态的照片下有高内聚性,不同人脸有低耦合性,提出使用 cnn + triplet mining 方法,在 LFW 数据集上准确度达到 99.63%。
通过 CNN 将人脸映射到欧式空间的特征向量上,实质上:不同图片人脸特征的距离较大;通过相同个体的人脸的距离,总是小于不同个体的人脸这一先验知识训练网络。
测试时只需要计算人脸特征EMBEDDING,然后计算距离使用阈值即可判定两张人脸照片是否属于相同的个体。
简单来讲,在使用阶段,facenet即是:
1、输入一张人脸图片
2、通过深度学习网络提取特征
3、L2标准化
4、得到人脸128维特征向量。
facenet网络的代码构建:见:net/inception.py文件
流程总结:主要是 利用人脸检测模型Mtcnn进行图片中人脸检测,对图片中所有的进行人脸检测之后,依次对图片中的所有人脸区域截取下来进行人脸对齐,然后利用facenet模型依次编码得到图片中所有人脸的128维编码特征向量,与事先我们数据库中存放且已经利用mtcnn和facenet模型进行编码好了的图片(一张图片只有一张人脸,图片文件名为人名)依次进行特征向量对比(欧式距离),小于我们设定的阈值,就判定是具有相似度的人脸,存放在相似度列表中,最后找出距离最近的人脸,进行二次判断是否存在于相似度列表里(即是否存在于数据库中),存在即将相应的人脸名绘制在图片上,不存在数据库中则标记为“Unkonw”。
整体的代码摆放如下:
face_dataset里面装的是想要识别的人脸,比如说zhengshuang.jpg指的就是指郑爽,图片名命名为人名,每一张图片中只有一张人脸。
数据库中每一张图片对应一个人的人脸,图片名字就是这个人的名字。
数据库初始化指的是人脸数据库的初始化。想要实现人脸识别,首先要知道自己需要识别哪些人脸。这就是数据库的一个功能,首先将想要检测到的人脸放入数据库中,并进行编码。
数据库的初始化具体执行的过程就是:
1、遍历数据库中所有的图片。
2、检测每个图片中的人脸位置。
3、利用mtcnn将人脸区域从图片中截取下来。
4、将获取到的人脸进行对齐。
5、利用facenet将人脸进行编码得到128维特征向量。
6、将所有人脸编码的结果放在一个列表中。
第6步得到的列表就是已知的所有人脸的特征列表,在之后获得的实时图片中的人脸都需要与数据库中已知人脸进行比对,这样我们才能知道检测的实时人脸是谁。
实现代码请见face.recognize.py:
class face_rec():def __init__(self):# 创建mtcnn对象# 检测图片中的人脸self.mtcnn_model = mtcnn()# 门限函数self.threshold = [0.5,0.8,0.9]
# 载入facenet# 将检测到的人脸转化为128维的向量self.facenet_model = InceptionResNetV1()# model.summary()model_path = './model_data/facenet_keras.h5'self.facenet_model.load_weights(model_path)#-----------------------------------------------## 对数据库中的人脸进行编码# known_face_encodings中存储的是编码后的人脸# known_face_names为人脸的名字#-----------------------------------------------#face_list = os.listdir("face_dataset")self.known_face_encodings=[]self.known_face_names=[]for face in face_list:name = face.split(".")[0]
img = cv2.imread("./face_dataset/"+face)img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
# 检测人脸rectangles = self.mtcnn_model.detectFace(img, self.threshold)# 转化成正方形rectangles = utils.rect2square(np.array(rectangles))# facenet要传入一个160x160的图片rectangle = rectangles[0]# 记下他们的landmarklandmark = (np.reshape(rectangle[5:15],(5,2)) - np.array([int(rectangle[0]),int(rectangle[1])]))/(rectangle[3]-rectangle[1])*160crop_img = img[int(rectangle[1]):int(rectangle[3]), int(rectangle[0]):int(rectangle[2])]crop_img = cv2.resize(crop_img,(160,160))new_img,_ = utils.Alignment_1(crop_img,landmark)new_img = np.expand_dims(new_img,0)# 将检测到的人脸传入到facenet的模型中,实现128维特征向量的提取face_encoding = utils.calc_128_vec(self.facenet_model,new_img)self.known_face_encodings.append(face_encoding)self.known_face_names.append(name)
利用mtcnn的预测结果我们可以获得一张图片中人脸的位置,但是我们截取下来的人脸是这样的:
我们可以很明显的看出来人脸是歪着的,我们如果人脸可以正过来,那么将对人脸的特征提取非常有好处,对齐人脸如下所示:
常见的对齐方法有:
1、通过双眼坐标进行旋正
2、通过矩阵运算求解仿射矩阵进行旋正
通过双眼坐标进行旋正。
利用双眼坐标进行旋正需要用到两个参数,如图所示分别是:
1、眼睛连线相对于水平线的倾斜角。
2、图片的中心。
利用这两个参数我们可以知道需要图片需要旋转的角度是多少,图片旋转的中心是什么,然后利用opencv中cv2.warpAffine()函数进行旋转。
代码实现请见utils/utils.py的Alignment_1(img,landmark):函数
其中landmark是五个人脸特征点的位置:
#-------------------------------------## 人脸对齐#-------------------------------------#def Alignment_1(img,landmark):if landmark.shape[0]==68:x = landmark[36,0] - landmark[45,0]y = landmark[36,1] - landmark[45,1]elif landmark.shape[0]==5:x = landmark[0,0] - landmark[1,0]y = landmark[0,1] - landmark[1,1]# 眼睛连线相对于水平线的倾斜角if x==0:angle = 0else:# 计算它的弧度制angle = math.atan(y/x)*180/math.picenter = (img.shape[1]//2, img.shape[0]//2)RotationMatrix = cv2.getRotationMatrix2D(center, angle, 1)# 仿射函数new_img = cv2.warpAffine(img,RotationMatrix,(img.shape[1],img.shape[0]))RotationMatrix = np.array(RotationMatrix)new_landmark = []for i in range(landmark.shape[0]):pts = []pts.append(RotationMatrix[0,0]*landmark[i,0]+RotationMatrix[0,1]*landmark[i,1]+RotationMatrix[0,2])pts.append(RotationMatrix[1,0]*landmark[i,0]+RotationMatrix[1,1]*landmark[i,1]+RotationMatrix[1,2])new_landmark.append(pts)new_landmark = np.array(new_landmark)return new_img, new_landmark
通过矩阵运算求解仿射矩阵进行旋正
先在一张图片上固定人脸的5个关键点的坐标,就是预先设定标准坐标std_landmark,再将我们检测到的5个关键点坐标映射到我们固定好了的关键点坐标上,借助OpenCV中的仿射函数cv2.warpAffine实现。
facenet是一个人脸特征获取的模型,将第1步获得的对齐人脸传入facenet模型就可以得到每个人脸的特征向量。
将所有特征向量保存在一个列表中,在与第3步的实时人脸编码特征向量进行比对。
实现代码请见face.recognize.py中的face_rec()函数
height,width,_ = np.shape(draw)draw_rgb = cv2.cvtColor(draw,cv2.COLOR_BGR2RGB)# 检测人脸rectangles = self.mtcnn_model.detectFace(draw_rgb, self.threshold)print(np.shape(rectangles))if len(rectangles)==0:return# 转化成正方形rectangles = utils.rect2square(np.array(rectangles,dtype=np.int32))rectangles[:,0] = np.clip(rectangles[:,0],0,width)rectangles[:,1] = np.clip(rectangles[:,1],0,height)rectangles[:,2] = np.clip(rectangles[:,2],0,width)rectangles[:,3] = np.clip(rectangles[:,3],0,height)#-----------------------------------------------## 对检测到的人脸进行编码#-----------------------------------------------#face_encodings = []for rectangle in rectangles:# 获取landmark在小图中的坐标landmark = (np.reshape(rectangle[5:15],(5,2)) - np.array([int(rectangle[0]),int(rectangle[1])]))/(rectangle[3]-rectangle[1])*160# 截取图像crop_img = draw_rgb[int(rectangle[1]):int(rectangle[3]), int(rectangle[0]):int(rectangle[2])]crop_img = cv2.resize(crop_img,(160,160))# 对齐new_img,_ = utils.Alignment_1(crop_img,landmark)new_img = np.expand_dims(new_img,0)# 利用facenet_model计算128维特征向量face_encoding = utils.calc_128_vec(self.facenet_model,new_img)face_encodings.append(face_encoding)
1、利用mtcnn+facenet获取要检测的实时图片中的每一张人脸特征。
2、将每一张人脸特征和数据库中所有的人脸特征进行比较,计算距离。如果距离小于门限值,则认为其具有一定的相似度。
3、再次计算该检测图片中人脸和数据库中最近距离人脸,获得每一张人脸在数据库中最相似的人脸的序号。
4、判断这个序号对应的人脸距离是否小于门限,小于是则认为人脸识别成功,他存在于人脸数据库中。
实现代码请见face.recognize.py中recognize函数:
face_names = []for face_encoding in face_encodings:# 取出一张脸并与数据库中所有的人脸进行对比,计算得分matches = utils.compare_faces(self.known_face_encodings, face_encoding, tolerance = 0.9)name = "Unknown"# 找出距离最近的人脸face_distances = utils.face_distance(self.known_face_encodings, face_encoding)# 取出这个最近人脸的评分best_match_index = np.argmin(face_distances)if matches[best_match_index]:name = self.known_face_names[best_match_index]face_names.append(name)
05 代码下载和环境配置
公众号后台回复:项目实战,获取完整代码实现
环境:
tensorflow-gpu==1.13.1
keras==2.1.5
06 人脸识别效果展示
精彩推荐:
原理讲解-项目实战 <-> Keras搭建Mtcnn人脸检测平台
Yolov3算法实现社交距离安全检测项目讲解和实战(Social Distance Detector)
万字长文,用代码的思想讲解Yolo3算法实现原理,Visdrone数据集和自己制作数据集两种方式在Pytorch训练Yolo模型