【学习日记】人脸识别之FaceNet

之前就对人脸识别技术很向往,觉得很神奇。入局深度学习到现在,人脸识别技术的原理也渐渐清晰起来。不经感慨,深度学习技术真的太强大,看似简单的结构却能解决这么复杂的问题。

这篇文章主要介绍google那篇著名的人脸识别论文:FaceNet: A Unified Embedding for Face Recognition and Clustering.

网上已经有很多文章对该文章做出解读,而且有很多的开源代码。但是作为初学者,自己通过博客写一遍,而且从头写一遍代码,获得的认识和技能的进步是不一样的。所以,这里就不厌其烦的重复造轮子。

FaceNet的思路是将人脸图像编码成128维的向量,然后用这128维向量来代表一个人。这就类似于我们的身份证号码,每一个人都有唯一的一个号码。这样,在做人脸验证的时候,我们只要将人脸编码到128维向量,然后和已有的向量做对比,两个向量足够接近,就可以说明这是同一个人。

所以人脸识别的问题就转化为如何将人脸图片编码到128维的向量。这里就是使用了深度学习技术。

通过卷积神经网络,提取人脸图片的特征,然后通过大量的数据进行训练,最终得到128维的向量。


你可能感兴趣的:(学习日记)