利用DBSCAN实现人脸聚类demo(附源码)

这篇博客是对技术研究任务的记录,当时真的是一头雾水,那是刚开始接触机器学习,博客内容是我将研究报告的内容做简单复制粘贴后仍上来的,这个实现是参考一个外国机器学习网站的demo做的功能添加和修改
(原始链接在此 https://www.pyimagesearch.com/2018/07/09/face-clustering-with-python/)感谢其提供了实现聚类的方向
(你也可以参考此链接 http://www.atyun.com/23521.html)

正文

机器学习处理的问题我们可以概括为分类问题和回归问题,这两个都属于监督学习(在大量的已知实例中得到泛化的能力),人脸聚类属于无监督的学习,也就是我们一开始并不知道我们的人脸集中的任何信息(比如有多少个人的人脸,我需要按照什么标准对这些人脸进行区分等等)。实现人脸聚类的大概思路就是,想方法将人脸图片进行编码,将像素点组成的一张图片转变成一个多维的张量(比如矩阵就是个2D张量,或者叫做二维的张量),由于我们得到的张量是根据人脸图片的像素得来的,所以张量中就隐藏着这张人脸的特征信息,接下来,我们采用某个算法(我们使用DBSCAN算法)去将多维中分布的这些点临近的当做一类,以此得到人脸的聚类。简单概括来说,就是两个过程,编码和分类。
在对人脸进行编码时,我们要考虑到一点——一张图片中人脸只是其中一个部分,照我们的聚类实现方式来看,我们应该更关心一张图片中人脸部分的特征,多余的部分(比如衣服,背景等等)将会影响我们的特征提取,因此,我们应该在对图片编码时先识别人脸在图片中的位置,再进行编码时只对人脸部分进行编码(如下图),这样将提高我们的聚类性能。

实现细节

主要说下两部分,一个是人脸识别,一个是聚类算法,先看人脸识别。在人脸识别这块,采用的是python开源的人脸识别库face_recognition,在这里我将进行说明的是,人脸识别是在整个聚类过程中最耗时的部分,尤其是采用CNN进行人脸识别时。当然我们可以跳过人脸识别,而直接对图片进行编码,但是此时,图片中的无关因素将对结果产生巨大影响。

聚类

采用的是scikit-learn库搭建机器学习应用,在该库中,有三种常用的聚类算法,他们分别是K均值聚类、凝聚聚类、DBSCAN。(更多参见https://scikit-learn.org/stable/modules/clustering.html#clustering)
三者都是无监督的聚类算法,但是K均值聚类、凝聚聚类需要我们提供分类的最终类别个数,DBSCAN则不需要提供,但是可以通过调节参数来大概的控制最终的类别个数

特征数据保存

利用python的pickle库,将得到的序列信息保存到文件,我们将采用字典的形式,将每张人脸图片的特征张量和人脸图片路径对应,同时实现不同特征文件之间的结合,从而避免多次的人脸识别和编码过程

对原始图片的操作

程序运行的大量时间都在进行人脸识别(对于一张1024768的图片,若是彩色,则有1024769*3=2,359,296个数需要处理,同时卷积神经网络同时有多个卷积层池化层等等)。所以适当的降低图片分辨率将可以加快程序执行速度(最好是有GPU加持,速度将大大大提高)。所以我们可以考虑在适当范围内降低图片分辨率,来提高速度(当然代价就是降低人脸识别准确率)

这样的结果是否是你需要的?

利用DBSCAN实现人脸聚类demo(附源码)_第1张图片

代码解释
Face-clustering V1.0

目录
1	库介绍	2
1.1	face_recognition	3
1.2	pickle	3
1.3	sklearn	3
1.4	cv2	3
2	项目结构及其功能介绍	3
2.1	dataset/	3
2.2	dataset_face/	3
2.3	encode_file/	3
2.4	add_encode_file.py	3
2.5	check_img_size.py	3
2.6	class_cluster.py	3
2.7	class_encode.py	3
3	详细介绍	3
3.1	class_cluster.py	3
3.1.1	def do_cluster(self,inputfile_path):	3
3.1.2	def do_data_visualization(self,model):	3
3.1.3	def do_data_visualization_3D(self):	3
3.1.4	def do_model_performance(self):	3
3.1.5	def do_show(self):	3
3.2	class_encode.py	3
3.2.1	def do_search_save_face(self,datasetpath,save_face_path,model,save_encode_file_path,num_jitters=1):	4


1	库介绍
1.1	face_recognition
人脸识别库,在项目中用于人脸识别和人脸编码。
1.2	pickle
序列存储库,在项目中用于保存人脸特征文件。
1.3	sklearn
机器学习库,在项目中用于人脸特征聚类
1.4	cv2
opencv的pthon版本,在项目中用于针对图片的操作
2	项目结构及其功能介绍
2.1	dataset/
此处保存着分类的图片原始数据,请将需要分类的图片放在此文件夹下。你也可以自己建立文件夹进行存放。
2.2	dataset_face/
此处保存着在对人脸进行识别后,把原始图片中的人脸部分单独保存下来的图片。你也可以自己建立文件夹进行存放。
2.3	encode_file/
此处保存着对人脸图片进行编码后的特征文件,以.pickle结尾。你也可以自己建立文件夹进行存放。
2.4	add_encode_file.py
这里进行人脸特征文件的合并。
2.5	check_img_size.py
这里进行原始图片的分辨率压缩。
2.6	class_cluster.py
这里对已经保存的人脸特征文件进行聚类。
2.7	class_encode.py
这里执行人脸识别和人脸编码工作。
3	详细介绍
3.1	class_cluster.py
3.1.1	def do_cluster(self,inputfile_path):
inputfile_path:特征文件的路径。
该函数提取特征文件内容,并进行聚类操作。
3.1.2	def do_data_visualization(self,model):
model:使用的人脸识别模型(CNN或HOG),该参数只用于可视化时的模型显示。
该函数做聚类可视化操作,将特征向量降为2D张量
3.1.3	def do_data_visualization_3D(self):
同做聚类可视化,输出3D图像(3D显示没有平面显示明显)。
3.1.4	def do_model_performance(self):
该函数输出聚类的各项指标。
3.1.5	def do_show(self):
该函数将聚类结果和人脸图片结合,显示结果。
3.2	class_encode.py
3.2.1	def do_search_save_face(self,datasetpath,save_face_path,model,save_encode_file_path,num_jitters=1):
datasetpath:原始图像路径。
save_face_path:人脸识别后的人脸部分图片保存路径。
model:使用的人脸识别算法(CNN或HOG)。
save_encode_file_path:特征文件的保存路径。
num_jitters:人脸编码时的采样次数(该值越高,识别越准确,运行越慢,默认为1)。
该函数用来对人脸进行识别和编码,并保存最终的特征文件。

此处下载源码

你可能感兴趣的:(机器学习)