Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战

说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第1张图片

1.项目背景

人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。

人脸识别产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。

本项目先对人脸数据进行读取和处理,再通过LDA进行数据降维,最后用SVM支持向量机算法搭建模型进行人脸识别。

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),,数据项统计如下: 

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第2张图片

数据详情如下(部分展示):

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第3张图片

3.数据预处理

3.1 用Pandas工具查看数据

使用Pandas工具的head()方法查看前五行数据:

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第4张图片

 关键代码:

4.探索性数据分析

4.1 显示第一张图片

用Matplotlib工具的imshow()方法进行图片的显示:

 Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第5张图片

4.2 y变量分组统计柱状图

用Matplotlib工具的plot()方法绘制柱状图:

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第6张图片

从上图可以看出,从上图可以看出标签共7中类别,其中第3类的数量最多。

5.特征工程

5.1 建立特征数据和标签数据

关键代码如下:

5.2 数据集拆分

数据集拆分,分为训练集和测试集,75%训练集和25%测试集。关键代码如下:

5.3 LDA数据降维

使用LDA算法进行数据的降维,输出如下:

从上图可以看到,降维后的特征个数为6,训练集样本数为966。

关键代码如下:

6.构建人脸识别模型

主要使用SVC算法,用于目标分类。

6.1 模型构建

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第7张图片

从上表可以看出,F1分值为0.695,模型效果一般。

6.2 应用网格搜索寻找最优参数值

针对模型中的参数C和gamma,通过网格搜索算法寻找最优的参数值,如下图所示:

 

6.3 最优参数模型构建(使用LDA降维)

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第8张图片

通过上表可以看出,最优参数构建的模型F1分值为0.7191,分值有一定的提升,模型效果良好。

7.模型评估

7.1评估指标及结果

评估指标主要包括准确率、查准率、召回率、F1分值等等。

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第9张图片

从上表可以看出,人脸识别模型效果良好。

关键代码如下:

7.2 查看是否过拟合

查看训练集和测试集的分数:

 

关键代码:

7.3 分类报告

人脸识别模型分类报告:

Python实现LDA和SVM支持向量机人脸识别模型(LinearDiscriminantAnalysis和SVC算法)并通过网格搜索算法寻找最优参数值项目实战_第10张图片

从上图可以看出,分类为1的F1分值为0.58;分类为2的F1分值为0.74,其它类型的以此类推。

8.结论与展望

综上所述,本项目采用了LDA数据降维和SVM支持向量机分类模型,并通过网格搜索优化算法寻找最优的参数值构建模型,最终证明了我们提出的模型效果良好。

本次机器学习项目实战所需的资料,项目资源如下:

项目说明:
链接:https://pan.baidu.com/s/1dW3S1a6KGdUHK90W-lmA4w 
提取码:bcbp

你可能感兴趣的:(机器学习,python,python,LDA数据降维,人脸识别模型)