[模式识别] 实验报告——贝叶斯、Fisher线性判别、K近邻、LeNET、PCA变换实验

本资源整合了模式识别课程的五个实验报告,分别为贝叶斯分类器、Fisher线性判别法、K近邻算法、使用PCA变换的方法对ORL人脸数据集进行人脸识别、使用LeNet神经网络进行MINIST手写数字的识别。下载方法在文末,其各个实验的简介如下:

一、贝叶斯方法进行性别分类

本实验为使用贝叶斯方法进行性别分类的实验,需要首先给定先验概率(即男女性别比例),再根据给出的FAMLE.TXT与MALE.TXT作为训练样本集,通过结合“单个特征”或“两个特征不相关”或“两个特征相关”的不同要求,利用相应的方法估计出概率密度函数,根据“最小错误率”或“最小风险”建立相应的贝叶斯分类器。

其中,使用单个特征时,只需根据最大似然法,结合sklearn的相应库函数即可求得概率密度函数。使用多个特征时,需要设定其相关系数,并通过代码复现求多个特征的正态分布函数,进而求得其概率密度函数。

其中,求最小风险时,只需将按照最小错误率求得的结果乘上相应的风险即可。

二、使用线性判别的方法进行性别

本实验为使用线性判别的方法进行性别分类,第一小问为使用Fisher线性判别法构造分类器,需要使用各类均值向量和类内离散度矩阵进行求解。根据类内离散矩阵、Fisher准则最佳投影后,结合公式即可计算得出最佳Fisher准则分界面。

三、K近邻法进行性别分类

本实验为使用近邻法性别分类。最近邻算法或者说KNN算法,是一种基本的分类与回归方法,是数据挖掘技术中最简单的技术之一。所谓最近邻,就是首先选取一个阈值为K,对在阈值范围内离测试样本最近的点进行投票,票数多的类别就是这个测试样本的类别,这是分类问题。那么回归问题也同理,对在阈值范围内离测试样本最近的点取均值,那么这个值就是这个样本点的预测值。

四、使用PCA变换的方法对ORL人脸数据集进行人脸识别

本实验为使用PCA变换的方法对ORL人脸数据集进行人脸识别,其方法为:

① 将ORL人脸数据库的40位志愿者的10张图片,使用10折交叉验证。每个人依次取出一张作为验证数据,进行10轮验证,最后得到准确率的均值。对于每次运算,训练集大小为360张图片,验证集大小为40张图片。对于每张图片,将其展开为一维向量Xi。

② 求X每行的均值向量u,并将其与X相减,进行零均值化,得到C=(X1-u, X2-u, ..., X360-u)

③ 构建协方差矩阵CC T,求解协方差矩阵的特征值,选取最大的K个,求出对应的K个特征向量,并将其按列排成变换矩阵P,其维度为(10304*K);

④ 计算训练集的图片在上述特征向量下的投影,即为Yi=PT(Xi-u),作为查找集,将待识别的图片做以上相同的投影运算得到Z

⑤ 遍历搜索查找集,满足min||Yi-Z||条件的,即待识别图片与Yi对应图片属于一类,即找到待识别图片对应的人。

五、使用LeNet神经网络进行MINIST手写数字的识别

  • 数据集概况

MINIST 数据集总共包含7万张手写数字图片,按照6:1的比例划分为训练集与测试集。 图片的大小为28×28,通道数为1,每张图片都是黑底白字,黑底在张量中用0表示,白字用0-1之间的浮点数表示。

  • LeNet与LeNet5网络结构详解

LetNet-5是一个较简单的卷积神经网络。下图显示了其结构:输入的二维图像(单通道),先经过两次卷积层到池化层,再经过全连接层,最后为输出层。

  • 图像分类的常见问题和技术

对于单个标签的图像分类问题(仅包含1个类别与背景),评估指标主要有Accuracy,Precision,Recall,F-score等,令TP表示将正类预测为正类,FP表示将负类预测为正类,TN表示将负类预测为负类,FN表示将正类预测为负类。那么Accuracy=(TP+TN)/NUM,Precision=TP/(TP+FP),Recall=TP/(TP+FN)。

对于类别数大于1的图像分类问题,评估指标主要有Accuary和Class-wiseAccuracy,Accuary表示所有类别预测正确的图像数量占总图像数量的百分比;Class-wiseAccuracy是对每个类别的图像计算Accuracy,然后再对所有类别的Accuracy取平均得到。

下载方法

https://download.csdn.net/download/m0_55080712/87167411

如果没有积分,也没关系。请发邮件到[email protected]索取,12h内给出回复。

你可能感兴趣的:(机器学习,人工智能,python)