zhazhiqiang2010

第八章采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）

【原文：http://blog.csdn.net/raby_gyl/article/details/12623539】

注释：

1、翻译书名:Mastering OpenCV with Practical Computer Vision Projects

2、翻译章节：Chapter 8:Face Recogition using Eigenfaces or Fisherfaces

3、电子书下载，源代码下载，请参考:http://blog.csdn.net/raby_gyl/article/details/11617875

上接:第八章 采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（一）：http://blog.csdn.net/raby_gyl/article/details/12611861

转载请注明：http://blog.csdn.net/raby_gyl/article/details/12623539

用收集的人脸训练人脸识别系统

对于每个人搜集了足够的人脸用来识别之后，你必须训练使用一个适合人脸识别的机器学习算法来学习这些数据。在文献中有很多人脸识别算法，其中最简单的就是Eigenfaces和人工神经网络。Eigenfaces通常比人工神经网络要好，而且尽管它简单，它几乎和一些复杂的人脸识别算法一样好。因此对于初学者和作为新的算法的比较，它是非常流行的基本人脸识别算法。

对任何想要在人脸识别从事更长远的读者来说，建议读一下下面的理论：

1、Eigenfaces（也称作主成分分析PCA）

2、Fisherfaces(也称作线性判别分析LDA)

3、其他典型的人脸识别算法（许多可以通过网址访问到：http://www.face-rec.org/algorithms/)

4、最新的人脸识别算法在最近的计算机视觉研究论文上（例如CVPR和ICCV：htpp://www.cvpapers.com/）因为那里每年都有数百人脸识别的文章。

然而，在本书中展示的那样，为了使用它们，你不需要理解这些算法的理论。多谢OpenCV团队和Philipp wagner’s libfacerec贡献。OpenCV v2.41提供了cv::Algorithm作为一个简单的，一般的方法，不需要理解它们是怎样实现的。你可以通过使用Algorighm::getList()函数来找到你的OpeCV视觉可以利用的算法。代码如下：

[cpp]  view plain copy 
     
    
 vector<string> algorithms;  
 Algorithm::getList(algorithms);  
 cout << "Algorithms: " << algorithms.size() << endl;  
 for (int i=0; i<algorithms.size(); i++) {  
 cout << algorithms[i] << endl;  
 }  

OpenCV v2.4.1可以使用的三个人脸识别算法，如下：

1、FaceRecognizeer.Eigenfaces:Eigenfaces，也叫做PCA，首先被Turk和Pentland在1991年使用.

2、FaceRecognizeer.Fisherfaces：Fisherface人脸.也叫做LDA。Belhumeur, Hespanha and Kriegman in 1997发明。

3、FaceRecognizer.LBPH:局部二值化类型直方图，Ahonen, Hadid and Pietikäinen in 2004发明。

注释：

更多人脸识别算法的实现，可以在文档，例子中找到，对于Python平台同等的可以在 Philipp Wagner的网站上找到：http://bytefish.de/ blog and http://bytefish.de/dev/libfacerec/.

通过OpenCV 的contrib模块的FaceRecognizer类可以利用这些人脸识别的算法。由于是动态链接，你的程序需要链接contrib模块.但是它并不是实时加载的（如果被认为不需要）。因此推荐在试图访问FaceRecognizer算法之前，调用cv::initModule_contrib()函数。这个函数只能在OpenCV 2.4.1以上的版本访问的到，因此它至少确保人脸识别算法通过你的编译时间（即不会报编译时错误）：

[cpp]  view plain copy 
     
    
 //在运行时动态的导入"contrib"模块  
 bool haveContribModule = initModule_contrib();  
 if (!haveContribModule) {  
 cerr << "ERROR: The 'contrib' module is needed for ";  
 cerr << "FaceRecognizer but hasn't been loaded to OpenCV!";  
 cerr << endl;  
 exit(1);  
 }  

为了使用人脸识别算法的一个，我们必须使用cv::Algorithm::create<FaceRecognizer>()函数创建一个FaceRecognizer对象，我们传递我们想使用的人脸识别算法的名字，作为创建函数的string对象。如果它在OpenCV的版本中有效，我们将通过它访问那个算法。确保用户的OpenCV是v2.4.1或者更新的版本，它将在运行时被检查。例如：

[cpp]  view plain copy 
     
    
 string facerecAlgorithm = "FaceRecognizer.Fisherfaces";  
 Ptr<FaceRecognizer> model;  
 //使用”contrib”模块的人脸识别器  
 model = Algorithm::create<FaceRecognizer>(facerecAlgorithm);  
 if (model.empty()) {  
 cerr << "ERROR: The FaceRecognizer [" << facerecAlgorithm;  
 cerr << "] is not available in your version of OpenCV. ";  
 cerr << "Please update to OpenCV v2.4.1 or newer." << endl;  
 exit(1);  
 }  

一旦我们导入了人脸识别算法，我们可以简单地用我们的人脸数据调用人脸识别FaceRecognizer::train()函数，如下：

[cpp]  view plain copy 
     
    
 // 用收集的人脸做实际的训练  
 model->train(preprocessedFaces, faceLabels)  

这行一行代码将运行你选择的一整套的人脸识别训练算法。（例如，Eigenfaces，Fisherfaces，或者其他可能的算法）。如果你仅有少于20个人的人脸，那么这个算法将返回的很快，但是如果你有很多人的人脸，这个train()函数可能花费几秒或者甚至几分钟来处理所有的数据。

查看学习的知识

然而并不是必须的，在学习你的训练数据时，观察人脸识别算法产生的内部数据结果是相当有用的，特别地如果你想理解你选择的算法背后的理论，并且想核实它是否工作或者找到为什么他不像你期望的那样工作。对于不同的算法内部数据结构可能不同，但是幸运的是，对于Eigenfaces和Fisherfaces他们是相同的，因此让我们仅看看这两个。这两个都是基于一维特征矢量矩阵，当他们作为二维图像观察时，表现的有点像人脸。因此当使用人脸识别算法，Eigenfaces或者Fisherfaces时，将特征矢量作为特征人脸是很普通的。

在简单的术语中，Eigenfaces的基本原理是，将计算一组特殊图像（特征脸eigenfaces)并且混合比例（特征值)，在训练集合中以不同的方式混合可以产生训练图像集中的每一个图像，但是同样可以用于在训练集中区分许多人脸图像。例如：在训练集中的一些人脸带有小胡子，一些没有，那么至少有一个特征脸来表现小胡子。并且带有小胡子的训练人脸应当有一个高的混合比例来表现它带有一个小胡子。并且不带小胡子的人脸对于他们的特征向量有一个低的混合比例。如果一个训练集有5个人，对于每个人有20张人脸，那么在训练集中将会100个特征人脸和特征矢量来区分100全部人脸，并且事实上这些将被排序，因此第一个少量的特征脸和特征矢量将会是最重要的区分器，并且最后一个少量的特征脸和特征矢量仅是随机的像素噪声，对我们区分数据实际上没有帮助。因此很自然的抛弃最后的一些特征并且仅保存前50个左右的特征人脸。

相比较,Fisherfaces的基本原理是，代替计算训练集中每个图像的特征向量和特征值，它只计算每一个人的一个特征向量和特征值，因此在前面的5个人，每人20个人脸的例子中，Eigenfaces算法将使用100特征人脸和特征值，然而Fisherfaces算法将使用仅5个特征人脸和特征值。

为了访问Eigenfaces和Fisherfaces算法的内部数据结构，我们使用cv::Algorithm::get()函数在运行时获得他们，因为在编译时，无法访问他们。数据结构作为数学计算的一部分而不是图像处理的一部分来使用。因此他们通常以浮点型数据存储，典型的在0.0到1.0范围内。而不是从0到255的8位uchar类型的像素，在整齐的图像中，类似于像素。他们通常也是一维行或者列矩阵或者组成有很多一维行向量或者列向量的矩阵。因此在显示这些内部数据结构之前，你必须将他们的转换成正确的矩形形状(reshape)，把他们转换到0到255范围内的8位uchar类型像素。因为矩阵数据可能在0.0到1.0或者-1.0到1.0或者任何范围之内。你可以使用cv::normalize()函数，带有cv::norm_minmax可选参数，来确保输出的数据在0到255之间，而不管输入数据的范围是什么。让我们创建函数来执行到矩形形状转变以及到8bit像素的转换，如下：

[cpp]  view plain copy 
     
    
 //转换行向量或者列向量（float类型）到一个8维矩形图像,能被用来显示和存储  
 //尺度化值到0和255之间  
 Mat getImageFrom1DFloatMat(const Mat matrixRow, int height)  
 {  
 // 转换为矩形形状图像，用来代替单行  
 Mat rectangularMat = matrixRow.reshape(1, height);  
 //尺度化到0和255之间，并将他们存储为8位uchar图像  
 Mat dst;  
 normalize(rectangularMat, dst, 0, 255, NORM_MINMAX, CV_8UC1);  
 return dst;  
 }  

为了易于调试 opencv 代码，更甚至当内部调试 cv::Algorithm 数据结构时，我们可以使用 ImgeUtils.Cpp 和 ImageUtils.h 文件来简单地显示有关 cv::Mat 结构信息，如下：

[cpp]  view plain copy 
     
    
 Mat img = ...;  
 printMatInfo(img, "My Image");  

你将看到类似如下的信息打印到你的控制台：

[cpp]  view plain copy 
     
 My Image: 640w480h 3ch 8bpp, range[79,253][20,58][18,87]

这告诉你它是一个640个元素宽和480个元素高（即640*480图像或者一个480*640的矩阵，依赖于你么看它），带有8位三通道图像（即普通的BGR图像），并且它展示了图像的每个通道的最小值和最大值。

注释：

1、也可能使用printMat()函数替代printMatInfo()函数来打印图像或者矩阵的实际的内容。这可以非常方便的查看矩阵和多通道浮点型矩阵，因为这些可能对于一个初学者是相当棘手的。

2、ImageUtils代码主要为OpenCV的接口，但是逐渐的包含更多的C++借口。最新的版本可以在网站http://shervinemami.info/openCV.html上找到。

人脸均值

Eigenfaces和Fisherfaces算法都是先计算人脸均值即所有训练图像的人脸均值。因此他们可以从每个人脸图像减去均值图像得到更好的识别结果。因此让我们看一下我们训练集的人脸均值。人脸均值在Eigenfaces和Fisherfaces实现中称为mean，展示如下：

[cpp]  view plain copy 
     
    
 Mat averageFace = model->get<Mat>("mean");  
 printMatInfo(averageFace, "averageFace (row)");  
 //转换一个浮点行矢量到一个常规的8位图像  
 averageFace = getImageFrom1DFloatMat(averageFace, faceHeight);  
 printMatInfo(averageFace, "averageFace");  
 imshow("averageFace", averageFace);  

现在你应该在你的屏幕上看到一个均值人脸图像，类似与下面的放大的图像，它是一个男人，一个女人和一个孩子的组合。你应当也能在你的控制台看到类似的文本展示:

[cpp]  view plain copy 
     
    
 averageFace (row): 4900w1h 1ch 64bpp, range[5.21,251.47]  
 averageFace: 70w70h 1ch 8bpp, range[0,255]  

图像的显示像下面的截图：

注意到averageFace(row)是一个单行64位浮点型矩阵，然而averageFace是一个覆盖从0到255的8位的矩形图像。

特征值, Eigenfaces, and Fisherfaces

让我们看一下实际的特征值的组成：

[cpp]  view plain copy 
     
    
 Mat eigenvalues = model->get<Mat>("eigenvalues");  
 printMat(eigenvalues, "eigenvalues");  

对于Eigenfaces，对于每一个人脸都有一个特征值，因此如果我们有三个人，每个人带有4张人脸，我将得到一个带有12特征值的列矢量，按照从最好到最坏排序，如下：

[cpp]  view plain copy 
     
    
 eigenvalues: 1w18h 1ch 64bpp, range[4.52e+04,2.02836e+06]  
03e+06  
09e+06  
23e+05  
04e+05  
66e+05  
31e+05  
85e+05  
23e+05  
18e+04  
61e+04  
91e+04  
52e+04  

对于Fisherfaces人脸，对每一个附加的人我们仅有一个特征值，因此如果有三个人，每个人有4张人脸，我们仅得到一个带有2个特征值的行矢量，如下：

[cpp]  view plain copy 
     
    
 eigenvalues: 2w1h 1ch 64bpp, range[152.4,316.6]  
 317, 152  

为了观察特征矢量（例如Eigenfaces或者fisherface图像）。我们必须从大的特征矢量矩阵中抽取他们作为列。因为opencv的和c/c++中的数据通常以行顺序存储在矩阵中的。这意味着为了抽取一列，我们应当使用Mat::clone()函数来确保数据将是连续的，否则我们不能将数据的形状改变成为矩形(reshape)。一旦我们有了一个连续的列Mat.我们可以使用getImageFrom1DFloatMat()函数就像前面我们为均值人脸所做的那样来显示特征矢量：

[cpp]  view plain copy 
     
    
 // 获取特征矢量  
 Mat eigenvectors = model->get<Mat>("eigenvectors");  
 printMatInfo(eigenvectors, "eigenvectors");  
 //展示最好的20个特征矢量  
 for (int i = 0; i < min(20, eigenvectors.cols); i++) {  
 //从特征矢量创建一个连续的列矢量 #i.  
 Mat eigenvector = eigenvectors.col(i).clone();  
 Mat eigenface = getImageFrom1DFloatMat(eigenvector,  
 faceHeight);  
 imshow(format("Eigenface%d", i), eigenface);  
 }  

下面的图像显示了特征矢量图像，你可以看到三个人，每个人带有4张人脸，有12个Eigenfaces（图像的左手边）或者两个Fisherfaces人脸（图像右手边）。（这里是20个Eigenfaces）

第八章采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）_第1张图片

注意Eigenfaces和Fisherfaces好像有一些相似的人脸特征，但是他们看起来不像人脸。这是简单的因为均值图像从他们中减去了，因此他们仅仅是从均值人脸中展示每个特征人脸的不同。数字表示是哪个特征人脸，因为他们已经按照从最重要的特征到最不重要的特征人脸进行了排序。并且如果你有50或者更多的特征人脸，那么后面的特征人脸经常仅仅显示随机的图像噪声，并且因此应当被抛弃。

步骤4：人脸识别

既然我们已经用训练图像和人脸标签集训练了Eigenfaces 或者Fisherfaces的特征学习算法。我们最终准备仅从一个张人脸图像中指出那个人是谁。这一步涉及到人脸识别或者人脸鉴定。

（注意下面要将的人脸鉴定（identification）和人脸验证（verification）的区别）

人脸鉴定（identification）：从他们的人脸识别一个人

多谢OpenCV的FaceRecoginer类，我们能可以简单地在人脸图像上调用FaceRecognizer：：predit()函数来实现识别图像中的人，如下：

[cpp]  view plain copy 
     
 int identity = model->predict(preprocessedFace);

这个identity值是我们最初在搜集人脸训练时的标签数据，0表示第一个人，1表示第二个人。等等。这种识别的问题是，它总是预测一个给定的人，即使输入图像是一个未知的人或者一个车。它任然告诉你图像中的那个人更像哪一个，因此很难相信结果。解决的方法是获得一个信任度量，因此我们能够判断结果的可靠程度。并且如果它看起来信任度很低，那么我们假定它是一个未知的人。

人脸验证（verification）：断定是一个人

为了证实预测（prediction）的结果是可靠的或者它应当被认为一个未知的人，我们进行人脸验证（也即人脸认证），为了获得一个信任度量来表示是否单个人脸图像相似与断言的人脸（相对应我们刚刚进行的人脸鉴定来说,用单个人脸和很多人比较）。

当我们调用predict()函数时，OpenCV的FaceRecogizer类能够返回一个信任度量。但是不幸地信任度量简单的依赖于到特征子空间的距离，因此它不是很可靠。我们将要使用的方法是用特征向量和特征值来重构人脸图像，并且将重构的图像和输入的图像比较。如果一个人在训练集中有很多人脸，那么通过学习特征向量和特征值可能得到很好的重构效果。但是如果一个人在训练集中没有人脸（或者没有在测试图像中类似的光照和人脸表情），那么重构的人脸将和输入的人脸有很大的不同。标志着它可能是一个未知的人脸。

记住我们之前所说的，Eigenfaces和Fisherfaces是基于这个一个概念：图像可以近似地表示为一个特征向量（特殊的人脸图像）和特征值（混合比例）。如果我们用特征值组合训练集中所有特征矢量，那么我们将得到一个相当近似的源、原训练图像的一个副本。同样的应用类似与其他图片，他们类似于训练集。如果我们使用一个相似的测试图像的特征值来组合训练的特征矢量，我们将可能重构图像，在某种程度上是测试图像的一个副本。

再次，OpenCV的人脸识别类使得很容易的从输入图像中产生一个重构的图像，采用subspaceProject函数映射到一个特征空间，使用subspaceReconstruct()函数从特征空间返回到图像空间。诀窍是我们需要将它从一个浮点型行矩阵转换为矩形8位图像（就像我们显示均值人脸和特征人脸那样），但是我们不想归一化这些数据，因为用来和原图像相比较，它已经是一个理想的尺度。如果我们归一化了数据，它可能和输入图像有不同的光照和对比度。仅仅使用L2相关误差来比较图像的相似度将会变的困难。做法如下：

[cpp]  view plain copy 
     
    
 //从FaceRecognizer的model对象中获取一些需要的数据  
 Mat eigenvectors = model->get<Mat>("eigenvectors");  
 Mat averageFaceRow = model->get<Mat>("mean");  
 //映射输入图像到特征空间  
 Mat projection = subspaceProject(eigenvectors, averageFaceRow,preprocessedFace.reshape(1,1));  
   
 //从特征子空间产生一个重构的人脸  
 Mat reconstructionRow = subspaceReconstruct(eigenvectors,averageFaceRow, projection);  
   
 //使其变成一个矩形图像来代替一个单行  
 Mat reconstructionMat = reconstructionRow.reshape(1, faceHeight);  
   
 // 将float图像转换为8为图像  
 Mat reconstructedFace = Mat(reconstructionMat.size(), CV_8U);  
 reconstructionMat.convertTo(reconstructedFace, CV_8U, 1, 0);  

下面的图像展示了两个典型的重构人脸，左手边人脸是好的重构，因为它来至于一张已知的人脸，然后右手边是坏的重构，因为它来至于一张未知的人，或者一个已知的人但是未知的光照/表情/人脸方向.

第八章采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）_第2张图片

我们现在可以同样使用我们先前为比较两个图像创建的getSimilarity（）函数来计算输入图像和重构图像的相似度，先前similarity值低于0.3就表示两个图像非常相似。对于Eigenfaces，每一张脸都有一个特征矢量，因此重建趋向于好的结果，因此我们可以典型地使用0.5的阈值。但是 Fisherfaces 对于每一个人仅有一个特征矢量，因此重建并不是很好，因此它需要一个更高的阈值—0.7。做法如下：

[cpp]  view plain copy 
     
    
 similarity = getSimilarity(preprocessedFace,   
 reconstructedFace);  
 if (similarity > UNKNOWN_PERSON_THRESHOLD) {  
 identity = -1; // Unknown person.  
 }  

现在你可以仅打印identity标识到控制台了，或者使用到你想使用的任何的地方。记住这个人脸识别方法和人脸验证方放仅在你为它训练的特定的环境下可靠。因此为了获取好的识别精度，你将需要确保你的每一个人的训练集覆盖全部的光照范围，人脸表情和角度，即你期待的测试情况。人脸处理阶段帮助减少光照和面内旋转的（如果一个人倾斜他的头到左肩或者右肩）差异。但是对于其他差异例如平面外旋转（如果这个人将他的头朝向左手边或者手右边）。它只有在包含在你的训练集中才有效。

最后一笔：保存和导入文件

你可能潜在地增加一个命令行，来处理输入文件夹和保存他们到磁盘。或者执行人脸检测，人脸处理和（或）人脸识别作为一个网络服务，等等。对于这些类型的工程，通过使用FaceRecoginzer类的save和load函数可以很容易的添加想要的功能。你可能也希望保存训练数据，并且然后在工程开始使导入它。

保存训练模型到XML或者YML文件很容易：

[cpp]  view plain copy 
     
 model->save("trainedModel.yml");

如果你想以后增加更多的数据到训练集，你可能也想保存一组预处理的人脸和标签。

例如，这里有一些样本代码用来从文件夹中导入训练模型。注意你必须指定人脸识别算法（例如，FaceRecoginzer.Eigenfaces或者FaceRecoginzer.Fisherfaces)，这是最初用来创建训练模型的：

[cpp]  view plain copy 
     
    
 string facerecAlgorithm = "FaceRecognizer.Fisherfaces";  
 model = Algorithm::create<FaceRecognizer>(facerecAlgorithm);  
 Mat labels;  
 try {  
 model->load("trainedModel.yml");  
 labels = model->get<Mat>("labels");  
 } catch (cv::Exception &e) {}  
 if (labels.rows <= 0) {  
 cerr << "ERROR: Couldn't load trained data from "  
 "[trainedModel.yml]!" << endl;  
 exit(1);  
 }  

最后一笔：做一个漂亮的和互动的GUI

虽然到目前为止在这一章给出的代码对于一个人脸识别系统已经足够了，但仍需要一个方式来将数据输入系统和一个方式来使用它。许多用来研究的人脸识别系统将选择理想的输出到文本文件夹，这里文本列出静态图像文件夹在计算机的存储位置，和其他重要的数据例如一个人的真实名字或者身份并且可能人脸区域真实的像素坐标。（例如人脸和眼睛中心位置的实况）。这可能或者被另外一个人脸识别系统手工地收集。

理想的输出可能将是一个文本文件来比较识别结果和真实情况，因此统计数字可能通过人脸识别系统和其他人脸识别系统的比较来获得。

然而，因为人脸识别系统在这一章被设计用来学习和可用的有趣的目的，而不是与最新的研究方法竞争。有一个简单的，可用的GUI来做人脸识别，训练和测试是有用的，并且实时的来至网络摄像机的交互。因此，在这一部分将提供一个交互的GUI来为服务这些特征（个人理解，来服务人脸识别，训练）。读者或者期望使用本书提供的GUI，或者为他们自己的工程修改GUI，或者忽略这个GUI并且设计自己的GUI来执行到目前为止讨论的人脸识别技术。

由于我们需要GUI来执行多个任务，让我们创建一个GUI将要使用的模式集（modes）或者状态集(states)，用户使用按键或者点击鼠标来改变模式：

1、 Startup ：这个模式导入、初始化数据和相机。

2、Detection：这个模式检测人脸并且显示预处理，直到用户点击增加人脸（ Add Person）的按钮

3、Collection：这个模式收集当前人脸，直到用户点击窗口的任何地方。这也显示每个人最近人脸。用户或者点击一个存在的人脸或者点击增加人脸（ Add Person）按钮，来为不同的人收集人脸。

4、Training:

在这一模式，系统用所有收集的人的人脸来训练.

5、Recognition：

由标记识别的人和展示一个可信尺度组成。可以或者点击其中一个人或者点击增加人按钮，来返回模式 2 （Collection）。

为了退出，用户可以在任何时候点击窗口的退出。让我们增加一个删除所有的模式来重启一个人脸识别系统，并且增加一个调试按钮来触发额外调试信息的显示。我可以创建一个枚举类型的模式变量来显示当前的模式。

画出GUI元素

为了在屏幕上显示当前模式，我们创建一个函数来简单地画出文本。OpenCV带有cv::putText()函数，该函数带有几个字体和抗锯齿。但是将文本显示在你想显示的位置是复杂的。幸运地是，同样有一个cv::getTextSize()函数用来计算文本的边界框，因此我们创造一个封装函数来更容易的显示文本。我们想在窗口的任何边显示文本并且确保它完全可见，并且也允许文本的多行或者字紧挨着彼此不被覆盖。因此这里的封装函数允许你指定左侧调整或者右侧调整，同样也可以指定上侧调整或者下侧调整，并且返回一个边界框。因为我们可以容易地在窗口的角或者边界画出多行的文本。

[cpp]  view plain copy 
     
    
 //在图像上画文本，默认为左上调整文本，因此为右侧调整文本给出负x坐标，并且/或者为底侧调整给出负y坐标  
 //返回所画文本的边界矩形  
 Rect drawString(Mat img, string text, Point coord, Scalar   
 color, float fontScale = 0.6f, int thickness = 1,  
 int fontFace = FONT_HERSHEY_COMPLEX);  

现在为了在GUI显示当前的模式，因为窗口的背景是有相机进入，如果我们简单在相机流中画文本，这是相当可能的，它可能与相机背景同样的颜色！因此让我们画一个黑色的文本阴影，它与我们想要画的前景的文本仅有一个像素之差。让我们在他的下面画一个有用的文本行。因此用户知道跟随着步骤。下面是一个怎样使用drawString函数来画一些文本的例子。

[cpp]  view plain copy 
     
    
 string msg = "Click [Add Person] when ready to collect faces.";  
 // 画一个黑色阴影，再画一个白色文本  
 float txtSize = 0.4;  
 int BORDER = 10;  
 drawString(displayedFrame, msg, Point(BORDER, -BORDER-2),CV_RGB(0,0,0), txtSize);  
 Rect rcHelp = drawString(displayedFrame, msg, Point(BORDER+1,-BORDER-1), CV_RGB(255,255,255), txtSize);  

下面的部分截图展示了模式和GUI窗口底部信息，覆盖在相机图像上：

我们提到，我们想要少量的GUI按钮，因此，让我们简单地画出GUI按钮，如下：

[cpp]  view plain copy 
     
    
 //用drawString()函数，在图像上画一个GUI按钮  
 // 可以设置minWidth参数，来使几个按钮具有同样的宽度  
 //返回所画按钮的边界矩形  
 Rect drawButton(Mat img, string text, Point coord,  
 int minWidth = 0)  
 {  
 const int B = 10;  
 Point textCoord = Point(coord.x + B, coord.y + B);  
 //获取文本的边界框   
 Rect rcText = drawString(img, text, textCoord, CV_RGB(0,0,0));  
 //在文本周围画一个填充的矩形  
 Rect rcButton = Rect(rcText.x - B, rcText.y – B,rcText.width + 2*B, rcText.height + 2*B);  
 // 设置按钮的最小宽度  
 if (rcButton.width < minWidth)  
 rcButton.width = minWidth;  
 //创建一个半透明的白色矩形  
 Mat matButton = img(rcButton);  
 matButton += CV_RGB(90, 90, 90);  
 // 画一个不透明的边界  
 rectangle(img, rcButton, CV_RGB(200,200,200), 1, CV_AA);  
 // 画实际要显示的文本  
 drawString(img, text, textCoord, CV_RGB(10,55,20));  
 return rcButton;  
 }  

现在我们使用drawButtion()函数创建了几个可以点击的GUI按钮，这些按钮总是显示在GUI的左上方，就像下面截图展示的：

第八章采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）_第3张图片

像我们提到的，GUI程序有很多模式，可以在他们之间切换（作为一个有限状态（模式）的机器）。开始使用Startup模式。我们将使用m_mode变量存储当前模式。

Startup模式

在Startup模式中，我们仅需要导入XML检测器文件来检测人脸和眼睛以及初始化网络摄像机。这些我们已经涉及到了。让我们用鼠标回调函数来创建一个主要的GUI窗口，当在窗口上用户移动或者点击鼠标时OpenCV将调用该函数。如果相机支持的话，同样需要设置合理的分辨率，例如640*480，做法如下：

[cpp]  view plain copy 
     
    
 //为在屏幕上显示，创建一个GUI窗口   
 namedWindow(windowName);  
 //当用户点击窗口时调用onMouse()函数.  
 setMouseCallback(windowName, onMouse, 0);  
 // 设置相机的分辨率，只对某些系统有效  
 videoCapture.set(CV_CAP_PROP_FRAME_WIDTH, 640);  
 videoCapture.set(CV_CAP_PROP_FRAME_HEIGHT, 480);  
 //我们已经初始化，因此让我们开始Detection模式   
 m_mode = MODE_DETECTION;  

Detection模式

在Detection模式中，我们希望连续地检测人脸和眼睛，画出包围他们矩形或者圆来显示检测的结果，并且显示当前预处理过的人脸。事实上，我们想，不管我们进入哪一个模式，都能显示。仅一个特殊的事情是关于人脸检测，当用户点击增加人按钮时，该模式将转换到下一个模式（收集）。如果你记住了在这章中先前的检测步骤，我们检测阶段的输出将是：

1、Mat preprocessedFace :预处理的人脸（如果人脸和眼睛被检测到）

2、Rect faceRect；检测到的人脸区域坐标

3、Point leftEye.rightEye:检测到的左眼和右眼中心坐标

因此我们应当检查是否返回预处理人脸，如果脸和眼被检测到，画出包围他们的矩形和圆。如下：

[cpp]  view plain copy 
     
    
 bool gotFaceAndEyes = false;  
 if (preprocessedFace.data)  
 gotFaceAndEyes = true;  
 if (faceRect.width > 0) {  
 // 在检测到的人脸周围画一个平滑的矩形  
 rectangle(displayedFrame, faceRect, CV_RGB(255, 255, 0), 2,CV_AA);  
 // 为两眼画浅蓝色的圆  
 Scalar eyeColor = CV_RGB(0,255,255);  
 if (leftEye.x >= 0) { // 检测左眼是否检测到  
 circle(displayedFrame, Point(faceRect.x + leftEye.x,faceRect.y + leftEye.y), 6, eyeColor, 1, CV_AA);  
 }  
 if (rightEye.x >= 0) { // 检测右眼是否检测到  
 circle(displayedFrame, Point(faceRect.x + rightEye.x,faceRect.y + rightEye.y), 6, eyeColor, 1, CV_AA);  
 }  
 }  

我们将当前预处理过的人脸覆盖在窗口的中上处，如下：

[cpp]  view plain copy 
     
    
 int cx = (displayedFrame.cols - faceWidth) / 2;  
 if (preprocessedFace.data) {  
 //获取人脸的BGR版本，因为输出是BGR  
 Mat srcBGR = Mat(preprocessedFace.size(), CV_8UC3);  
 cvtColor(preprocessedFace, srcBGR, CV_GRAY2BGR);  
 // 获取感兴趣的目的区域  
 Rect dstRC = Rect(cx, BORDER, faceWidth, faceHeight);  
 Mat dstROI = displayedFrame(dstRC);  
 // 复制原图像到目的图像  
 srcBGR.copyTo(dstROI);  
 }  
 //在人脸周围画一个平滑的边界   
 rectangle(displayedFrame, Rect(cx-1, BORDER-1, faceWidth+2,faceHeight+2), CV_RGB(200,200,200), 1, CV_AA);  

下面的截图展示了当在检测模式时显示的GUI。预处理过的人脸在中上部显示，并且对检测到的人脸和人眼进行了标记。

Collection 模式

像先前提到的，我们限制每秒收集一个人脸并且只要它与先前搜集的人脸有显著的变化。而且要记住，我们不光收集预处理的人脸而且还收集预处理人脸的镜像图像。

在收集模式中，我们想展示每个已知人的最近的人脸并且用户点击这些人中一个人脸来为他们增加更多的人脸或者点击增加人按钮为集增加一个新人。用户必须点击窗口中部一些地方来继续下一个模式（Training）。

因此，首先我们需要为每个收集上的人的最新人脸保存一个参考。我们通过更新整形数组m_lastestFace来做到这一点。这个数组仅存每个人索引的排列，这些数据来至于最大的preprocessedFaces数组（即收集所有人的所有人脸）。因为我们也将镜像人脸存储在那个数组，我们想参考倒数第二个人脸，不是最后一个人脸。这个代码应当追加一个添加新人脸（和镜像人脸）到preprocessedFaces数组的代码。如下：

[cpp]  view plain copy 
     
    
 // 为每一个人的最新人脸保存一个参考  
 m_latestFaces[m_selectedPerson] = preprocessedFaces.size() - 2;  

当一个新人被增加或者删除时，我们必须总是记住增长和缩小m_lastestFaces数组。（例如，由于用户点击增加人按钮）。现在让我们在窗口的右手边显示每一个搜集上来的人的最近人脸（在Collection模式和后面的Recognition模式中显示）如下：

[cpp]  view plain copy 
     
    
 m_gui_faces_left = displayedFrame.cols - BORDER - faceWidth;  
 m_gui_faces_top = BORDER;  
 for (int i=0; i<m_numPersons; i++) {  
 int index = m_latestFaces[i];  
 if (index >= 0 && index < (int)preprocessedFaces.size()) {  
 Mat srcGray = preprocessedFaces[index];  
 if (srcGray.data) {  
 // 获取一个Get a BGR face, since the output is BGR.  
 Mat srcBGR = Mat(srcGray.size(), CV_8UC3);  
 cvtColor(srcGray, srcBGR, CV_GRAY2BGR);  
 // Get the destination ROI  
 int y = min(m_gui_faces_top + i * faceHeight,  
 displayedFrame.rows - faceHeight);  
 Rect dstRC = Rect(m_gui_faces_left, y, faceWidth,  
 faceHeight);  
 Mat dstROI = displayedFrame(dstRC);  
 // Copy the pixels from src to dst.  
 srcBGR.copyTo(dstROI);  
 }  
 }  
 }  

我们也想加亮当前被收集的人，使用一个围绕人脸的粗的红色边界。做法如下：

[cpp]  view plain copy 
     
    
 if (m_mode == MODE_COLLECT_FACES) {  
 if (m_selectedPerson >= 0 &&m_selectedPerson < m_numPersons) {  
 int y = min(m_gui_faces_top + m_selectedPerson * faceHeight, displayedFrame.rows – faceHeight);  
 Rect rc = Rect(m_gui_faces_left, y, faceWidth,   
 faceHeight);  
 rectangle(displayedFrame, rc, CV_RGB(255,0,0), 3, CV_AA);  
 }  
 }  

下面的部分截图展示了当几个人脸已经被搜集时的典型的显示。

第八章采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）_第5张图片

Training模式

当用户最终点击窗口的中间，人脸识别算法开始在收集的人脸上进行训练。但是确保有足够的人脸或者人收集是很重要的，否则程序可能崩溃。总的来说，这仅需要确保在训练集中至少有一个人脸。（这暗示至少有一个人）。但是Fisherfaces算法寻找在两个人之间进行比较。因此如果在训练集中少于两个人，程序同样也崩溃。如果是这样，那么，我们至少需要两个人脸，否则我们至少需要一个人的人脸。如果没有足够的数据，那么程序返回收集模式，因此用户可以在训练之前增加更多的人脸。

为了检查是否有至少有两个人收集的人脸，我们可以确保当用户点击增加人按钮时，如果没有任何空的人（也就是说，增加了新人，但是没有任何收集的人脸），一个新人仅增加。当我们正在使用Fisherfaces算法时，那么我们也可以确保是否仅有两个人。因此我们必须确保在收集模式期间相关数组m_latestFaces被设置。当还没有任何人脸增加到增加到那个人时，m_latestFaces[i]被初始化为-1。一旦那个人被添加，它将变为0或者更高。做法如下:

[cpp]  view plain copy 
     
    
 // 检查是否有足够的数据来训练  
 bool haveEnoughData = true;  
 if (!strcmp(facerecAlgorithm, "FaceRecognizer.Fisherfaces")) {  
 if ((m_numPersons < 2) ||  
 (m_numPersons == 2 && m_latestFaces[1] < 0) ) {  
 cout << "Fisherfaces needs >= 2 people!" << endl;  
 haveEnoughData = false;  
 }  
 }  
 if (m_numPersons < 1 || preprocessedFaces.size() <= 0 ||preprocessedFaces.size() != faceLabels.size()) {  
 cout << "Need data before it can be learnt!" << endl;  
 haveEnoughData = false;  
 }  
 if (haveEnoughData) {  
 // 使用Eigenfaces或者Fisherfaces训练收集的人脸  
 model = learnCollectedFaces(preprocessedFaces, faceLabels,facerecAlgorithm);  
 //既然训练结束，我们开始识别   
 m_mode = MODE_RECOGNITION;  
 }  
 else {  
 // 没有足够的训练数据，返回收集模式  
 m_mode = MODE_COLLECT_FACES;  
 }  

训练可能不到一秒，或者可能几秒或者甚至几分钟，这取决于收集数据的多少。一旦收集的人脸完成训练。人脸识别系统将要自动地进入识别（Recognition）模式。

Recognition模式

在识别模式中，一个可信尺度挨着预处理的人脸显示，因此用户知道识别的可靠性是怎样的。如果这个信任水平高于未知阈值（unknown threshold）。将在一个识别人的周围画一个绿色的矩形来简单地显示结果。如果用户点击增加人按钮（Add Person）或者已存在的一个人，则可以为进一步训练增加更多的人脸。这将使程序返回到收集（collection）模式。

现在我们已经获得识别的身份和前面提到的重构人脸的相似度。为了显示信任尺度，对于高的信任度L2相似值一般在0到0.5之间并且对于低的信任值在0.5到1之间，因此我们可以仅从1中减去它来获得在0到1之间的信任水平。那么我们仅使用信任水平作为比例来画一个填充的矩形，如下：

[cpp]  view plain copy 
     
    
 int cx = (displayedFrame.cols - faceWidth) / 2;  
 Point ptBottomRight = Point(cx - 5, BORDER + faceHeight);  
 Point ptTopLeft = Point(cx - 15, BORDER);  
 // 对于"unkown" people 画一个灰色线来展示阈值  
 Point ptThreshold = Point(ptTopLeft.x, ptBottomRight.y -(1.0 - UNKNOWN_PERSON_THRESHOLD) * faceHeight);  
 rectangle(displayedFrame, ptThreshold, Point(ptBottomRight.x,ptThreshold.y), CV_RGB(200,200,200), 1, CV_AA);  
 //修剪信任度比率到0和1之间来填充长条  
 double confidenceRatio = 1.0 - min(max(similarity, 0.0), 1.0);  
 Point ptConfidence = Point(ptTopLeft.x, ptBottomRight.y -confidenceRatio * faceHeight);  
 // 展示淡蓝色信任度条  
 rectangle(displayedFrame, ptConfidence, ptBottomRight,CV_RGB(0,255,255), CV_FILLED, CV_AA);  
 // 画长条的灰色边界.  
 rectangle(displayedFrame, ptTopLeft, ptBottomRight,CV_RGB(200,200,200), 1, CV_AA);  

为了加亮识别的人脸，我们在他们的人脸周围画一个绿色的矩形，如下：

[cpp]  view plain copy 
     
    
 if (identity >= 0 && identity < 1000) {  
 int y = min(m_gui_faces_top + identity * faceHeight,  
 displayedFrame.rows - faceHeight);  
 Rect rc = Rect(m_gui_faces_left, y, faceWidth, faceHeight);  
 rectangle(displayedFrame, rc, CV_RGB(0,255,0), 3, CV_AA);  
 }  

下面的部分截图展示了运行人脸识别模式时一个典型的显示，展示了信任尺度在顶部中心处挨着预处理过的人脸。并且在右上角加亮识别的人脸。

第八章采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）_第6张图片

检查和处理鼠标点击

既然我们已经把所有的GUI元素画出来了，我们仅需要处理鼠标事件。当我们初始化显示窗口时，我们告诉OpenCV我们想要一个鼠标事件回调给我们的onMouse函数。我们不关心鼠标的运动，只关心鼠标的点击，因此首先我们跳过不是鼠标左键点击的鼠标事件，如下：

[cpp]  view plain copy 
     
    
 void onMouse(int event, int x, int y, int, void*)  
 {  
 if (event != CV_EVENT_LBUTTONDOWN)  
 return;  
 Point pt = Point(x,y);  
 ... (handle mouse clicks) ...  
 }  

当我们画这些按钮时，我们获得了这些按钮的矩形边界，我们仅调用OpenCV的inside()函数来检测鼠标是否点击了我们按钮区域的任何位置。现在我们可以检测我们创建的每一个按钮。当用户点击增加人按钮（Add Person）时，我们仅增加了一个m_numPersons变量，给变量m_latestFaces分配更多的空间，选择一个新的要收集的人，并且开始收集（Collection）模式。（不管先前我们所在的是哪个模式）。但是有一个混乱；为了确保当训练时，我们拥有每一个人至少一个人脸，如果已没有无人脸数据的人，我们仅为一个新人分配空间。这将确保我们可以总是检查m_lastestFaces[m_numPersons-1]的值来看是否对于每一个人一张人脸已经被收集。做法如下：

[cpp]  view plain copy 
     
    
 if (pt.inside(m_btnAddPerson)) {  
 //确保每一个人都带有收集的人脸  
 if ((m_numPersons==0) ||(m_latestFaces[m_numPersons-1] >= 0)) {  
 // 增加一个新人  
 m_numPersons++;  
 m_latestFaces.push_back(-1);  
 }  
 m_selectedPerson = m_numPersons - 1;  
 m_mode = MODE_COLLECT_FACES;  
 }  

这个方法可以用于测试其他按钮的点击，例如触发debug标志如下：

[cpp]  view plain copy 
     
    
 else if (pt.inside(m_btnDebug)) {  
 m_debug = !m_debug;  
 }  

为了处理删除所有（ Delete All）按钮，我们需要清除我们循环中各种数据结构。（也就是说，无法访问鼠标事件回调函数。）因此我们改变删除所有模式。并且然后我们从内部的主循环中删除所有的事情。我们也必须处理用户点击主窗口（即不是一个按钮）。如果他们点击了在右手边的其中一个人，那么我们想选择这个人，并且转换到收集（Collection）模式。或者在收集（Collection）模式时，他们点击了主窗口，那么我们想转换到训练模式（Collection）。做法如下：

[cpp]  view plain copy 
     
    
 else {  
 // 检测用户是否点击了列表中的脸  
 int clickedPerson = -1;  
 for (int i=0; i<m_numPersons; i++) {  
 if (m_gui_faces_top >= 0) {  
 Rect rcFace = Rect(m_gui_faces_left, m_gui_faces_top + i * faceHeight, faceWidth, faceHeight);  
 if (pt.inside(rcFace)) {  
 clickedPerson = i;  
 break;  
 }  
 }  
 }  
 // 如果用户点击了一个人脸，则改变选择的人  
 if (clickedPerson >= 0) {  
 // 转换当前人&收集更多的照片  
 m_selectedPerson = clickedPerson;  
 m_mode = MODE_COLLECT_FACES;  
 }  
 //反正他们点击了屏幕的中心，（进入训练模式）  
 else {  
 //如果正在收集人脸，改变到训练模式  
 if (m_mode == MODE_COLLECT_FACES) {  
 m_mode = MODE_TRAINING;  
 }  
 }  
 }  

总结

在这一章我们已经像你展示了创建一个实时人脸识别应用所需要的所有步骤，该步骤带有充足预处理，允许训练集环境和测试集环境的一下差异，仅采用基本的算法。我们使用人脸检测来找到相机图像中人脸的位置，接下来经过几种形式的人脸预处理来减少不同光照情况，相机和人脸方向以及面部表情的影响。然后我们用我们收集的预处理人脸来训练一个Eigenfaces或者Fisherfaces机器学习系统，并且最终我们进行人脸识别，通过提供一个信任度量来核实这个人是谁，以防它是一个未知的人（unknown person)。

而不是提供一个命令行工具以离线的方式处理图像文件夹，我们组合上述所有的步骤到一个独立的实时GUI程序来允许快捷的使用人脸识别系统。你应当能够为你的自己的目的修改系统的行为，例如运行你计算机的自动登入，或者如果你对提高人脸识别的可靠型感兴趣，那么你可以阅读关于最先进人脸识别的文章来可能地改善程序的每一个步骤，直到满足你具体的需要。例如，你可以改善人脸预处理阶段，或者使用一个更先进的机器学习算法，或者甚至更好人脸验证算法，基于该网站的方法：

http://www.face-rec.org/algorithms/

http://www.cvpapers.com。

参考文献

• Rapid Object Detection using a Boosted Cascade of Simple Features, P. Viola
and M.J. Jones, Proceedings of the IEEE Transactions on CVPR 2001, Vol. 1,
pp. 511-518
• An Extended Set of Haar-like Features for Rapid Object Detection, R. Lienhart and J.
Maydt, Proceedings of the IEEE Transactions on ICIP 2002, Vol. 1, pp. 900-903
• Face Description with Local Binary Patterns: Application to Face Recognition, T.
Ahonen, A. Hadid and M. Pietikäinen, Proceedings of the IEEE Transactions on
PAMI 2006, Vol. 28, Issue 12, pp. 2037-2041
• Learning OpenCV: Computer Vision with the OpenCV Library, G. Bradski and A.
Kaehler, pp. 186-190, O'Reilly Media.
• Eigenfaces for recognition, M. Turk and A. Pentland, Journal of Cognitive
Neuroscience 3, pp. 71-86
• Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection, P.N.
Belhumeur, J. Hespanha and D. Kriegman, Proceedings of the IEEE Transactions on
PAMI 1997, Vol. 19, Issue 7, pp. 711–720
• Face Recognition with Local Binary Patterns, T. Ahonen, A. Hadid and M.
Pietikäinen, Computer Vision - ECCV 2004, pp. 469–48

你可能感兴趣的:(LDA,pca)

用了这么多年的PCA可视化竟然是错的！！！生信宝典
本文启发于上周开的单细胞转录组课程，本次课程由资深单细胞算法研究者戴老师主讲，深入浅出，各部分分析原理从理论到应用层面解释透彻，最新流程，最新代码，绝对值得学习。课程尚未结束，我就迫不及待向一位未能安排出时间参加此课程的老友及时安利了视频课。言归正传，介绍培训课程的一张幻灯片：很多PCA可视化结果都是不合适的。PCA或PCoA是常用的降维工具，之前有几篇文章介绍PCA的原理和可视化。一文看懂PCA
跟我一起写 SIPp XML scenario file 之二无名387 os 通讯
就我个人的体会而言，貌似没什么秘诀，无非是：勤查手册拿到一个样本，进行临摹，多加练习分析有几个SIP事务如果SIPp做uas,totag是自己产生的fromtag,totag要不要颠倒过来requesturl的url来自何处如果uas主动发request,via是自己产生的要不要支持sipproxy目标是：拿到任意pcap文件，都可以写出对应的XMLscenariofile另：手册在这里：http
FPGA编程指南: CSU DMA传输行者.................. fpga开发 FPGA
1.将安全流开关配置设置为从DMA源接收，即设置csu.csu_sss_cfg[pcap_sss]为0x5。2.配置并设置CSU_DMA以建立通道和传输，具体编程方法可参考CSUDMA编程部分。-通道类型为DMA_SRC。-设置源地址为位流的地址。-设置大小为以字表示的位流大小。3.等待CSUDMA操作完成，确保源频道的传输已完成。4.清除CSU_DMA中断并确认传输完成，这需要设置csudma.
Boot header格式描述详细信息。CSU DMA用于数据传输。安全流开关允许数据移动。PL配置通过PCAP接口。PL bit流包含设备配置数据。行者.................. FPGA
在Bootheader中的一些重要字段包括：-Reservedforinterrupts:用于存储中断相关信息，特别是在LQSPI地址空间中的默认0x01F中断向量被更改时，在XIP启动模式下使用。-Quad-SPI宽度检测:用于描述Quad-SPI宽度的字段。-加密状态:用于标识AES密钥来源，包括不加密、红密钥、黑密钥等。-FSBL执行地址:FSBL执行的起始地址。-源偏移:PMUFW和FSB
2024世界技能大赛某省选拔赛“网络安全项目”B模块--数据包分析(SMB流量) 落寞的魚丶 web安全安全 2024世界技能大赛选拔赛网络安全 B模块 SMB流量分析
2024世界技能大赛某省选拔赛“网络安全项目”B模块--数据包分析③任务二、网络数据包分析取证解析：总结：任务二、网络数据包分析取证解析：A集团的网络安全监控系统发现有恶意攻击者对集团官方网站进行攻击，并抓取了部分可疑流量包。请您根据捕捉到的流量包，搜寻出网络攻击线索，并分析黑客的恶意行为。本任务素材清单：捕获的网络数据包文件（*.pcap）请按答题卡的要求完成该部分的工作任务。序号任务要求11.
潜在狄利克雷分配（Latent Dirichlet Allocation,LDA）—无监督学习方法、概率模型、生成模型、线性模型、非参数化模型、贝叶斯学习、批量学习剑海风云 Artificial Intelligence 人工智能机器学习潜在狄利克雷分配 LDA
定义输入:单词集合W={ω1,⋯ ,ωv,⋯ ,ωV},其中ωv是第v个单词,v=1,2,⋯ ,V,V是单词第个数。单词集合W=\{\omega_1,\cdots,\omega_v,\cdots,\omega_V\},其中\omega_v是第v个单词,v=1,2,\cdots,V,V是单词第个数。单词集合W={ω1,⋯,ωv,⋯,ωV},其中ωv是第v个单词,v=1,2,⋯,V,V是单词第个数。文
线性判别分析 (Linear Discriminant Analysis, LDA) ALGORITHM LOL 人工智能机器学习算法
线性判别分析(LinearDiscriminantAnalysis,LDA)通俗易懂算法线性判别分析（LinearDiscriminantAnalysis，LDA）是一种用于分类和降维的技术。其主要目的是找到一个线性变换，将数据投影到一个低维空间，使得在这个新空间中，不同类别的数据能够更好地分离。线性判别分析的核心思想LDA的基本思路是最大化类间方差（between-classvariance）与
python并发与并行（十一） ———— 让asyncio的事件循环保持畅通，以便进一步提升程序的响应能力 bug404_ python并发与并行 python 开发语言
前一篇blog说明了怎样把采用线程所实现的项目逐步迁移到asyncio方案上面。迁移后的run_tasks协程，可以将多份输入文件通过tail_async协程正确地合并成一份输出文件。importasyncio#OnWindows,aProactorEventLoopcan'tbecreatedwithin#threadsbecauseittriestoregistersignalhandlers
机器学习实战笔记5——线性判别分析绍少阿机器学习笔记可视化机器学习 python 人工智能
任务安排1、机器学习导论8、核方法2、KNN及其实现9、稀疏表示3、K-means聚类10、高斯混合模型4、主成分分析11、嵌入学习5、线性判别分析12、强化学习6、贝叶斯方法13、PageRank7、逻辑回归14、深度学习线性判别分析（LDA）Ⅰ核心思想对于同样一件事，站在不同的角度，我们往往会有不同的看法，而降维思想，亦是如此。同上节课一样，我们还是学习降维的算法，只是提供了一种新的角度，由上
亦菲喊你来学机器学习（20） --PCA数据降维方世恩机器学习人工智能深度学习 python 算法 sklearn
文章目录PCA数据降维一、降维二、优缺点三、参数四、实例应用1.读取文件2.分离特征和目标变量3.使用PCA进行降维4.打印特征所占百分比和具体比例5.PCA降维后的数据6.划分数据集7.训练逻辑回归模型8.评估模型性能总结PCA数据降维主成分分析（PrincipalComponentAnalysis,PCA）是一种常用的数据降维技术，它可以在保留数据集中最重要的特征的同时，减少数据的维度。PCA
[晕事]今天做了件晕事44 wireshark 首选项IPv4：Reassemble Fragented IPv4 datagrams mzhan017 网络云平台运维 wireshark 测试工具分片假象
不知不觉，已经来到了晕事系列的第四十四个晕事。今天办的晕事和Wireshark查看网络包相关。说，在Wireshark的编辑-首选项协议里的IPv4协议，有一个参数设置是：ReassembleFragentedIPv4datagrams。这个参数的含义是指定Wireshark，在打开pcap文件进行解析的时候要：先解包；还是先组装分片包，再解包。如果是选择了这个选项，就代表，分片重组之后再进行解析
ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory: gatinaa python
重新安装包：pipinstall--upgrade--force-reinstallEMN清理缓存：pipcachepurge更新pip：pipinstall--upgradepip
r语言做绘制精美pcoa图_R语言高级绘图 — ggplot2 weixin_39560002 r语言做绘制精美pcoa图
2)PCA的作图PCA主成分分析，可以将高维数据进行降维处理。我们的OTU表格就是典型的高维数据，可以对其进行降维处理得到主成分PC1和PC2，然后将所有样品都分解到这两个成分方向，进行散点绘图，可以直观的看出样品间的差异。首先需要一系列的统计处理，然后用ggplot2进行绘图，过程如下：#加载需要的三个包(需要先下载，再加载)>library(ade4)>library(ggplot2)>lib
2021-03-26 每日打卡来多喜
昨日完成情况：1.3k跑，没有做帕梅拉。感觉早上醒来的太早，一整天人都有一点昏昏沉沉，感觉荒废了一天。2.其他两项全部没完成，感觉想做的事情太多，反而容易什么都不做。本来想学pca,但是看了一下觉得要先复习机器学习，然后就在纠结中什么都没做。感想：冲劲十足的周一周二，慢慢的懒下来。。。要继续保持运动和自我学习。要继续考虑如何定下适量的每日任务。今日打卡：1.排球2.去他妈家3.整理房间4.填完合同
WebView交互架构项目实战（三），androidstudio地图开发 wq221aas 程序员架构移动开发 android
不过根据官方文档，AppCache已经不推荐使用了，标准也不会再支持。现在主流的浏览器都是还支持AppCache的，以后就不太确定了。同样给出Android端启用AppCache的代码。WebViewmyWebView=(WebView)findViewById(R.id.webview);WebSettingswebSettings=myWebView.getSettings();webSett
935(Div.3) Digital_Enigma 这是题解算法 c++青少年编程 c语言开发语言编辑器排序算法
总结一下前几天CFCFCF上的比赛，因为那个时间对我不太友好，所以我是虚拟参赛的这是一场在202420242024年333月191919号的比赛。于是乎——————题解诞生了A.SettingupCamp题目：点一下吧不是负数就把c全部安排三人间，有余数再加1。优先考虑aaa这种人（有点烦，但对于我们来说还挺好）：至少要有aaa个帐篷其次是bbb:他要三个人住，如果bbb不是333的倍数，就从cc
Java中的数据降维技术：如何实现PCA和t-SNE 省赚客app开发者 java python 人工智能
Java中的数据降维技术：如何实现PCA和t-SNE大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在这篇文章中，我们将探讨如何在Java中实现数据降维技术，特别是主成分分析（PCA）和t-SNE。这两种技术在数据预处理和可视化中非常重要，它们帮助我们将高维数据转换为低维数据，保留数据的主要特征。主成分分析（PCA）主成分分析（PCA）是一种线性降维技术，用于将数据从
Capture local packets using Wireshark 使用 wireshark 抓本地包 Chia-Te Kuan http-flv 經驗談分析工具测试工具网络
一般而言windows系統本地到本地ip的傳輸不會經過網卡，因此無法由wireshark捕捉解析，本文介紹wireshark同步安裝Npcap方式，藉此loopback本地ip到本地ip本文不推薦網傳routeaddmask255.255.255.255這個方法，因將大幅拖慢系統效率(所有本地到本地的包都要重新入網卡)，甚者導致timeout而無法運行NetworkprogramGenerally
3D 场景模拟 2D 碰撞玩法的方案长脖鹿Johnny 数学算法 3d 游戏游戏引擎算法几何学
目录方法概述顶点到平面的垂直投影求解最小降维OBB主成分分析（PCA）协方差矩阵求矩阵特征值Jacobi方法OBB拉伸方法对于类似《密特罗德生存恐惧》和《暗影火炬城》这样3D场景，但玩法还是2D卷轴动作平台跳跃（类银河恶魔城）的游戏，如果想要让碰撞检测更符合视觉直觉，需要采用3D碰撞体来模拟2D碰撞。本文将介绍一种实现方案。方法概述为了简化碰撞计算，原碰撞体（如武器的碰撞）只使用长方体（OBB）和
DPDK22.11环境搭建羽思 DPDK 网络驱动开发
1.工具下载1.ubuntu安装工具：sudoapt-getinstallmesonsudoapt-getinstallninjasudoapt-getinstallpython3-pyelftools2.centosyuminstall-ypython3-pipnumactl-devellibibverbs-utilslibpcap-devel//安装libpcap依赖包wgethttp://m
redisson RMap和RMapCache的区别 weixin_43833540 redis redission
RMap和RMapCache的区别可以归纳为以下几点：基本功能：RMap：是一个分布式的映射结构，类似于Java中的Map接口，用于存储键值对。RMapCache：是一个带有缓存自动过期功能的Map实现，它结合了RMap的映射功能和缓存过期的特性。过期时间设置：RMap：在RMap中，不能直接为单个键值对设置过期时间。Redis的Hash数据类型本身不支持自动过期，因此需要通过其他方式（如应用层逻
自然语言处理系列五十五》文本聚类算法》LDA主题词-潜在狄利克雷分布模型算法原理陈敬雷-充电了么-CEO兼CTO 人工智能大数据算法算法自然语言处理聚类 AIGC aigc chatgpt 大数据
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列五十五文本聚类算法》LDA主题词-潜在狄利克雷分布模型算法原理LDA主题词-潜在狄利克雷分布模型代码实战总结自然语言处理系列五十五文本聚类算法》LDA主题词-潜在狄利克雷分布模型算法原理LDA是潜在狄利克雷分布模型的简称，也
第二章可通行栅格建立（PCA方法）喜欢躺着玩点云处理与导航 3d c++
系列文章目录这一篇主要讲怎么通过PCA建立栅格可通行栅格，这部分其实有非常多的方法，这也只是当时前期使用的一个简单demo文章目录系列文章目录前言一、栅格地图二、RTK定位1.更新位置2.将点云读入到栅格地图中3.对每个栅格进行PCA判断总结前言提示：这里可以添加本文要记录的大概内容：对于做工程来说，一般地面分割使用PCA，生长算法以及RANSAC拟合平面较多，但是ransac的波动较为敏感，生长
Qt 计算圆面积碳碳贰键
上面是creator的ui界面从左到右从上之下的命名m_pEnterLabelm_pEnterLineEditm_pShowLabelm_pShowLineEditm_pCaculatePushButton.h#ifndefDIALOG_H#defineDIALOG_H#includenamespaceUi{classDialog;}classDialog:publicQDialog{Q_OBJE
IOS MKMapCamera三维地图 SkTj
1overridefuncviewDidLoad(){2super.viewDidLoad()3//Doanyadditionalsetupafterloadingtheview,typicallyfromanib.45letmapView=MKMapView(frame：self.view.bounds)6mapView.mapType=MKMapType.standard78letcenter
基于 LDA SS-NMF 的文本主题分析可视化分析系统毕业设计附完整代码程序员奇奇计算机毕设课程设计 python 人工智能 LDA 主题分析
摘要在机器学习和自然语言处理领域中，主题模型(TopicModel)是在一系列文档中发现抽象主题的一种统计模型，并被广泛地应用于文本文档集合的分析。近年来，各种主题建模技术，特别是概率图建模技术，取得了显著的进展，其中隐含狄利克雷分布(LDA)等最先进的技术已经成功地应用于可视化文本分析。然而，大多数基于概率模型的方法在多次运行的一致性和经验收敛性方面存在缺陷。此外，由于公式和算法的复杂性，LDA
react-native-http-cache android编译错误 ablac
getSmallImageDiskStorageCache()改为getSmallImageFileCachegetMainDickStorageCache()改为getMainFileCacheios编译错误import"RCTHttpCache.h"注释下面三个//#import"RCTImageLoader.h"//#import"RCTImageCache.h"//#import"RCTB
aarch64-linux-gnu 交叉编译 libpcap 苍蝇小黑嵌入式 libpcap
文章目录aarch64-linux-gnu交叉编译libpcap1.交叉编译工具下载2.交叉编译工具安装3.配置交叉编译工具环境变量4.libpcap源码下载和编译5.libpcap测试aarch64-linux-gnu交叉编译libpcap1.交叉编译工具下载首先确认交叉编译工具的版本，不同的开发板自带的GLIBC版本可能不同，因此可能出现最新的交叉编译工具编译出的软件不能运行的问题，例如编译后
Unet改进10：在不同位置添加CPCA||通道先验卷积注意力机制 AICurator Unet改进专栏深度学习神经网络 unet 语义分割
本文内容：在不同位置添加CPCA注意力机制目录论文简介1.步骤一2.步骤二3.步骤三4.步骤四论文简介低对比度和显著的器官形状变化等特征经常出现在医学图像中。现有注意机制的自适应能力普遍不足，限制了医学影像分割性能的提高。本文提出了一种有效的通道先验卷积注意(CPCA)方法，该方法支持通道和空间维度上注意权重的动态分布。通过采用多尺度深度卷积模块，有效地提取空间关系，同时保留先验通道。CPCA具有
[每周一更]-(第111期)：从零开始：如何在 CentOS 上源码编译安装 PHP 7.4 ifanatic 每周一更 PHP centos php linux
文章目录系统信息：0、安装版本：1、下载/解压2、安装依赖3、配置autoconf4、配置参数5、编译和安装6、验证安装的插件6.1、配置php.ini6.2、配置opcache7、错误7.1Failedtoconnectto2a03:2880:f10e:83:face:b00c:0:25de:Networkisunreachable7.1.1禁用yum使用IPv67.1.2使用备用镜像7.2co
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

第八章 采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）

你可能感兴趣的:(LDA,pca)

第八章采用PCA(主成分分析)或LDA(线性判别分析)的人脸识别（二）