lijiatong1005

PCA降维算法总结以及matlab实现PCA(个人的一点理解)

转自: http://blog.csdn.net/weixingstudio/article/details/8234766

目录(?)[+]

转载请声明出处。by watkins song

PCA的一些基本资料

最近因为最人脸表情识别，提取的gabor特征太多了，所以需要用PCA进行对提取的特征进行降维。

本来最早的时候我没有打算对提取的gabor特征进行降维，但是如果一个图像时64*64,那么使用五个尺度八个方向的gabor滤波器进行滤波，这样提取的特征足足有64*64*5*8这么多，如果图像稍微大一点，比如128*128的图像，那么直接提取的特征就会几十万，所以不降维的话直接用SVM训练分类器是非常困难的。

所以在这段时间我就学习了一下PCA降维的基本原理和使用方法，网上给出的资料都比较乱，而且很不清楚，经过这几天的学习和测试，终于把调理弄清楚了，给大家分享一下，下面只是我对于PCA的个人理解，肯定有不对的地方，还请各位大牛多多指教。

下面先给出一下PCA的资料地址，都是我收集的：

http://hi.baidu.com/yicomrdztxbeiwd/item/913f28c05cf7ebc4994aa06f

http://blog.sciencenet.cn/blog-265205-544681.html

http://blog.csdn.net/mpbchina/article/details/7384425

http://blog.sina.com.cn/s/blog_6833a4df0100pvk7.html

http://stackoverflow.com/questions/4991343/matlab-principal-component-analysis-eigenvalues-order

http://stackoverflow.com/questions/10400230/what-is-score-in-princomp

http://www.mathworks.com/matlabcentral/newsreader/view_thread/152608

http://stats.stackexchange.com/questions/27572/matlab-princomp-latent

http://www.nlpca.org/pca-principal-component-analysis-matlab.html

http://www.matlabsky.com/thread-11751-1-1.html

http://stackoverflow.com/questions/10818718/principal-component-analysis

http://www.mathworks.cn/cn/help/stats/princomp.html

http://www.mathworks.cn/cn/help/stats/pca.html#bti6n7k-2

http://lovelittlebean.blog.163.com/blog/static/116582186201181213911729/

http://www.ilovematlab.cn/thread-54493-1-1.html

http://www.ilovematlab.cn/forum.php?mod=viewthread&tid=146626

http://www.ilovematlab.cn/forum.php?mod=viewthread&tid=204069

http://www.ilovematlab.cn/forum.php?mod=viewthread&tid=54600

http://search.discuz.qq.com/s/aa8585553/princomp+%E9%99%8D%E7%BB%B4.html

http://www.ilovematlab.cn/thread-68796-1-1.html

http://www.ilovematlab.cn/thread-209229-1-1.html

http://blog.sina.com.cn/s/blog_61c0518f0100f4mi.html

http://blog.csdn.net/haitao111313/article/details/7875392

http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/chapter11/chapt11_ahz.htm

http://hi.baidu.com/845777018/item/7438e555df1138404fff2011

http://en.wikipedia.org/wiki/Principal_component_analysis

http://baike.baidu.com/view/852194.htm

http://wenku.baidu.com/view/bd9284fcfab069dc51220107.html

http://wenku.baidu.com/view/c0bde56da98271fe910ef9b8.html

http://wenku.baidu.com/view/9f69930790c69ec3d5bb75d3.html

http://www.ilovematlab.cn/thread-54600-1-1.html

http://www.cnblogs.com/sunwufan/archive/2011/08/31/2159952.html

http://zhidao.baidu.com/question/416895922.html

上面的网址都是一些pca原理啊，实现什么的介绍。

具体的PCA的算法的理论基础呢，我这里就不详细说了，因为我也没有看具体详细，所以如果想要彻底的弄明白PCA的工作原来，还是请到wiki上看吧，写的非常清晰，我因为临时用一下，就写个大致的原理就可以了。

ＰＣＡ原理：

PCA的原理就是将原来的样本数据投影到一个新的空间中，相当于我们在矩阵分析里面学习的将一组矩阵映射到另外的坐标系下。通过一个转换坐标，也可以理解成把一组坐标转换到另外一组坐标系下，但是在新的坐标系下，表示原来的原本不需要那么多的变量，只需要原来样本的最大的一个线性无关组的特征值对应的空间的坐标即可。

比如，原来的样本是30*1000000的维数，就是说我们有30个样本，每个样本有1000000个特征点，这个特征点太多了，我们需要对这些样本的特征点进行降维。那么在降维的时候会计算一个原来样本矩阵的协方差矩阵，这里就是1000000*1000000，当然，这个矩阵太大了，计算的时候有其他的方式进行处理，这里只是讲解基本的原理，然后通过这个1000000*1000000的协方差矩阵计算它的特征值和特征向量，最后获得具有最大特征值的特征向量构成转换矩阵。比如我们的前29个特征值已经能够占到所有特征值的99%以上，那么我们只需要提取前29个特征值对应的特征向量即可。这样就构成了一个1000000*29的转换矩阵，然后用原来的样本乘以这个转换矩阵，就可以得到原来的样本数据在新的特征空间的对应的坐标。30*1000000 * 1000000*29 = 30 *29，这样原来的训练样本每个样本的特征值的个数就降到了29个。

一般来说，PCA降维后的每个样本的特征的维数，不会超过训练样本的个数，因为超出的特征是没有意义的。

下面是百度百科中对pca降维的一段解释，还是挺清晰的：

“对于一个训练集，100个对象模板，特征是10维，那么它可以建立一个100*10的矩阵，作为样本。求这个样本的协方差矩阵，得到一个10*10的协方差矩阵，然后求出这个协方差矩阵的特征值和特征向量，应该有10个特征值和特征向量，我们根据特征值的大小，取前四个特征值所对应的特征向量，构成一个10*4的矩阵，这个矩阵就是我们要求的特征矩阵，100*10的样本矩阵乘以这个10*4的特征矩阵，就得到了一个100*4的新的降维之后的样本矩阵，每个特征的维数下降了。

　　当给定一个测试的特征集之后，比如1*10维的特征，乘以上面得到的10*4的特征矩阵，便可以得到一个1*4的特征，用这个特征去分类。”

我对ＰＣＡ的一些了解

我的pca迷惑

迷惑一

刚开始接触ＰＣＡ的时候，咨询了一个浙大的博士朋友，这朋友告诉我，如果对训练样本进行降维，那么样本的数量必须大于特征的维数，然后我当时就迷惑了，那我怎么办啊，我的人脸表情图像顶多有几百张就算多的了，但是每个图像提取的特征的维数将近有几十万，我不可能找那么多样本去啊。当时有这个迷惑也是因为matlab给出的一个实现在pca降维的函数的说明，就是princomp，这个函数的说明也是用的样本的个数多余特征的维数。后来经过试验是证实，证实了那个浙大的博士的认识是错误的，pca降维肯定不需要样本的个数大于特征的维数，要不然还降维个什么意思。比如我有30*1000000的特征矩阵，那么降维后肯定是每个样本在新的空间中的表示的特征维数不超过30.

迷惑二

另外一个迷惑，在最初刚开始做的时候，就是为什么这么大的数据，比如30*1000000直接就降到了30*29，这不是减少的数据有点太多了么，会不会对性能造成影响。之所以有这个迷惑，是因为最初并不了解pca的工作方式。 pca并不是直接对原来的数据进行删减，而是把原来的数据映射到新的一个特征空间中继续表示，所有新的特征空间如果有29维，那么这29维足以能够表示非常非常多的数据，并没有对原来的数据进行删减，只是把原来的数据映射到新的空间中进行表示，所以你的测试样本也要同样的映射到这个空间中进行表示，这样就要求你保存住这个空间坐标转换矩阵，把测试样本同样的转换到相同的坐标空间中。

有些同学在网上发帖子问对训练样本降维以后，怎么对测试样本降维，是不是还是使用princomp这个函数进行降维，这个是错误的。如果你要保证程序运行正常，就要保证训练样本和测试样本被映射到同一个特征空间，这样才能保证数据的一致性。

迷惑三

网上有不同的pca降维的代码，每个代码也实现的不一样，那么对于同一个数据是否是pca降维以后都是获得相同的数据呢，也就是说不管你用哪种方式进行pca降维，不管你是从哪里下载到的或者自己根据算法实现的pca降维，同样的矩阵降维以后的数据是否一致？这个我个人认为，不同的算法最后导致的pca降维的数据肯定不一致。因为pca降维以后，只是把原来的数据映射到新的特征空间，所以如果你的算法不同，那么选择的协方差矩阵肯定就不同，最后获得的转换矩阵肯定也不一样。那么训练样本和测试样本和不同的转换矩阵相乘以后最终肯定会获得不同的降维坐标。所以使用不同的算法应该最后不会有相同的坐标结果，这个也是我一直实验的结果，我也使用了matlab自带的princomp降维，并且使用相同的数据使用网上下载的一些降维方法进行降维，得到的数据都不一致。

比如说princomp这个matlab自带的函数，在降维之前就将每一个样本减去了一个所有样本的平均值，也可能有很多样本没有减去平均值。princomp这里使用一行表示一个样本，每行包括这个样本的所有的特征值。而网上大部分都是每一列表示一个样本，这样这一列的所有行都表示这个样本的特征值。网上的程序使用列表示样本是有一定好处的，比如我的样本是1000000*30，总共有30个训练样本，每个样本的特征值个数是1000000，那么这个矩阵获得的协方差矩阵是30*30，计算起来非常的方便，不想30*1000000这样的矩阵获得到的协方差矩阵式1000000*1000000，直接就内存溢出了，不过matlab有自己的实现方式，巧妙的解决了这个问题。

pca的实现（matlab）

我在网上看了很多pca降维的例子，都大同小异，原理差不多，都是活的原来矩阵的协方差矩阵，然后计算协方差矩阵的特征值和特征向量，最后通过特征向量的根据特征值由大到小的排序进行KL变换神马的获得一个转换矩阵。

1. matlab自带的实现方式

　PCA在matlab中的实现举例

　　以下资料来自matlab的help，翻译和注解部分由笔者添加：(重点部分添加了翻译！)

　　 princomp-----函数名称

　　Principal component analysis (PCA) on data

　　Syntax------函数调用语法

　　[COEFF,SCORE] = princomp(X)

　　[COEFF,SCORE,latent] = princomp(X)

　　[COEFF,SCORE,latent,tsquare] = princomp(X)

　　[...] = princomp(X,'econ')

　　 Description -----函数描述

　　 COEFF = princomp(X) performs principal components analysis (PCA) on the n-by-p data matrix X, and returns the principal component coefficients, also known as loadings. Rows of X correspond to observations, columns to variables. COEFF is a p-by-p matrix, each column containing coefficients for one principal component. The columns are in order of decreasing component variance.

　　在n行p列的数据集X上做主成分分析。返回主成分系数。X的每行表示一个样本的观测值，每一列表示特征变量。COEFF是一个p行p列的矩阵，每一列包含一个主成分的系数，列是按主成分变量递减顺序排列。(按照这个翻译很难理解，其实COEFF是X矩阵所对应的协方差阵V的所有特征向量组成的矩阵，即变换矩阵或称投影矩阵，COEFF每列对应一个特征值的特征向量，列的排列顺序是按特征值的大小递减排序，后面有具体例子解释，见说明1 )

　　princomp centers X by subtracting off column means, but does not rescale the columns of X. To perform principal components analysis with standardized variables, that is, based on correlations, use princomp(zscore(X)). To perform principal components analysis directly on a covariance or correlation matrix, use pcacov.

　　计算PCA的时候，MATLAB自动对列进行了去均值的操作，但是并不对数据进行规格化，如果要规格化的话，用princomp(zscore(X))。另外，如果直接有现成的协方差阵，用函数pcacov来计算。

　　 [COEFF,SCORE] = princomp(X) returns SCORE, the principal component scores; that is, the representation of X in the principal component space. Rows of SCORE correspond to observations, columns to components.

　　返回的SCORE是对主分的打分，也就是说原X矩阵在主成分空间的表示。SCORE每行对应样本观测值，每列对应一个主成份(变量)，它的行和列的数目和X的行列数目相同。

　　 [COEFF,SCORE,latent] = princomp(X) returns latent, a vector containing the eigenvalues of the covariance matrix of X.

　　返回的latent是一个向量，它是X所对应的协方差矩阵的特征值向量。

　　 [COEFF,SCORE,latent,tsquare] = princomp(X) returns tsquare, which contains Hotelling's T2 statistic for each data point.

　　返回的tsquare，是表示对每个样本点Hotelling的T方统计量(我也不很清楚是什么东东)。

　　The scores are the data formed by transforming the original data into the space of the principal components. The values of the vector latent are the variance of the columns of SCORE. Hotelling's T2 is a measure of the multivariate distance of each observation from the center of the data set.

　　所得的分(scores)表示由原数据X转变到主成分空间所得到的数据。latent向量的值表示SCORE矩阵每列的方差(见说明2 )。Hotelling的T方是用来衡量多变量间的距离，这个距离是指样本观测值到数据集中心的距离。

　　When n <= p, SCORE(:,n:p) and latent(n:p) are necessarily zero, and the columns of COEFF(:,n:p) define directions that are orthogonal to X.

　　 [...] = princomp(X,'econ') returns only the elements of latent that are not necessarily zero, and the corresponding columns of COEFF and SCORE, that is, when n <= p, only the first n-1. This can be significantly faster when p is much larger than n.

　　当维数p超过样本个数n的时候，用[...] = princomp(X,'econ')来计算，这样会显著提高计算速度

　　 Examples--举例

　　(上面说了那么多废话，看了还不一定懂，还不如举例容易理解，下面样本数据集为ingredients，这个数据集是matlab自带的)

　　Compute principal components for the ingredients data in the Hald data set, and the variance accounted for by each component.

　　load hald; %载入matlab内部数据

　　[pc,score,latent,tsquare] = princomp(ingredients); %调用pca分析函数

　　ingredients,score,pc,latent,tsquare %显示得到的结果

　　ingredients =

　　7 26 6 60

　　1 29 15 52

　　11 56 8 20

　　11 31 8 47

　　7 52 6 33

　　11 55 9 22

　　3 71 17 6

　　1 31 22 44

　　2 54 18 22

　　21 47 4 26

　　1 40 23 34

　　11 66 9 12

　　10 68 8 12

　　score =

　　36.8218 -6.8709 -4.5909 0.3967

　　29.6073 4.6109 -2.2476 -0.3958

　　-12.9818 -4.2049 0.9022 -1.1261

　　23.7147 -6.6341 1.8547 -0.3786

　　-0.5532 -4.4617 -6.0874 0.1424

　　-10.8125 -3.6466 0.9130 -0.1350

　　-32.5882 8.9798 -1.6063 0.0818

　　22.6064 10.7259 3.2365 0.3243

　　-9.2626 8.9854 -0.0169 -0.5437

　　-3.2840 -14.1573 7.0465 0.3405

　　9.2200 12.3861 3.4283 0.4352

　　-25.5849 -2.7817 -0.3867 0.4468

　　-26.9032 -2.9310 -2.4455 0.4116

　　pc =

　　-0.0678 -0.6460 0.5673 0.5062

　　-0.6785 -0.0200 -0.5440 0.4933

　　0.0290 0.7553 0.4036 0.5156

　　0.7309 -0.1085 -0.4684 0.4844

　　latent =

　　517.7969

　　67.4964

　　12.4054

　　0.2372

　　tsquare =

　　5.6803

　　3.0758

　　6.0002

　　2.6198

　　3.3681

　　0.5668

　　3.4818

　　3.9794

　　2.6086

　　7.4818

　　4.1830

　　2.2327

　　2.7216

　　%下面我们来做一个验证

　　%下面为计算ingredients协方差矩阵：

　　cov_ingredients=cov(ingredients)

　　cov_ingredients =

　　34.6026 20.9231 -31.0513 -24.1667

　　20.9231 242.1410 -13.8782 -253.4167

　　-31.0513 -13.8782 41.0256 3.1667

　　-24.1667 -253.4167 3.1667 280.1667

　　%下面为计算ingredients所对应的协方差矩阵(也就是cov_ingredients矩阵)的特征值和特征

　　%向量，下面的矩阵V为特征向量，D为特征值(对比上面的latent)组成的对角线矩阵

　　[V,D] = eig(cov_ingredients)

　　V =

　　0.5062 0.5673 0.6460 -0.0678

　　0.4933 -0.5440 0.0200 -0.6785

　　0.5156 0.4036 -0.7553 0.0290

　　0.4844 -0.4684 0.1085 0.7309

　　D =

　　0.2372 0 0 0

　　0 12.4054 0 0

　　0 0 67.4964 0

　　0 0 0 517.7969

　　% 说明1 ：对比一下矩阵V和矩阵pc，现在很容易明白为什么COEFF是按列递减顺序排列的

　　% 了！(V中第三列与pc中倒数第三列差个负号，学过线性代数的人都知道这没问题)

　　%下面再验证一下说明2

　　diag(cov(score))

　　ans =

　　517.7969

　　67.4964

　　12.4054

　　0.2372

　　% 说明2 ：以上结果显示latent确实表示SCORE矩阵每列的方差，517.7969表示第一列方差

　　下面做图表示结果：

　　上面说了半天还没有达到我们终极想要的，其实我们要的是由函数[pc,score,latent,tsquare] = princomp(ingredients)它所产生的pc和latent。由latent可以算出降维后的空间所能表示原空间的程度，只要这个累积的值大于95%就行了。

　　The following command and plot show that two components account for 98% of the variance:

　　cumsum(latent)./sum(latent)

　　ans =

　　0.86597

　　0.97886

　　0.9996

　　%由以上ans值可以看出前两个主成分就能表示原空间的97.886%,所以取pc中的前两列可

　　%做主成分变换矩阵tranMatrix = pc(:,1:2)。则从原来的4维空间降到2维空间。对任意一个

　　%原空间样本,例如a=(7 ,26 ,6 ,60)变到低维空间的表达式为a1 = a*tranMatrix。(当然你也可

　　%以取pc中的前三列，由原来的4维空间变到3维空间)

　　biplot(pc(:,1:2),'Scores',score(:,1:2),'VarLabels',...

　　{'X1' 'X2' 'X3' 'X4'})

上面这个matlab函数的说明呢，只是引用百度百科，也可以看看matlab的函数说明，但是多少还是有点难懂。

我把我的理解简单的说说。

[COEFF, SCORE, LATENT, TSQUARED] = PRINCOMP(X)

上面这个函数，coeff矩阵是返回的转换矩阵，也就是把样本转换到新的空间中的准换矩阵，这个准换矩阵式比较大的，比如你的降维矩阵式30*100000，那么这个准换矩阵一般都是10000*29的维数。

score是原来的样本矩阵在新的坐标系中的表示，也就是原来的样本乘上转换矩阵，但是还不是直接乘，要减去一个样本的均值。将原来的数据转换到新的样本空间中的算法是这样实现的：

x0 = bsxfun(@minus,x,mean(x,1));

score = x0 * coeff;

然后就会得到和[COEFF, SCORE, LATENT, TSQUARED] = PRINCOMP(X) 输出一样的score数据。同时这个也是原来的样本矩阵降维后的结果，如果使用降维后的数据就使用这个数据。一般情况下，如果你的每个样本的特征维数远远大于样本数，比如30*1000000的维数,princomp要加上'econ', 就是princomp(x,'econ')这样使用，可以很大程度的加快计算速度，而且不会内存溢出，否则会经常报内存溢出。

[...] = PRINCOMP(X,'econ') returns only the elements of LATENT that are
not necessarily zero, i.e., when N <= P, only the first N-1, and the
corresponding columns of COEFF and SCORE. This can be significantly
faster when P >> N.

latent是返回的按降序排列的特征值，根据这个你可以手动的选择降维以后的数据要选择前多少列。

cumsum(latent)./sum(latent)

，通过这样计算特征值的累计贡献率，一般来说都选择前95%的特征值对应的特征向量，还是原来的矩阵30*1000000，如果你计算得到前25个特征值的累计贡献率已经超过99.9%，那么就完全可以只要降维后的数据的前25列。

tsquared是个什么东西我也不知道。。。不过貌似很少有人能用到，网络上也没有神马资料，各位如果需要用的再查阅吧，一般情况下也用不到。

如果你需要对测试样本降维，一般情况下，使用matlab自带的方式，肯定需要对测试样本减去一个训练样本均值，因为你在给训练样本降维的时候减去了均值，所以测试样本也要减去均值，然后乘以coeff这个矩阵，就获得了测试样本降维后的数据。比如说你的测试样本是1*1000000，那么乘上一个1000000*29的降维矩阵，就获得了1*29的降维后的测试样本的降维数据。

princomp(x)使用的行表示一个样本，每行的所有的列数据都是这个样本的特征值。降维以后比如是30*29，那么每一行就是降维以后的数据。每个样本有29个特征值。

2. 一个自实现的pca降维方式

下面是来自mpb同学的一个自实现的例子，很牛的一个人，我们本科同学。

原文地址：http://blog.csdn.net/mpbchina/article/details/7384425

下面引用原文内容：

 
     %训练  
 %Lx=X'*X  
 clear;  
 clc;  
 train_path='..\Data\TrainingSet\';  
 phi=zeros(64*64,20);  
 for i=1:20  
 path=strcat(train_path,num2str(i),'.bmp');  
 Image=imread(path);  
 Image=imresize(Image,[64,64]);  
 phi(:,i)=double(reshape(Image,1,[])');  
 end;  
 %mean  
 mean_phi=mean(phi,2);  
 mean_face=reshape(mean_phi,64,64);  
 Image_mean=mat2gray(mean_face);  
 imwrite(Image_mean,'meanface.bmp','bmp');  
 %demean  
 for i=1:19  
 X(:,i)=phi(:,i)-mean_phi;  
 end  
 Lx=X'*X;  
 tic;  
 [eigenvector,eigenvalue]=eigs(Lx,19);  
 toc;  
 %normalization  
 for i=1:19  
 %K-L变换  
 UL(:,i)=X*eigenvector(:,i)/sqrt(eigenvalue(i,i));  
 end  
 %display Eigenface  
 for i=1:19  
 Eigenface=reshape(UL(:,i),[64,64]);  
 figure(i);  
 imshow(mat2gray(Eigenface));  
 end  
 
   

得到的均值图像mean_face：

前19个最大主元对应的“特征脸”：

测试：
测试用样本：

[plain]  view plain copy 
       
      
 
      
 %使用测试样本进行测试  
 clc;  
 test_path='..\Data\TestingSet\';  
 error=zeros([1,4]);  
 for i=1:4  
 path=strcat(test_path,num2str(i),'.bmp');  
 Image=imread(path);  
 Image=double(imresize(Image,[64,64]));  
 phi_test=zeros(64*64,1);  
 phi_test(:,1)=double(reshape(Image,1,[])');  
 X_test=phi_test-mean_phi;  
 Y_test=UL'*X_test;  
 X_test_re=UL*Y_test;  
 Face_re=X_test_re+mean_phi;  
 calculate error rate  
 e=Face_re-phi_test;  
   
   
 %%display figure  
 Face_re_2=reshape(Face_re(:,1),[64,64]);  
 figure(i);  
   
 imshow(mat2gray(Image));  
 title('Original');  
 figure(10+i);  
 imshow(mat2gray(Face_re_2));  
 title('Reconstruct');  
 error(1,i)=norm(e);  
   
 %dispaly error rate  
 error_rate=error(1,i);  
 display(error_rate);  
 end  

重建出的测试样本与原样本的对比：

四副测试样本的重建误差分别为：
1.4195e+003
1.9564e+003
4.7337e+003
7.0103e+003

可见测试样本为人脸的样本的重建误差显然小于非人脸的重建误差。

上面的降维的例子中，每一列表示一个样本，这样就一共有4096*20的待降维矩阵，然后对这个矩阵降维，请注意，如果采用列表示一个样本，那么获得的降维矩阵，是一个4096*19的矩阵，然后用这个降维矩阵对测试样本和训练样本降维，我们的测试样本是4096*1的矩阵，降维的时候这样：

Y_test=UL'*X_test;

UL是计算获得降维矩阵，UL' （对UL进行转至）获得的19*4096的矩阵，19*4096 * 4096*1，就获得了19*1的降维后的数据。

如果是使用matlab自带的princomp进行降维，那么得到的coeff就是降维矩阵，使用测试样本,这里的训练样本和测试样本都要转换成行向量，每一行表示一个样本，测试样本是1*4096，降维矩阵是 4096*29，那么就是用待降维的样本 x乘上降维矩阵， x * coeff ,注意这两种不同的样本表示方法中降维的使用，降维矩阵的不同位置。这样降维后获得1*4096 * 4096*29 = 1*29 的降维后的数据。

通过上面的自己实现的pca降维的代码，还可以对降维后的数据进行重建，获得重建后的图像，上面的程序中已经给出了。下面给出一个通过princomp降维后再对降维后的数据进行重建的程序。

通过 princomp降维后的数据进行重建

[csharp]  view plain copy 
       
      
 clear;  
 clc;  
 train_path='E:\TrainingSet\angry\positive\';  
 images = dir('E:\TrainingSet\angry\positive\*.bmp');   
 phi=zeros(30,64*64);  
   
 % 加载样本图像到 30*(64*64)的矩阵中，每一行代表一幅图像  
 for i=1:30  
     path=strcat(train_path,images(i).name);  
     Image=imread(path);  
     Image=imresize(Image,[64,64]);  
     phi(i,:)=double(reshape(Image,1,[]));  
 end;  
   
 % 计算平均脸，并保存用以查看  
 mean_phi=mean(phi,1);  
 mean_face=reshape(mean_phi,64,64);  
 Image_mean=mat2gray(mean_face);  
 imwrite(Image_mean,'meanface2.bmp','bmp');  
   
 % 使用matlab自带的pca进行降维  
 [coeff, score, latent, TSQUARED] = princomp(phi,'econ');  
   
 %display Eigenface  
 for i=1:29  
     Eigenface=reshape(coeff(:,i),[64,64]);  
     figure(i);  
     imshow(mat2gray(Eigenface));  
 end  
   
 % 进行测试  
 %使用测试样本进行测试  
 clc;  
 test_path='E:\BIT\code\FER\meanface.bmp';  
 error=zeros([1,4]);  
   
 Image=imread(test_path);  
 Image=double(imresize(Image,[64,64]));  
 phi_test=zeros(1,64*64);  
 phi_test(1,:)=double(reshape(Image,1,[])); % 读入的测试图像保存为一行，行向量  
 X_test=phi_test-mean_phi; % 检测训练样本的平均脸  
 Y_test=X_test*coeff;  % 进行降维<span style="background-color: rgb(248, 248, 248);"></span>  

[csharp]  view plain copy 
       
      
 X_test_re=Y_test*coeff'; % 重构  
 Face_re=X_test_re+mean_phi;  
 %calculate error rate  
 e=Face_re-phi_test;  
   
 %%display figure  
 Face_re_2=reshape(Face_re(1,:),[64,64]);  
 figure(i);  
   
 imshow(mat2gray(Image));  
 title('Original');  
 figure(10+i);  
 imshow(mat2gray(Face_re_2));  
 title('Reconstruct');  
 error(1,i)=norm(e);  
   
 %dispaly error rate  
 error_rate=error(1,i);  
 display(error_rate);  

上面的程序关键处都有注释，应该挺好理解的。

关于网络上的一些解释个人理解（仅供大家参考理解）

1.

原文地址：http://www.cnblogs.com/sunwufan/archive/2011/08/31/2159952.html

原文：

最近看了些主成分分析，混迹Matlab论坛，翻了n多帖子，对princomp函数有了些了解。

在此只讲一些个人理解，并没有用术语，只求通俗。

贡献率：每一维数据对于区分整个数据的贡献，贡献率最大的显然是主成分，第二大的是次主成分......

[coef,score,latent,t2] = princomp(x);（个人观点）：

x：为要输入的n维原始数据。带入这个matlab自带函数，将会生成新的n维加工后的数据（即score）。此数据与之前的n维原始数据一一对应。

score：生成的n维加工后的数据存在score里。它是对原始数据进行的分析，进而在新的坐标系下获得的数据。他将这n维数据按贡献率由大到小排列。（即在改变坐标系的情况下，又对n维数据排序）

latent：是一维列向量，每一个数据是对应score里相应维的贡献率，因为数据有n维所以列向量有n个数据。由大到小排列（因为score也是按贡献率由大到小排列）。

coef：是系数矩阵。通过cofe可以知道x是怎样转换成score的。

则模型为从原始数据出发：
score= bsxfun(@minus,x,mean(x,1))*coef;(作用：可以把测试数据通过此方法转变为新的坐标系)
逆变换：
x= bsxfun(@plus,score*inv(coef),mean(x,1))

例子：

View Code

%%
%清屏
clear
%%
%初始化数据
a=[-14.8271317103068,-3.00108550936016,1.52090778549498,3.95534842970601;-16.2288612441648,-2.80187433749996,-0.410815700402130,1.47546694457079;-15.1242838039605,-2.59871263957451,-0.359965674446737,1.34583763509479;-15.7031424565913,-2.53005662064257,0.255003254103276,-0.179334985754377;-17.7892158910100,-3.32842422986555,0.255791146332054,1.65118282449042;-17.8126324036279,-4.09719527953407,-0.879821957489877,-0.196675865428539;-14.9958877514765,-3.90753364293621,-0.418298866141441,-0.278063876667954;-15.5246706309866,-2.08905845264568,-1.16425848541704,-1.16976057326753;];
x=a;
%%
%调用princomp函数
[coef,score,latent,t2] = princomp(x);
score
%测试score是否和score_test一样
score_test=bsxfun(@minus,x,mean(x,1))*coef;
score_test

latent=100*latent/sum(latent)%将latent总和统一为100，便于观察贡献率
pareto(latent);%调用matla画图

上图是通过自带函数绘制，当贡献率累加至95%，以后的维数会不在显示，最多只显示10维。

下面用自己编写的表示：

之前的错误认识：

1.认为主成分分析中latent显示的贡献值是原始数据的，其实是加工后的数据的。解释:对原始数据既然选择PCA方法，那么计算机认为原始数据每维之间可能存在关联，你想去掉关联、降低维数。所以采用这种方法的。所以计算机并不关心原始数据的贡献值，因为你不会去用了，用的是加工后的数据（这也是为什么当把输入数据每一维的顺序改变后，score、latent不受影响的原因）。

2.认为PCA分析后自动降维，不对。PCA后会有贡献值，是输入者根据自己想要的贡献值进行维数的改变，进而生成数据。（一般大家会取贡献值在85%以上，要求高一点95%）。

3.PCA分析，只根据输入数据的特征进行主成分分析，与输出有多少类型，每个数据对应哪个类型无关。如果样本已经分好类型，那PCA后势必对结果的准确性有一定影响，我认为对于此类数据的PCA，就是在降维与准确性间找一个平衡点的问题，让数据即不会维数多而使运算复杂，又有较高的分辨率。

我的个人见解：这篇文章中的解释挺靠谱的，可以用来参考。第二点其实matlab的输出结果score这个数据已经是降维后的数据，不过大家可以根据自己的需要取前多少列的数据。

2。

原文地址：http://www.ilovematlab.cn/thread-54600-1-1.html

部分原文：

回复 8# 5342245 的帖子设原始数据为X，先不做任何预处理。
[coef,score,latent,t2] = princomp(X);
则那些参数的底层算法大体过程如下：
x0 = bsxfun(@minus,X,mean(X,1)); %x0为将X去均值后的数据。
[coef,ignore] = eig(x0'*x0); 这就是coef的由来。【当然最终的还有排序什么乱七八糟的。。】
scroe = x0*coef % 这就是score的由来，就是一个简单的线性变换，将原来的X的坐标转换到主成分空间中的坐标。仅此而已

则模型为从原始数据出发：
score = bsxfun(@minus,X,mean(X,1))*coef;

逆变换：
X = bsxfun(@plus,score*inv(coef),mean(X,1))

以上这些你可以自己验证，看是否正确。
关于你的第三问。对于每一个主成分，就看coef的相应的列就能知道原始的变量那个对该主成分贡献大了啊。。

上面是没有预处理的。如果加了可逆的预处理。则原始数据亦可从预处理后的数据表示出。进而 bla bla....
===============这回够通俗易懂吧。。O(∩_∩)O
PS：pca算法流程，你熟悉吗？只要知道那个算法过程。这些都不难理解啊。。
建议您看看书把pca算法流程再过一遍。。否则别人再怎么说也没用。。。

我的个人见解：

这里我想说的是，再对测试样本进行降维的时候，一定要减去训练样本的均值，使用训练样本得到的转换矩阵，保证训练样本和测试样本转换到相同的样本空间中，这样才有意思。大家有时间可以去看看英文的资料，说的都比较详细。再用测试样本减去均值以后，就可以进行转换了。

很多同学可能在开始的时候和我一样，都是不知道如果对测试样本进行降维，很多人就选择了还是使用princomp这个函数处理测试样本，那么这样测试样本被映射到一个新的空间中，和原来的训练样本完全不是在一个空间，一点意义都没有，还是要使用测试样本减去均值，然后乘上训练样本降维的时候获得降维矩阵，转换到相同的空间中。

基本的对pca的认识就都说完了，比较乱，没有条理，不过如果认真看下来的话，应该还是可以理解的。目前网上没有关于pca的综合的介绍个注意事项，说以我就把我的经验和大家分享一下，还望文明转载，转载声明出处。我也没有对pca进行详细的学习，肯定有不正确的地方，还请大家多多指教，共同探讨。

你可能感兴趣的:(PCA降维算法总结以及matlab实现PCA(个人的一点理解))

前端React和Vue框架的区别
React和Vue作为前端Web开发的两大主流框架，虽然都用于构建用户界面，但在设计理念、语法风格、生态系统等方面存在显著差异。以下从多个维度对比两者的核心区别，帮助你在技术选型时做出更合适的决策。一、设计理念与架构1.数据流控制React：强制单向数据流（One-WayDataFlow），状态变化只能通过父组件→子组件传递，如需反向通信（如子组件修改父组件状态），需通过回调函数实现。复杂应用中需
nnv开源神经网络验证软件工具
一、软件介绍文末提供程序和源码下载用于神经网络验证的Matlab工具箱，该工具箱实现了可访问性方法，用于分析自主信息物理系统（CPS）领域中带有神经网络控制器的神经网络和控制系统。二、相关工具和软件该工具箱利用神经网络模型转换工具（nnmt）和闭环系统分析、混合系统模型转换和转换工具（HyST）以及CONTINUOUSReachabilityAnalyzer（CORA）三、无需安装即可执行NNV可
嵌入式通信协议框架的四层架构设计与实现比特冬哥嵌入式领域开发嵌入式通信协议分层框架
文章目录一、硬件抽象层：数据收发的基石1.1设计要点1.2代码示例二、协议管理层：智能路由中枢2.1设计要点2.2代码示例三、协议处理层：协议具体实现3.1设计要求3.2代码示例3.2.1协议公共定义3.2.2协议一设计3.2.3协议二设计四、应用层：业务逻辑实现4.1设计要点4.2代码示例4.2.1协议一处理4.2.2协议二处理五、四层协作流程5.1收发流程5.2代码示例总结在嵌入式系统开发中，
微服务：从“大锅菜“到“自助餐“的架构进化 MarkSea. 架构微服务云原生
在软件开发的世界里，架构就像是烹饪艺术。传统的单体应用就像一锅东北大锅菜，所有食材（功能）混在一起熬煮，香是香，但想单独调整某种食材的味道？对不起，得掀翻整锅重来。而微服务架构则像现代化的自助餐厅，每道菜（服务）独立存在，想吃什么拿什么，想调整哪道菜只需要处理那一小部分，其他客人（用户）还能继续享用其他美食。什么是微服务？——火锅店里的"自助小料台"理论将应用拆成多个独立小服务，通过轻量级API（
演练纪实丨同创永益同天支持三家银行灾备切换演练圆满完成数字韧性前端
2025年6月22日，同创永益单日同时支持河南农商联合银行、苏州农商银行、昆山农商银行组织开展2025年灾备切换演练圆满完成。其中共涉及44套关键业务系统，700余个节点，成功率100%，且全部满足恢复指标要求。同创永益于同日成功支持三家银行完成灾备切换演练，充分彰显了企业卓越的交付能力与技术底蕴。此次演练中，最显著的突破在于支持某行银行灾备切换演练时，将灾备技术切换的时间从原本的5分钟压缩至1分
【ES6新特性】解构赋值常见用法小钟H呀 ES6新特性学习手册 es6 前端 javascript
ES6解构赋值用法详解一、解构赋值基础概念解构赋值（DestructuringAssignment）是ES6新增的语法，可以快速从数组或对象中提取值并赋给变量。1.1传统取值方式vs解构赋值//传统方式constarr=[1,2,3];consta=arr[0];constb=arr[1];//解构赋值const[x,y]=[1,2,3];console.log(x);//1console.log
Unity团结引擎实战：鸿蒙游戏开发全指南编号:0517 鸿蒙 harmonyos5.0 unity 华为鸿蒙
鸿蒙游戏开发实战：Unity团结引擎适配指南与代码示例文/技术探索随着鸿蒙生态的快速扩张，Unity游戏向鸿蒙OS（OpenHarmony）的迁移已成为开发者新需求。本文将基于Unity团结引擎（专为鸿蒙定制的Unity分支），详解适配流程并提供可运行的代码示例。一、团结引擎：鸿蒙原生适配的核心工具Unity中国推出的团结引擎（基于Unity2022LTS定制）是当前唯一官方支持的鸿蒙适配方案，其
继 Evo 2 之后，Arc Institute 发布首个虚拟细胞模型 STATE，训练数据涉及 70 种不同细胞系 hyperai
众所周知，人体由不同类型的细胞组成——免疫细胞在感染发生时可引发炎症反应以抵御病原体；干细胞具有分化潜能，可生成多种组织类型；而癌细胞则通过逃避生长调控信号，实现异常增殖。尽管这些细胞在功能和形态上差异巨大，但它们几乎都拥有相同的基因组。细胞的独特性并非来自DNA序列本身的差异，而是源于它们如何调控和使用相同的基因信息。换言之，细胞的特性源于基因表达的差异，而一个细胞的基因表达模式不仅决定了它属于
SpreadJS 迷你图：数据趋势可视化的利器 spreadjs
引言在数据处理和分析领域，直观地展示数据趋势对于理解数据和做出决策至关重要。迷你图作为一种简洁而有效的数据可视化方式，在显示数据趋势方面发挥着重要作用，尤其在与他人共享数据时，能够快速传达关键信息。SpreadJS作为一款强大的电子表格组件，对迷你图功能提供了丰富的支持。本文将详细介绍SpreadJS迷你图的特点、优势、创建方式以及与GcExcel的兼容情况。迷你图的概述与作用迷你图是单个工作表单
数据库设计三范式详解与注意事项步行cgn 数据库数据库 oracle 服务器
数据库设计三范式详解与注意事项数据库设计三范式（NormalForms）是关系型数据库设计的核心理论，用于减少数据冗余、提高数据一致性和完整性。下面我将详细解释三范式的概念、应用场景和实际注意事项。一、三范式核心概念1.第一范式(1NF)：原子性定义：每个列都是不可再分的原子值每行有唯一标识（主键）示例：--不符合1NFCREATETABLEorders(order_idINTPRIMARYKEY
数据库 DML 语句详解：语法与注意事项步行cgn 数据库数据库 oracle
数据库DML语句详解：语法与注意事项DML（DataManipulationLanguage，数据操作语言）用于操作数据库中的数据，主要包括SELECT、INSERT、UPDATE、DELETE等语句。下面我将详细说明每种操作的语法、使用场景和关键注意事项。一、SELECT查询语句基本语法SELECT[DISTINCT]column1,column2,...FROMtable_name[WHERE
数据库级联操作详解：级联删除、更新与置空步行cgn 数据库数据库 oracle sql
数据库级联操作详解：级联删除、更新与置空在数据库设计中，级联操作（CASCADE）是管理关联数据的关键机制，它能自动处理主表与从表之间的数据一致性。下面详细介绍级联删除、更新和置空的语法、使用场景及注意事项。一、级联操作语法1.级联删除（ONDELETECASCADE）--创建表时定义CREATETABLEorders(order_idINTPRIMARYKEY,customer_idINT,FO
切换自定义键盘导致系统键盘收起，小窗模式组件不应该失焦，如何解决？ bug菌¹ 全栈Bug调优(实战版)harmonyos 切换自定义键盘小窗模式组件
本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你早日登顶，迈向财富自由的梦想！同时，欢迎大家关注、收藏、订阅本专栏，更多精彩内容正在持续更新中。让我们一起进步，Up！Up！Up！备注：部分问题/难题源自互联网，经过精心筛选和整理，结合数
【JS-6-ES6中的let和const】深入理解ES6中的let和const：块级作用域与变量声明的新范式 AllenBright #JS javascript es6 开发语言
在ES6(ECMAScript2015)之前，JavaScript中只有var一种变量声明方式，这导致了许多作用域相关的问题。ES6引入了let和const两种新的变量声明方式，彻底改变了JavaScript的作用域规则。本文将深入探讨let和const的特性、优势以及它们与var的区别。1.var的问题与ES6的解决方案1.1var的局限性在ES5及之前版本中，var声明存在几个主要问题：函数作
项目立项主要内容及实例小赖同学啊 test Technology Precious 项目管理
项目立项主要内容及实例项目立项主要内容项目基本信息项目名称：清晰明确地概括项目核心内容，让读者能快速了解项目大致方向。项目发起人：通常是提出项目想法或需求的个人、部门或组织，在项目中有一定决策权和影响力。项目负责人：即项目经理，全面负责项目的规划、执行、监控和收尾等工作。项目起止时间：明确项目开始和预计结束的时间节点，有助于合理安排资源和进度计划。项目背景与必要性背景阐述：分析项目所处的行业环境、
让你彻底了解 JavaScript 解构赋值前端贾公子前端基础 javascript 前端开发语言
JavaScript解构赋值详解1.解构赋值简介解构赋值（Destructuringassignment）是JavaScriptES6引入的一种语法特性，它使得我们可以从数组和对象中提取值，并以一种更便捷的方式赋值给变量。这种语法可以大大减少代码量，提高代码的可读性和维护性。1.1为什么使用解构赋值？代码更简洁，减少重复的赋值语句提高代码可读性，使变量的来源更清晰方便地处理嵌套数据结构在函数参数中
100W QPS 短链系统怎么设计 Java程序员拥抱ai 电商架构大数据
看上去业务简单，其实，覆盖的知识点非常多：高并发、高性能分布式IDRedisBloomFilter高并发、低内存损耗的过滤组件知识分库、分表海量数据存储多级缓存的知识HTTP传输知识二进制、十六进制、六十二进制知识总体来说，高并发、高性能系统的核心领域，都覆盖了。所以，分析下来，得到一个结论：是一个超级好的问题。1、短URL系统的背景短网址替代长URL，在互联网网上传播和引用。例如QQ微博的url
Entering emergency mode. Exit the shell to continue“journalctl‘to view system logs。【比较全的解决办法】
1.进入紧急模式并查看日志输入root密码在紧急模式提示符下，输入root用户的密码以获得访问权限（如果root密码已知）。查看系统日志运行以下命令查看启动日志，定位具体错误原因：journalctl-xb按↑/↓键滚动日志，或使用Ctrl+C退出。关注以下关键错误信息：Failedtomount/sysroot：根文件系统挂载失败。XFS(dm-0):：文件系统错误（如XFS损坏）。dracut
HarmonyOS开发实战指南：全局自定义弹窗-promptAction 不停留的码牛鸿蒙 HarmonyOS OpenHarmony 服务器前端华为 HarmonyOS harmonyos ui 鸿蒙
场景一：创建并显示全局自定义弹窗方案可以使用openCustomDialog接口，创建并弹出dialogContent对应的自定义弹窗，使用Promise异步回调。创建Params类方便开发者进行传参的，开发者可以在@Builder里自定义组件的内容，宽度跟随子节点自适应，圆角为0，弹窗背景色为透明色；letcontentNode=newComponentContent(uiContext,wra
前端基础知识JavaScript系列 - 25（Javascript本地存储）前端小白从0开始前端 javascript 开发语言
一、方式javaScript本地缓存的方法我们主要讲述以下四种：cookiesessionStoragelocalStorageindexedDBcookieCookie，类型为「小型文本文件」，指某些网站为了辨别用户身份而储存在用户本地终端上的数据。是为了解决HTTP无状态导致的问题作为一段一般不超过4KB的小型文本数据，它由一个名称（Name）、一个值（Value）和其它几个用于控制cooki
又来聊一下加班的问题阿赵3D 行业杂谈加班工作效率工作产出
大家好，我是阿赵。阿赵我重新上班已经有差不多2个星期了，和之前的生活发生了比较大的变化。首先，公司的地址比之前远了不少，每天在路上的通勤时间将会是差不多3个小时。然后由于路程远而且上下班高峰堵车，每个月的油费几乎翻倍了，之前2个星期加一次油，现在变成了1个星期就要加一次。看到这里，很多朋友就会嘲笑阿赵。之前的公司早上10点上班，晚上9点半下班，来回通勤一个小时，总共需要需要12.5
实时股票API接口的调用方法 (原创教程) kk_stoper python 开发语言 java javascript 数据结构
1.准备工作接口类型：实时综合行情接口支持品种：贵金属，商品期货，外汇，A股，港股，美股查询方式：HTTP,WebSocket申请密钥：https://infoway.io官方对接文档：https://infoway.readme.io/reference/ws-subscription2.获取股票清单这个接口用来查询股票的名单，比如我可以获取美股清单：importrequestsurl="htt
聊一下中老年程序员找工作的情况阿赵3D 行业杂谈中老年程序员找工作
大家好，我是阿赵。前几天发了个朋友圈，很多朋友惊讶于我这么快就又上班了，感觉阿赵我是不是找工作特别容易。实际情况并不如想象中简单，在之前短短2周时间内，我面试了十多间公司，也有不少朋友把我的简历内推了一些公司。首先我要感谢所有帮助过我和鼓励过我的朋友们，没想到阿赵我在朋友们心中的形象还算过得去，在需要帮助的时候，大家都纷纷伸出援手。不过这些内推，基本上都没有得到面试机会，原因各种各
HarmonyOS实战：打造极简HEventBus事件通知 IT小码哥丶 HarmonyOS harmonyos
前言事件通知在日常开发中十分重要，不同页面之间的事件通信都会用到事件通知，作为Android开发的小伙伴相信都用过EventBus，LiveDataEventBus等事件通信工具。鸿蒙开发中也同样需要一个页面之间通信等工具，本篇文章教你在鸿蒙开发中如何实现一个HEventBus，建议点赞收藏！需求分析全局只存在唯一实例。支持事件注册，反注册。支持一次发送，多处接收。技术实现单例实现在鸿蒙中使用创建
HarmonyOS实战：一招搞定保存图片到相册 IT小码哥丶 harmonyos 华为
前言保存图片功能几乎是每个应用程序必备的功能之一，当用户遇到喜欢的图片时可以保存到手机相册。那么在鸿蒙中保存图片是否也需要申请用户存储权限以及如何将图片保存到相册，本文将详细讲述怎么保存网络图片，指定布局生成图片保存至相册的功能实现。实现效果需求分析一般在Android或iOS上保存图片都需要申请应用存储权限，否则将禁止访问应用存储，不能保存图片到磁盘中。在鸿蒙系统中当然也有存储权限，但是鸿蒙系统
HarmonyOS实战：List拖拽位置交换的多种实现方式 IT小码哥丶 HarmonyOS list 数据结构 harmonyos android 华为
背景在最近日常工作中，遇到需要实现拖拽列表中的元素进行位置交换的需求。第一时间翻看了鸿蒙官方文档，发现官方只给Grid提供了Item交换位置的实现方式，然而List并没有提供，于是需要自己动手去实现。本篇文章详细介绍了两种不同的方式去实现List的位置交换。技术实现方式一使用列表的手势事件实现位置交换。先实现List的onItemDragStart方法。该方法表示拖拽列表元素时触发。.onItem
解构赋值 hohocj JavaScript 解构赋值 JS中解构赋值
这个语法在es6中很常见，不得不掌握啊什么是解构赋值，就是按照一定模式从数组和对象中提取值，然后又按照这个模式对变量进行赋值就是可以理解为，写个和这个对象或数组结构类似的自定义对象或数组，里面写上要用的变量（注意结构是一一对应的，所以值和变量），然后两个对象或数组通过=运算符连接即可。这样大大简化了代码量，提高了效率数组的解构赋值解构不成功，变量的值就会为undefined可以进行不完全解构，即等
一个 new 操作耗时1秒？用原型模式，性能提升100倍！ java干货 Spring boot 原型模式
你是否也曾深陷在对象创建的性能泥潭，当new一个对象的成本极其高昂（例如，需要复杂的数据库查询、网络IO或大量计算），导致你的SpringBoot应用响应缓慢，资源消耗巨大？是时候用原型设计模式(PrototypeDesignPattern)来解脱了！这是一种创建型设计模式，它允许你通过复制现有的实例来创建新的对象，而不是从头开始创建，从而大幅提升性能和灵活性。在SpringBoot中，这个模式的
借助职星学院企业培训系统，推动企业人才发展 github_staredu 大数据学习
在企业的发展进程中，人才是核心竞争力。如何培养和发展人才，成为企业面临的重要课题。职星学院企业培训系统为企业提供了一套全面、高效的人才培养解决方案，通过其强大的功能，推动企业人才的持续发展。职星学院的课程管理功能助力企业打造知识共享平台。企业可以将内部的优秀经验、技术知识等转化为课程资源，存储在系统中，实现知识的沉淀和传承。同时，企业还可以引入外部优质课程，拓宽员工的知识面和视野。课程的更新和维护
职星学院企业培训系统：引领线上培训新风尚
随着互联网技术的飞速发展和企业对员工培训需求的日益增长，线上培训系统逐渐成为企业提升员工能力、推动业务发展的重要工具。职星学院企业培训系统，作为一款集高效性、灵活性、个性化于一体的线上培训平台，正引领着线上培训的新风尚。一、系统概述职星学院企业培训系统是一个专为企业设计的在线教育平台，旨在满足企业对员工培训多样化、个性化的需求。系统支持跨平台访问，包括网页、移动端应用等，确保员工能够随时随地开展学
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分