PCA简单理解

主成分分析PCA

对一个事物的描述往往需要对多个变量进行观测。但这些变量之间又往往存在相关性。为了减少数据描述的负担,同时尽可能全面地描述数据,引入PCA来对数据进行降维。

原来是n维的特征,经过坐标变换之后,可认为是k维的特征,期间允许一些噪声的出现,也就是如果向量距离某轴的夹角过小,可认为是噪声导致的

PCA求解过程:

  1. 求各个特征的平均值,对所有样例减去对应特征的均值

  2. 求协方差矩阵(假如数据是3维),注意np自带cov操作

  3. 求协方差的特征值和特征向量

  4. 将特征值按照从大到小的顺序,选择其中最大的k个,然后将对应的K个特征向量分别作为列向量组成特征矩阵

  5. 减过均值后的矩阵维adj[n,n],提取过主成分后的特征矩阵为tz[n,k],两者相乘得到finalData[n,k],这就将数据变成了k维

你可能感兴趣的:(数学建模)