使用主成分分析(PCA)进行特征降维

使用主成分分析降维

  • 主成分分析(PCA)
    • PCA的原理

主成分分析(PCA)

主成分分析(Principal Component Analysis)是一种无监督的降维算法。不同于线性判别分析(LDA),PCA不需要数据集中包含类别标签,其核心思想是将高维特征映射到新的空间后,按照新空间各个特征重要性有序选取坐标轴。新空间构建时,第一个坐标轴选取原始数据映射后方差最大的方向,后续坐标轴均保证与之前坐标轴正交的情况下方差最大,重复该过程直至新空间维度与原始特征数相等,或新空间维度数量达到降维需求。

从线性代数的角度来看,PCA实际上是对原始数据去除平均值后,求协方差矩阵,然后对其特征值进行排序,并根据这些特征值对应的特征向量构建新空间。

PCA的原理

你可能感兴趣的:(机器学习,PCA,主成分分析,降维,特征工程,LDA)