主成分分析(Principal Component Analysis )

重点

1 作用

2 算法过程



作用

1 Feature之间不是相互独立,存在相关性,造成特征冗余。增加计算量。PCA可以改善这一情况

2 高维度数据可视化



算法过程

步骤

有一个矩阵,维度(m,n),m个采样数据,每个数据有n个feature。

1 特征去均值,标准化(归一化)

    (1) 求或的特征值()和特征向量(),其中维度:

  (2) ,维度:

  (3)按照从大到小的顺序,取的对应的列。取前列得到矩阵,维度

            的取值标准是,要求将后,前个元素累加和comsum > 95%总和。

    (4) ,维度:

前个即主成分(主方向)。这样,就实现了从到维的降维。

注意!!!

必须对数据进行预处理,去均值化,标准化。


你可能感兴趣的:(主成分分析(Principal Component Analysis ))