5.数据降维

Principal Component Analysis

输入

1. 样本集



2. 低维空间维数d

输出

投影矩阵

算法步骤

1. 中心化

2. 协方差矩阵以及特征分解

3. 投影矩阵
最大的d个特征值对应的特征向量.

d

***1. 通过交叉验证法选取较好的d(在降维后的学习器的性能比较好)

  1. 设置一个阈值***


你可能感兴趣的:(5.数据降维)