PCA数据降维、数据重建计算步骤

PCA计算步骤:输入N*M的矩阵 其中,N为样本数,M为特征数

  1. 一、计算N*M的特征均值 1*M,对原始数据去中心化 N*M - 1*M 得到去均值的数据 N*M
  2. 二、计算N*M矩阵的特征协方差矩阵 M*M
  3. 三、计算协方差矩阵的特征值 M*1 与特征向量 M*M
  4. 四、对特征值按从大到小排序,选择前D个特征值对应的特征向量组成主成分向量D*M
  5. 五、数据降维 用输入数据(N*M) 乘以 主成分(D*M).T 得到降维后的数据 N*D
  6. 六、数据复原 输入投影后的数据 1*D, 乘以主成分量 D*M 的到 1*M 的数据,再加上均值 1*M + 1*M 得到重建数据

你可能感兴趣的:(python,机器学习)