吴恩达机器学习 笔记九 PCA降维

1.数据降维

  数据降维的动力主要来自数据压缩和数据可视化。下图中的数据虽然是在一个三维空间里,但是用一个二维的平面基本上就是可以描述出来的,所以我们可以把数据降到二维。
吴恩达机器学习 笔记九 PCA降维_第1张图片

2.PCA算法

第一步是均值归一化。我们需要计算出所有特征的均值,然后令 。如果特征是在不同的数量级上,我们还需要将其除以标准差 。
第二步是计算协方差矩阵(covariance matrix):
第三步是计算协方差矩阵的特征向量(eigenvectors):
如果我们希望将数据从维降至维,我们只需要从中选取前个向量,获得一个维度的矩阵,我们用表示,然后通过如下计算获得要求的新特征向量:

下面这个链接有PCA详细的推导和证明:
https://antdlx.com/che-di-xue-hui-pca3-zui-jin-zhong-gou-xing-de-tui-dao/

你可能感兴趣的:(机器学习)