吴恩达机器学习课程13——降维

目录

  • 降维与数据压缩
  • 降维与可视化数据
  • 主成分分析法(PCA)
    • 什么是PCA
    • 数据预处理
    • 算法操作
  • 主成分数量选择
  • 压缩重现
  • PCA的应用
  • 如有不妥,还请不吝指正~


降维与数据压缩

  • 降维可以使数据规模减小,从而起到节约空间、加快算法执行等作用。数据压缩这个词我们还比较好理解,那降维是怎么一回事呢?它们两个是怎么扯上关系的呢?
  • 降维,其实就是一种削减特征数量的手段。为什么要削减特征数量呢?众所周知,特征少了不好,多了也不好,可能造成特征冗余,不但会占用多余的空间,更致命的是会大大影响算法性能。所谓特征冗余,讲的就是一些特征的相关度非常高,它们的数据特征非常相似,具有很高的相关性,这样的特征对于算法是没有增益的,反而会增大计算负担。举个栗子,假如有两个特征,分别表示某物体的厘米长度和某物体的英寸长度,很明显,这个两个特征本质上就是一个特征,数据特征完全相同,仅仅

你可能感兴趣的:(吴恩达机器学习课程,人工智能,机器学习,算法)