1 Introduction and Motivation

1 什么是机器学习

机器学习:能从数据中自动提取有价值信息的算法设计。
三要素:数据、模型、学习。模型(model)描述了从一个数据集生成另一个数据集的过程。从数据中学习而得到模型,学习的过程就是不断调整模型参数的过程。(笔者:好的模型能应用于新的数据,称为泛化。)

1.1 正名

算法(algorithm):一指模型预测(predictors);二值模型训练(training)。
看待数据(data)的三个视角:

  1. 数组(计算机科学视角)
  2. 向量(物理视角)
  3. 遵循加法和缩放(scaling)规则的对象(代数视角)

本节小结

  1. 把数据看成向量。
  2. 从统计或优化的视角选择合适的模型。
  3. 学习就是基于已有数据使用优化方法使得模型能应用于新的数据。

1.2 本书的两种阅读方式

  1. 自底向上。优点基础扎,步步为营;缺点,缺少应用路径,容易忘记不感兴趣的点。
  2. 自顶向下。优点:问题导向,目标驱动,所学既所用;缺点:基础不牢,部分概念不清。
    本书组织方式:
  3. 第一部分。按自底向上组织数学基础。包括:
  • 线性代数(linear algebra)
  • 解析几何(analytic geometry)
  • 矩阵分解(matrix decomposition)
  • 矢量验算(vector calculus)
  • 统计理论(probability theory)
  • 最优化(optimization)
  1. 第二部分。分为四大类问题:
  • 回归(regression)
  • 降维(dimensionality reduction)
  • 密度估计(density estimation)
  • 分类(classification)。

两个部分之间可以方便导航。

你可能感兴趣的:(1 Introduction and Motivation)