西瓜书笔记Chapter1&2

序言

南瓜书(机器学习公式详解)作者谢文睿老师在南瓜书前言中如此写到:

“周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读 者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节。”

读到这里,大家可能会疑问为啥前面这段话加了引号,因为这只是我们最初的遐想,后来我们了解到,周老师之所以省去这些推导细节的真实原因是,他本尊认为“理工科数学基础扎实点的大二下学生应该对西瓜书 中的推导细节无困难吧,要点在书里都有了,略去的细节应能脑补或做练习”。所以… 本南瓜书只能算是我 等数学渣渣在自学的时候记下来的笔记,希望能够帮助大家都成为一名合格的“理工科数学基础扎实点的大二下学生”。

对于初学机器学习的小白,西瓜书第1章和第2章的公式强烈不建议深究,简单过一下即可,等你学得有点飘的时候再回来啃都来得及

这本西瓜书是机器学习领域的经典著作,然而要把它啃下来,首先需要坚持,然后需要方法。这次准备好好跟着Datawhale这套课程把这本书涉及的基础打下来。

1. 绪论

1.1 基本概念

  1. 机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。 在计算机系统中, “经验” 通常以 “数据” 形式存在, 因此, 机器学习所研究的主要内容, 是关于在计算机上从数据中产生 “模型” 的算法, 即 “学习算法” 。
  2. 有了学习算法, 我们把经验数据提供给它, 它就能基于这些数据产生模型; 在面对新的情况时, 模型会给我们提供相应的判断。此时,“模型”泛指从数据中学得的结果

1.2 基本术语

数据集(data set): 包含了多个对于对象的描述,其中每个对象称为一个示例(instance)或样本 (sample)。

反映对象某方面性质的事项,称为属性(attribute)或特征(feature),属性上的取值,称为属性值(attribute value)。

属性张成的空间称为属性空间(attribute space)、样本空间(sample space)、输入空间。空间中的每一个点,对应一个坐标向量,因此也可以把一个示例称为一个特征向量(feature vector)。

【这两天有点忙,剩下的笔记明天补上 - 5.17】

你可能感兴趣的:(机器学习,人工智能)