【机器学习】西瓜书学习笔记01

基于周志华《机器学习》一书所作笔记,得益于参加datawhale的学习小组,将知识读薄理解,输出以感悟,读厚以加深理解,从而形成自己的框架。希望大家也能一起进行开源学习,进一寸有一寸的欢喜。

预备知识

首先来看看什么是人工智能,机器学习,深度学习

借用up主谢文睿的话(视频链接:【吃瓜教程】《机器学习公式详解》(南瓜书)与西瓜书公式推导直播合集_哔哩哔哩_bilibili)

可以大致分为:

  • 人工智能:让机器变得像人也一样智能的学科
  • 机器学习:让计算机像人一样从数据中得出规律的一种算法
  • 深度学习:神经网络类的机器学习算法

类别的大小可以这么划分:人工智能 > 机器学习 > 深度学习

是否也可以这么说,实现人工智能的方法有许多种,机器学习是其中一门,而深度学习也是机器学习中的一种,属于神经网络的方法。                                                  

下面就开始学习《机器学习》一书了。

第一章 绪论

1.1 引言

通过对西瓜属性判断好坏的生活例子,引出让机器来实现对经验的利用。

机器学习是研究从数据中产生“模型”的算法(学习算法)。

1.2 基本术语

  1. 数据集是记录的集合
  2. 实例(样本):记录包含了关于事件或对象的描述,如西瓜。
  3. 属性(特征):反映事件或对象在某个方面的表现或性质的事项,如“色泽”、“根蒂”、“敲声”。
  4. 属性值:属性上的取值,如“乌黑”、“青绿”。
  5. 属性空间(样本空间):属性张成的空间,想象一个三维空间,每个西瓜都可以在这个空间找到自己的坐标位置。
  1. 学习(训练):从数据中通过某个算法学得模型的过程
  2. 训练数据:训练过程中使用的数据
  3. 训练样本:训练数据中的样本
  4. 训练集:训练样本的集合
  5. 假设:学得模型对应了关于数据的潜在规律
  6. 真相(真实):潜在规律的本身 

学习的过程就是在逼近真相的过程

  1. 样例:拥有了标记信息的示例,也就是有标记是否为好瓜还是坏瓜;
  2.  标记空间(输出空间):“用(x_{i},y_{i})表示第i个样例,其中y_{i}\epsilony是示例x_{i}的标记,y是所有标记的集合
  3. 分类:预测的是离散值,如好瓜,坏瓜
  4. 回归:预测的是连续值,如西瓜的成熟度0.95,0.65
  5. 二分类:正类与反类
  6. 多分类:涉及多个类别

你可能感兴趣的:(机器学习,学习,人工智能)