《机器学习基石》1-The Learning Problem

Introdction

What is Machine Learning

  • 机器学习:计算机通过数据和计算获得一定技巧的过程。

  • 技巧:指的是在某些事情上表现更加出色,比如预测、识别等等。

Why using Machine Learning

  • 一些数据或者信息,人来无法获取,可能是一些人无法识别的事物,或是数据信息量特别大;

  • 人的处理满足不了需求,比如:定义很多很多的规则满足物体识别或者其他需求;在短时间内通过大量信息做出判断等等。

When to use Machine Learning

  • 存在一个模式或者说表现可以让我们对它进行改进提高;

  • 规则并不容易那么定义;

  • 需要有数据。

Components of Machine Learning

一个机器学习问题,主要由以下几部分构成:

  • 输入: xX x ∈ X
  • 输出: yY y ∈ Y
  • 目标函数: f:XY f : X → Y
  • 数据: D={(x1,y1),(x2,y2)(xN,yN),} D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) … ( x N , y N ) , }
  • 假设: g:XY g : X → Y

目标函数 f:XY f : X → Y 将输入 X X 映射为输出 Y Y ,我们手头有一组由 f f 生成的数据 D D ,目标就是通过对数据的学习,得到一个假设 g:XY g : X → Y ,使得 g g f f 尽量接近。

Learning Flow

以一个更加详细的流程图来说明这一过程:
《机器学习基石》1-The Learning Problem_第1张图片

目标函数 f:XY f : X → Y 将输入 X X 映射为输出 Y Y X X Y Y 在一起构成了数据 D D ,我们的目标就是通过对数据的学习,得到一个假设 g:XY g : X → Y ,使得 g g f f 尽量接近。为此,我们必须选定一个假设空间 H H ,然后使用算法 A A ,选择 H H 里的一个假设作为 g g

在这里有几个需要注意的地方:

  • 机器学习的输入在这个流程图中就变成了两个部分,一个是训练样本集,而另一个就是假设空间 H H
  • 我们所说的机器学习模型在这个流程图中也不仅仅是算法 A A ,而且还包含了假设空间 H H

上图还是一个相对比较简单的机器学习流程图,在往后的文章中会不断的根据新学的知识继续扩展这幅图的元素。

Machine Learning and Other Fields

  • ML VS DM
    两者密不可分:

    1. 两者是一致的
      能够找出的有用信息就是我们要求得的近似目标函数的假设。
    2. 两者是互助的
      能够找出的有用信息就能帮助我们找出近似的假设,反之也可行。
    3. 两者的区别
      传统的数据挖掘更关注与从大量的数据中的计算问题。
  • ML VS AI
    机器学习是实现人工智能的一种方式。

  • ML VS Statistic

    1. 统计是一种实现机器学习的方法。
    2. 传统的统计学习更关注与数学公式,而非计算本身。

你可能感兴趣的:(台大-机器学习)