(三)机器学习的基本任务

文章目录

    • 一、分类任务
      • 1. 二分类(Binary Classification)
      • 2. 多分类(Multi-class Classification)
    • 二、回归任务

  我们所关注的机器学习的基本任务主要有两类, 一类是分类,一类是回归

一、分类任务


  分类任务,其实在之前博客中所举的例子都是一个分类任务。比如图像识别,让机器识别一张图片是一只狗还是一只猫。分类任务即是将我们给定的数据进行分类。

  分类任务又具体分为了以下几种。

1. 二分类(Binary Classification)


  相对而言,二分类任务是比较简单的任务,相当于一种二选一的任务。虽然二分类任务看起来比较简单,其实在实际生活中,很多任务使用二分类任务就足够了。

  比如判断邮件是垃圾邮件还是不是垃圾邮件;判断发放给客户信用卡有风险还是没有风险;判断一个病患是良性肿瘤还是恶性肿瘤。,判断某支股票是涨还是跌等等,这些都是二分类的任务。

2. 多分类(Multi-class Classification)


  与二分类所对应的,就是多分类任务。换句话说,我们的机器算法不仅仅将结果锁定在两个选项中,而是多个中的一个。比如手写一个数字,就需要在10个数字中进行判断。
(三)机器学习的基本任务_第1张图片
  同样,多分类的问题在实际生活中也有广泛的应用。最典型的比如数字识别;图像识别;判断发放给客户信用卡的风险评级(A/B/C/D/E);

  可以想象一下,可能很多看似复杂的任务,都可以转换成一个分类任务。比如说,我们想做一个自动玩游戏的人工智能,这里我们用 2048 这个游戏为例。如果使用机器学习的方法经过训练之后,最终我们的机器要做到的就是给你现在的这个盘面的状态,机器只需要选择是要上移,左移,右移还是下移,在这四个选项中选择一个就好。那么我们就将这样的人工智能转化成一个多分类的任务。这就是我们所说的很多复杂的问题也可以转换成多分类的问题。
(三)机器学习的基本任务_第2张图片
  同样,对于一个更复杂的游戏也是如此。比如说,下围棋这个游戏。毕竟在棋盘上可以落子的地方是有限的,所以每一步机器要做的事情其实是根据现在的棋盘讯息选择一个地方进行落子,我们可以将它转化成一个分类任务。

  甚至,现在大红大紫的无人车这个领域,我们都可以将其转换成一个分类任务。在车的周围可能有各种传感器,包括摄像头来监视车身周围的一些情况,然后根据所获得的信息,我们要做的只是选择方向盘向左或向右打多少个角度,即时配合上油门和刹车,我们踩下的幅度的不同,那么,整个开车过程就在每一个时刻去选择方向盘,油门,刹车对这三个关键的部件进行控制得到的结果的一个组合,在这些组合中选择一个而已。所以,我们可以将其转换成一个多分类问题。

  但是需要注意的是,我们上面所说的是可以将这些问题转换成多分类任务,并不是说这个问题使用多分类就是最好的解决方案。

  在后面的学习中,我们会意识到一些算法只支持完成二分类任务,但是我们可以将多分类的任务转换成二分类的任务。

  其实分类任务除了划分成二分类和多分类。还可以分为多标签分类
(三)机器学习的基本任务_第3张图片

二、回归任务


  上面介绍的都是分类任务,与介绍的数据是对应的。其实还有一类数据是这个样子。下面的表格中是一个房产数据。
(三)机器学习的基本任务_第4张图片
  对于这个房产数据,它的特征有4个,分别是房屋的面积,房屋的年龄,卧室的数量,以及最近地铁站距离,与之相对应的标签是房屋的价格。与之前的数据不同的是,之前的数据的标签是一个分类,比如是猫还是狗,是垃圾邮件还是不是垃圾邮件,而这个数据是一个价格,不是一个类别,是一个具体的数值。这一类任务就是机器学习可以处理的另外一类任务,也就是回归任务

  回归任务的特点,就在于结果是一个连续数字的值,而非一个类别。比如房屋的价格,市场的分析,学生的成绩,股票的价格。但是有一些情况下,回归任务是可以简化成分类任务。

  对于一些算法来说,有一些算法只能解决回归问题,有一些算法只能解决分类问题。不过,还是有一些算法的思路既能解决回归问题,又能解决分类问题。

  我们再来回顾一下什么是机器学习?
(三)机器学习的基本任务_第5张图片
  大量的学习资料就是数据集。将这些数据集送给机器学习算法,机器学习算法将根据数据集训练出一个模型,而这个模型是我们进一步解决问题的核心,当有了新的样本资料后,通过这个模型来得出这个结果。而这篇博客主要讲的是这个模型的输出结果主要有两类,一类是具体的类别,对应的是分类问题,另一类是一个具体的数值,对应的是回归问题。那么我们再来看看什么叫做一个模型,事实上,我们可以将一个模型理解为一个函数 f(x),那么我们的机器学习算法得到的就是一个函数 f(x),每一个 x 就是一个小的样本资料,如果有了新的 x,那么我们就将 x 带入 f(x) 中,如果得到的是一个0,1,2这样的类别,那么这就是一个分类问题,如果得到的是一个具体的数值,那么相应的就是一个回归问题。

你可能感兴趣的:(机器学习)