机器学习简介及主要分类

机器学习

机器学习是一种能从数据中学习的算法。然而,所谓的“学习”如何理解?即机器学习的具体定义是什么?1997年,Mitchell给出了一个简洁的定义:

A computer program is said to LEARN from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with expericence E.
即:对于某类任务T和性能度量P,一个计算机程序被认为可以从经验E中学习是指,通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。


任务T有很多类型:分类、回归、翻译、异常检测、去噪、合成和采样等等。
性能度量P:评估学习算法的能力,通常度量模型的准确率或者错误率进行评估。
经验E:正是根据学习过程中的不同经验,可以将机器学习分为监督学习非监督学习、半监督学习、强化学习、弱监督学习等算法。

机器学习本质上属于统计学,更多关注如何用计算机统计地估计复杂函数,主要也有两种统计方法:频率派估计和贝叶斯推断。大部分机器学习可以分为监督学习和非监督学习。但是具体再细化可以还有其他类别学习方式。

机器学习中根据学习的方式不同可以主要可以细分为:

  • 监督学习(Supervised Learning)
  • 半监督学习(Semi-Supervised Learning)
  • 非监督学习(Unsupervised Learning)
  • 强化学习(Reinforcement Learning)
  • 弱监督学习(Weakly Supervised Learning)

监督学习

训练含有很多特征的数据集,不过数据集中的样本都有一个标签或者目标。
数据 ( x , y ) (x, y) (x,y)
x 为 样 本 数 据 , y 为 标 签 x为样本数据,y为标签 xy
目标:找到一个函数去映射: x → y x \rightarrow y xy
举例:classification、regression、object detection、semantic segmentation、image captioning, etc.


半监督学习

是将监督学习和非监督学习结合的一种学习方式。半监督学习训练中含有部分标记数据和未标记数据构成。
数据 ( x , y ) , x ~ (x,y), \tilde x (x,y),x~
x ~ \tilde x x~为没有标签的数据,(x,y)有标签的样本数据。
举例:Semi-Supervised Classification、regression、clustering、dimensionality reduction.
对比监督学习的优点:使得训练集的训练模型在训练时可以更加的准确,即使不知道答案也可以通过学习来知晓,有关可能的值的多少及特定值出现的频率。并且训练成本更低。


非监督学习

现实中因为缺乏先验知识,难以人工的标注类别或者人工的进行标注成本太高。自然的希望通过直接使用未知的训练样本解决模式识别中的各种学习。在训练含有很多特征的数据集,学习到数据集上有用的结构性质。
数据 x x x
仅仅是数据,没有标签。
目标:学习到数据中潜在的隐藏结构性质
举例:Clustering、dimensionality reduction(PCA, Autoencoder)、feature learning、density estimation,etc.


强化学习

强化学习是Agent在环境E中,状态空间为S。Agent可能采取的行为动作构成了动作空间A。若某个动作 a ∈ A a\in A aA作用在当前状态s上,则潜在的转移函数p将使得环境从当前状态转移到另一个状态,转移的同时环境会根据潜在的“奖赏”函数R反馈给机器一个奖赏,Agent就是根据奖赏对行为的评价进行学习,改进行为以适应环境。

机器学习简介及主要分类_第1张图片

简单来说:就是以“试错”的方式进行学习,强化学习主要是通过对行为的评价,只有好坏程度,而不告诉Agent如何产生正确的动作。主要通过自身的经历学习,在行为-评价环境中获得知识。


弱监督学习

弱监督学习的提出也是因为数据的标注成本过高,很多任务很难获得全部真值标签。弱监督是相对于强监督学习而言,主要指标签label的强弱区分。目前主要关注三种弱监督学习类型:

  • 不完全监督:只拥有极为少量的有标注数据情况,这些标注数据不足以训练出好的模型,但是拥有大量的未标注数据可使用。
  • 不确切监督:训练数据有标注label,但是标注的不够精确,仅仅只有粗粒度的标签信息可用。比如:在图像分割中有一只鸟,需要将鸟和背景分割分界在哪找出来;或者一幅图被标注了是水果,但是具体是一个苹果。从弱标签粗粒度去学习强标签细粒度。
  • 不准确监督:模型给出的标签不总是真值,有时候部分信息会被区分错误。实践上,需要从潜在的误分类样本中进行尝试性修改。

参考文献

《DEEP LEARNING 深度学习》
《机器学习》
A brief introduction to weakly supervised learning——周志华教授

你可能感兴趣的:(机器学习)