2019-11-01 机器学习的基础概念

一、机器学习的领域

1.概念介绍

机器学习领域两个大类,分别是监督学习和无监督学习。还有强化学习,半监督学习。

监督学习:

D计为数据,X表示为一个样本的特征,y表示为标签,在监督学习下,既有特征也有标签。

就是给定了X,能否得出y,学出X和y的映射关系(线性关系与非线性关系)。

一句话概括:给定数据,预测标签。 比如对动物猫和狗的图片进行预测,预测label为cat或者dog。

通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类。

线性关系-线性模型与非线性关系-非线性模型(神经网络、svm等)

无监督学习:

只有X,无y。X代表一堆图片。目的是寻找X的特征.

适用于营销行业。

一句话概括:给定数据,寻找隐藏的结构。 比如一个人没有见过恐龙和鲨鱼,如果给他看了大量的恐龙和鲨鱼,虽然他没有恐龙和鲨鱼的概念,但是他能够观察出每个物种的共性和两个物种间的区别的,并对这两种动物予以区分。

在现实生活中,大多数还是监督学习的。

Semi-Supervised learning半监督学习:

  使用的数据,一部分是标记过的,而大部分是没有标记的。和监督学习相比较,半监督学习的成本较低,但是又能达到较高的准确度。

训练时候:利用有标签的进行训练,然后把没有标签的一次次加入训练。

综合利用有类标的和没有类标的数据,来生成合适的分类函数。

半监督学习出现的背景:实际问题中,通常只有少量的有标记的数据,因为对数据进行标记的代价有时很高,比如在生物学中,对某种蛋白质的结构分析或者功能鉴定,可能会花上生物学家很多年的工作,而大量的未标记的数据却很容易得到。

Reinforcement learning强化学习

    强化学习,强化学习与半监督学习类似,也是使用未标记的数据,但是可以通过一些方法(算法学习)知道你是离正确答案越来越近还是越来越远(奖惩函数),我理解为激励与惩罚函数。可以把奖惩函数看作正确答案的一个延迟、稀疏的形式。可以得到一个延迟的反馈,并且只有提示你是离答案越来越近还是越来越远。类似生活中,女朋友不断调教直男友变成暖男。 简言之:通过不断激励与惩罚,达到最终目的。

实例:AlphaGo是强化学习最经典的代表作。

监督学习、无监督学习和强化学习的区别:
(1)监督学习有反馈,无监督学习无反馈,强化学习是执行多步之后才反馈。

(2)强化学习的目标与监督学习的目标不一样,即强化学习看重的是行为序列下的长期收益,而监督学习往往关注的是和标签或已知输出的误差。

(3)强化学习的奖惩概念是没有正确或错误之分的,而监督学习标签就是正确的,并且强化学习是一个学习+决策的过程,有和环境交互的能力(交互的结果以惩罚的形式返回),而监督学习不具备

2.监督学习与无监督学习的应用

工业界应用里主要还是以监督学习为主。在本次的课程里,我们也会花大量的篇幅来讲解各类机器学习算法

对于无监督算法来讲,它的实际场景主要还是以聚类分析为主,其中最经典的聚类算法叫做 K-means,也是一个极其简单的算法。 另外,聚类分析方法经常用在营销过程当中

监督学习 :

监督学习,拥有大量的例子,只要有标签,而且跟预测相关,都可以归类为监督学习。

监督学习的例子:

(1)人脸识别

(2)语音识别

(3)主题分类

(4)机器翻译

相当于各种语言之间的翻译。

(5)目标检测

检测出图片上的所有的物体,并标识出来(框选出来(候选框)、语义分割(纹理))

(6)金融风控

(7)情感分析

(8)自动驾驶

无监督学习:

无监督学习这种方法最大的特点是算法过程不依赖于数据的标签。 所以我们只能做一些分析性的工作,其中最经典的就是聚类的分析也就是把类似的物体聚集在一起

无监督学习的例子:

用户的分层-营销系统根据用户的兴趣爱好分为几类客户,然后进行设计营销方案。

聚类算法,经典的算法就是K-means算法。

监督学习:

线性回归-就是预测身高-回归

逻辑回归-解决分类问题-基于线性模型

朴素贝叶斯-适合于文本分类

决策树-有个条件

随机森林-使用多颗决策树来进行决策。相当于多个专家做决策然后进行整合

SVM-机器学习最难的算法

神经网络-深度学习

无监督学习:

PCA-降维(从高维降到低维)-降噪-去掉无用的信息-数据可视化

K-means-聚类方法-发现类似的点聚集为一类,一个物体只属于一个类别

GMN-一个物体可能属于多个类别

LDA-主题模型-抽取主题特征

例题:

第二个不是监督学习。并不是AI做决策,安检的例子里,机器只是让用户更清楚地看箱子里面的物品,但最终的决策者还是安检人员。

二、回归和分类

回归和分类是监督学习的两种学习任务。

回归:预测的是数值问题

分类:预测类别的问题,无关大小,预测的结果是离散的。给事物打上标签。

例题:


三、数据的特征,样本,以及标签

标签:给定了一批数据,我们需要识别哪一列或哪一些数据是预测值。

我们是想根据前4列的数据预测出最后一列(物种)

特征:前四列的数据叫做特征。描述一个物体的属性。

样本:样本就是一行。每一行就是一个样本。一共是10行。


四、训练集和测试集

在机器学习训练中还有一个概念叫作训练数据和测试数据。

训练数据用来训练模型,测试数据的作用是用来评估模型。

你可能感兴趣的:(2019-11-01 机器学习的基础概念)