【机器学习基础】 监督学习、非监督学习、半监督学习、弱监督学习概念

根据数据类型的不同,对一个问题的建模有不同的方式。依据不同的学习方式和输入数据, 机器学习主要分为以下四种学习方式。

监督学习:

1)监督学习是使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签,训练一个智能算法,将输入数据映射到标签的过程。

2)监督式学习的常见应用场景如分类问题和回归问题。

3)常见算法有逻辑回归(LogisticRegression)和反向传递神经网络(BackPropagationNeural Network)

非监督式学习:

1)在非监督式学习中,数据并不被特别标识,适用于你具有数据集但无标签的情况。学 习模型是为了推断出数据的一些内在结构。

2)常见的应用场景包括关联规则的学习以及聚类等。

3)常见算法包括 Apriori 算法以及 k-Means 算法。

半监督式学习:

1)在此学习方式下,输入数据部分被标记,部分没有被标记,这种学习模型可以用来进 行预测。

2)应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,通过对已标 记数据建模,在此基础上,对未标记数据进行预测。

3)常见算法如图论推理算法(GraphInference)或者拉普拉斯支持向量机(LaplacianSVM) 等。

弱监督学习 :

1)弱监督学习可以看做是有多个标记的数据集合,次集合可以是空集,单个元素,或包 含多种情况(没有标记,有一个标记,和有多个标记)的多个元素。

2)数据集的标签是不可靠的,这里的不可靠可以是标记不正确,多种标记,标记不充分, 局部标记等。

3)已知数据和其一一对应的弱标签,训练一个智能算法,将输入数据映射到一组更强的 标签的过程。标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,分类 的标签就是弱标签。

4)举例,告诉一张包含气球的图片,需要得出气球在图片中的位置及气球和背景的分割 线,这就是已知弱标签学习强标签的问题。

在企业数据应用的场景下, 人们最常用的可能就是监督式学习和非监督式学习的模型。 在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据, 目前半监督式学习 是一个很热的话题。

你可能感兴趣的:(【机器学习基础】 监督学习、非监督学习、半监督学习、弱监督学习概念)