【机器学习基础】监督学习、非监督学习、半监督学习、弱监督学习概念

根据数据类型的不同，对一个问题的建模有不同的方式。依据不同的学习方式和输入数据，机器学习主要分为以下四种学习方式。

监督学习：

1）监督学习是使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签，训练一个智能算法，将输入数据映射到标签的过程。

2）监督式学习的常见应用场景如分类问题和回归问题。

3）常见算法有逻辑回归（LogisticRegression）和反向传递神经网络（BackPropagationNeural Network）

非监督式学习：

1）在非监督式学习中，数据并不被特别标识，适用于你具有数据集但无标签的情况。学习模型是为了推断出数据的一些内在结构。

2）常见的应用场景包括关联规则的学习以及聚类等。

3）常见算法包括 Apriori 算法以及 k-Means 算法。

半监督式学习：

1）在此学习方式下，输入数据部分被标记，部分没有被标记，这种学习模型可以用来进行预测。

2）应用场景包括分类和回归，算法包括一些对常用监督式学习算法的延伸，通过对已标记数据建模，在此基础上，对未标记数据进行预测。

3）常见算法如图论推理算法（GraphInference）或者拉普拉斯支持向量机（LaplacianSVM）等。

弱监督学习：

1）弱监督学习可以看做是有多个标记的数据集合，次集合可以是空集，单个元素，或包含多种情况（没有标记，有一个标记，和有多个标记）的多个元素。

2）数据集的标签是不可靠的，这里的不可靠可以是标记不正确，多种标记，标记不充分，局部标记等。

3）已知数据和其一一对应的弱标签，训练一个智能算法，将输入数据映射到一组更强的标签的过程。标签的强弱指的是标签蕴含的信息量的多少，比如相对于分割的标签来说，分类的标签就是弱标签。

4）举例，告诉一张包含气球的图片，需要得出气球在图片中的位置及气球和背景的分割线，这就是已知弱标签学习强标签的问题。

在企业数据应用的场景下，人们最常用的可能就是监督式学习和非监督式学习的模型。在图像识别等领域，由于存在大量的非标识的数据和少量的可标识数据，目前半监督式学习是一个很热的话题。

【机器学习基础】 监督学习、非监督学习、半监督学习、弱监督学习概念