有监督学习、无监督学习、半监督学习和强化学习的总结

机器学习是数据分析和数据挖掘中一种比较常见且有效的方法,机器学习分为四大类,分别是有监督学习、无监督学习、半监督学习和强化学习。

1.有监督学习

概念:将包含特征和标签信息的样本作为训练样本,通过训练样本训练得到一个最优模型,再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现预测和分类的目的,也就具有了对未知数据进行预测和分类的能力。

常见算法:分类算法(KNN、朴素贝叶斯、SVM、决策树、随机森林、BP神经网络算法等)和回归算法(逻辑回归、线性回归等)。

应用场景:分类和回归的场景,如垃圾邮件分类、心脏病预测等。

2.无监督学习

概念:训练样本的标记信息未知,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是"聚类",聚类目的在于把相似的东西聚在一起,主要通过计算样本间距离和群体间距离得到。

常见算法:密度估计、异常检测、层次聚类、EM算法、K均值算法、DBSCAN算法等。

应用场景:聚类场景,如聚合新闻网站。

3.半监督学习

概念:有监督学习需要获取大量有标记的数据,是一种成本较高的学习方法,而无监督学习不依赖数据的标记,但是对解决分类和回归的问题有一些难度。所以通过对样本进行部分标记,再使用机器学习的算法,就是半监督学习。

常见算法:生成模型算法、自训练算法、联合训练、半监督支持向量机、基于图论的方法等。

应用场景:一些标记数据比较难获取的场景。

4.强化学习

概念:程序或智能体(agent)通过与环境不断地进行交互,学习一个从环境到动作的映射,学习的目标就是使累计回报最大化。

强化学习是一种试错学习,因其在各种状态(环境)下需要尽量尝试所有可以选择的动作,通过环境给出的反馈(即奖励)来判断动作的优劣,最终获得环境和最优动作的映射关系(即策略)。

常见算法:隐马尔科夫、蒙特卡罗。

应用场景:针对流程中需要不断推理的场景,如无人汽车驾驶、阿尔法狗下围棋等。

参考文献

[1]【机器学习笔记】有监督学习和无监督学习

[2]几种半监督学习算法

[3]Python机器学习应用之强化学习

[4]李博.机器学习实践应用[M].北京:人民邮电出版社,2017:16-18.

你可能感兴趣的:(机器学习,机器学习,算法)