机器学习方法的分类

监督学习

给机器的训练数据拥有“标记”或者“答案”。
机器学习方法的分类_第1张图片
就比如上图的MNIST数据集,我们需要给出每一行所对应的数字,机器才能学习。
这里监督的意思就是我们人类给机器的信息已经进行了正确答案的划分。
例:银行已经积累了一定的客户信息和他们信用卡的信用情况。
监督学习主要处理的是分类和回归问题。
算法:k邻近,线性回归和多项式回归,逻辑回归,SVM,决策树和随机森林。在以后的文章中我们都会慢慢介绍。

非监督学习

给机器的训练数据没有“数据”或者“答案”。
比如下图:机器学习方法的分类_第2张图片
虽然他有横轴纵轴上的关系,但是他没有明确给出各个点属于的分类或者类别。
所以说非监督学习的意义是对没有“标记”的数据进行分类,我们也称这种方式叫做聚类分析。机器学习方法的分类_第3张图片
在我们生活中也有类似的情况,比如我们在电商平台购物时,没有明显的分类,但随着我们买的东西逐渐增多,机器就会给我们自己定“标签”,比如他注重性价比,他注重外观等等。
非监督学习还有一个重要的作用就是对数据进行降维处理
特征提取:信用卡的信用评级和人的胖瘦无关?当他无关时,我们就可以将他扔掉。
特征压缩:将一些具有相同特征的数据压缩。比如下图:机器学习方法的分类_第4张图片
图中的大部分点我们可以用那条红色的直线去代替,这样就会压缩掉大量数据。当我们面临高维的数据,特征压缩就将有非常大的作用,当然他有所对应的算法,就是PCA。

半监督学习

一部分数据有“标记”或者“答案”,另一部分没有。
更常见:各种原因产生的标记缺失。
就比如我们手机里的照片,一部分我们分类为在北京的照片,一部分分为在上海的照片,而其他照片却没有标签,如果我们想进行机器学习的话,这就是个半监督学习。
而我们处理这种情况通常都先使用无监督学生手段对数据做处理,之后使用监督学习手段做模型的训练和预测。

增强学习

根据周围环境的情况,采取行动,根据采取行动的结果,学习行动方式。
机器学习方法的分类_第5张图片
从上图来看,agent为机器,每次机器学习完后,然后反馈到环境,然后环境会做出相应改变,然后又传递给机器,就这样不停地循环,然后让机器学习不断增强。而无人驾驶和机器人大部分都是用的是增强学习。

你可能感兴趣的:(机器学习,机器学习)