机器学习的分类(监督学习、非监督学习、半监督学习)

机器学习大致可分为三类:监督学习、非监督学习、半监督学习,下面我们就来分别介绍。

监督学习

用数据挖掘领域著名学者韩家炜教授的话来说,所有的监督学习(Supervised Learning),基本上都是分类(Classification)的代名词。它从有标签的训练数据中学习模型,然后对某个给定的新数据利用模型预测它的标签。

这里的标签其实就是某个事物的分类。在某种程度上,你可以把它理解为作业的“标准答案”,而对于每次监督学习的输出,可理解为自己作答的答案。如果我们给出的答案和标准答案不一致,老师或家长就会监督我们来纠错,这样一来二去,我们对题目的理解就会更加深刻,在做新题时,正确率也会越来越高。

比如,小时候父母告诉我们某个动物是猫、狗或猪,然后在我们的大脑里就会形成或猫或狗或猪的印象(相当于模型构建),当面前来了一只“新”小狗时,如果你能叫出“这是一只小狗”,那么恭喜你,标签分类成功!

但如果你回答说“这是一头小猪”,这时你的父母就会纠正你的偏差:“乖,不对,这是一只小狗。”这样一来二去地进行训练,不断更新你大脑的认知体系,当下次再遇到这类新的猫、狗、猪时,你就会在很大概率上做出正确的“预测”分类。

监督学习的示意图如图 1 所示。

机器学习的分类(监督学习、非监督学习、半监督学习)_第1张图片

监督学习的示意图

图 1:监督学习的示意图

事实上&

你可能感兴趣的:(机器学习,分类,数据挖掘)