分类和回归任务通俗讲解

我们可以按照任务的种类,将任务分为回归任务和分类任务.那这两者的区别是什么呢?按照较官⽅些的说法,输⼊变量与输出变量均为连续变量的预测问题是回归问题,输出变量为有限个离散变量的预测问题成为分类问题。

回归任务: 连续、输出为⼀个定值

分类任务: 不连续、输出为⼀个概率向量

回归: 通俗⼀点讲,我们要预测的结果是⼀个数,⽐如要通过⼀个⼈的饮⾷预测⼀个⼈的体重,体重的值可以有⽆限多个,有的⼈50kg,有的⼈51kg,在50和51之间也有⽆限多个数.这种预测结果是某⼀个确定数,⽽具体是哪个数有⽆限多种可能的问题,我们会训练出⼀个模型,传⼊参数后得到这个确定的数,这类问题我们称为回归问题.预测的这个变量(体重)因为有⽆限多种可能,在数轴上是连续的,所以我们称这种变量为连续变量。

分类: 我们要预测⼀个⼈⾝体健康或者不健康,预测会得癌症或者不会得癌症,预测他是水瓶座,天蝎座还是射⼿座,这种结果只有⼏个值或者多个值的问题,我们可以把每个值都当做⼀类,预测对象到底属于哪⼀类.这样的问题称为分类问题.如果⼀个分类问题的结果只有两个,⽐如"是"和"不是"两个结果,我们把结果为"是"的样例数据称为"正例",讲结果为"不是"的样例数据称为"负例",对应的,这种结果的变量称为离散型变量。

你可能感兴趣的:(模式识别与人工智能,机器学习,回归,数据挖掘,人工智能)