机器学习三要素

机器学习=数据+模型+算法,而模型则是算法在数据上计算所得。


机器学习三要素_第1张图片
机器学习

数据大家应该都很耳熟,因为这几年大数据被炒得特别火。这里输入的数据必须是计算机可以识别的,任何计算机上的文件格式经过转化后理论上都能作为机器学习的输入数据。

算法就是指的我们平时说的线性回归、逻辑回归、朴素贝叶斯、决策树、随机森林、支持向量机、神经网络、深度学习等等算法。从本质上这些算法都是一些公式组成的,就比如最简单的一元线性回归方程y=ax+b就是线性回归最简单的形式。

在这个公式中,x、y分别是自变量和因变量,我们在训练模型时输入训练数据实际上就是输入的这些变量,然后通过计算将位置参数a、b计算出来,这样我们的模型就训练好了。

假如a=2,b=1,那么模型就是y=2x+1,利用这个模型我们就可以实现基本的预测功能了。现在有个点(5,y),你不知道y是多少,那么我就将x=5输入这个模型将y预测出来,结果是11。

现在你可能心里在想,这也太简单了吧。的确就是这么简单,因为我们讲的就是最简单的情况啊!但是也不用担心,纵使算法再复杂,基本原理都是相似的。

另外我们预测出来的11并不一定就是完全正确的值,因为模型并不能100%的预测准确。对于我们这个线性回归模型来说,一般情况下,模型预测的点都是在回归线两侧附件的。

至此,我们的机器学习三要素就介绍完了,希望通过这篇文章,能帮助大家建立对机器学习原理的初步印象。

你可能感兴趣的:(机器学习三要素)