机器学习100天(二十三):023 欠拟合与过拟合

机器学习100天,今天讲的是欠拟合与过拟合!

《机器学习100天》完整目录:目录

一、过拟合与欠拟合

机器学习中,我们构建一个模型,通常可能会遇到欠拟合或者过拟合的问题。以这张图为例,面对同样一批数据,我们建立了 3 个不同的回归模型。左边这张图是简单的一次线性模型,中间这张图是二次多项式模型,右边这张图是复杂的高阶多项式模型。

机器学习100天(二十三):023 欠拟合与过拟合_第1张图片

直观上可以看到,左边的线性模型对数据拟合的效果一般,这种情况称之为欠拟合。什么是欠拟合呢?欠拟合就是是指模型不能在训练集上获得足够低的误差。换句换说,就是模型复杂度低,没法学习到数据背后的规律。

再来看右边的高阶多项式模型,它对数据拟合的非常好,好的有点过了,这种情况称之为过拟合。什么是过拟合呢?过拟合是指训练误差和测试误差之间的差距太大。换句换说,就是模型复杂度高于实际问题,模型在训练集上表现很好,但在测试集上却表现很差,即泛化能力差。

中间的二次多项式模型虽然在训练集上有些误差,但是却反应了数据分布的整体趋势,可以说是最好最合适的模型。

二、为什么发生过拟合

知道了欠拟合和过拟合的概念之后,我们来看为什么会发生欠拟合和过拟合。欠拟合主要是由于模型过于简单,选取的特

你可能感兴趣的:(机器学习100天,人工智能,python,深度学习,算法)