线性回归-4-欠拟合、过拟合与局部加权线性回归

欠拟合、过拟合

在线性回归问题中,我们可以通过改变 θx线 看下面的图:
线性回归-4-欠拟合、过拟合与局部加权线性回归_第1张图片
左边的曲线是在假设 y=θ0+θ1x 时的拟合结果,但显然中间的曲线要比左边的拟合效果更好。我们称左边的情况为欠拟合(underfitting)。
这样看来右边的不是比左边更好吗?!。。。NO!我们称右边的情况为过拟合(overfitting)!因为它已经不能反应出样本的整体分布情况!

局部加权线性回归(LWR)

在之前的线性回归中,我们的流程是:
这里写图片描述
现在,在LWR中,与上面的不同之处只是在代价函数中加了个非负的权值 w(i)
这里写图片描述
w(i)θ...y(i)θTx(i)2iw(i)i
w
这里写图片描述
x|x(i)x|w(i)1|x(i)x|w(i)0
其实可以理解为:对于距离非常大的样本,我们更加倾向于将其当成噪声。
但是他有一个缺点:每次预测时都要重新计算预测样本与“参考样本”(训练样本)的距离,确定新的权重。因此当训练样本量很大时,该方法效率很低。
在上式中, τbandwidthτwτw
线性回归-4-欠拟合、过拟合与局部加权线性回归_第2张图片 线性回归-4-欠拟合、过拟合与局部加权线性回归_第3张图片

你可能感兴趣的:(线性回归-4-欠拟合、过拟合与局部加权线性回归)