第二章.线性回归以及非线性回归
被用来进行预测的变量,相当于输入
被预测的变量,相当于输出
用来建立方程模拟两个或者多个变量之间如何关联,两个以上的自变量,则称作多元回归分析。
参数说明:
β0:回归线的截距
β1:回归线的斜率
注意:β1和β0也可以使用其他标识符代替,后续会使用θ0替代β0,θ1替代β1
也称为损失函数(Loss Function)
最小二乘法
·公式:
·图像:
以θ1=0.5为例通过误差平方和公式画曲线:
·=1时,h0()=0.5,平方为0.25;
·=2时,h0()=1,平方为1;
·=3时,h0()=1.5,平方为2.25;
·计算三个值均值再除以2:(0.25+1+2.25)/3/2=0.58(图中第二个五角星所在位置)
·如何看等高线图:
·图中每个圈圈(线条颜色相同)上的值都是相同的,例如3个红色叉叉值是相同的
·中间的实心红点代表图中的最小值,空心红圈越接近实心红点,就是损失函数越小
·空心红圈所对应的代表左侧图像的蓝色线:y轴数值代表左侧图像的斜率,x轴数值代表左侧图像的截距
参数说明:
:真实值的y
y`:真实值的均值
参数说明:
y^:预测值的y值
y`:真实值的均值
参数说明:
:真实值的y
y^:预测值的y值