Andrew ng机器学习课程第一周

Hypothesis

hθ(x)=θ0+θ1x

Cost Function

它描述的是在任一θ下,h(x)和相应的y的接近程度,我们的目的是让它尽可能地小。

J(θ)=12mmi(hθ(x(i))y(i))2

To break it apart, it is 12x^ where x^ is the mean of the squares of hθ(x(i))y(i) , or the difference between the predicted value and the actual value.

用等高线表示如下图所示

Andrew ng机器学习课程第一周_第1张图片

Gradient Descent

Andrew ng机器学习课程第一周_第2张图片

α >0是学习率,,更新时两个变量同时更新。

批量梯度下降

随机梯度下降

你可能感兴趣的:(machine,learning)