Logistic回归:成本函数

为了训练 w b ,需要定义成本函数对其取值的好坏进行评估。

概括来讲:

y^(i)=σ(wTx(i)+b),σ(z(i))=11+ex(i) ,其中 x(i) 为第i个训练样本
已知 (x(1),y(1)),...,(x(m),y(m)) ,希望 y^(i)y(i)

损失函数:

损失函数用来估计预测值( y^(i) )与期望输出值( y(i) )之间的差异。也就是说,损失函数针对一则训练样例计算误差。
L(y^(i),y(i))=12(y^(i)y(i))2
L(y^(i),y(i))=(y(i)log(y^(i))+(1y(i))log(1y^(i)))

  • y(i)=1 时, L(y^(i),y(i))=log(y^(i)) ,其中 log(y^(i)) y^(i) 应当接近于1
  • y(i)=0 时, L(y^(i),y(i))=log(1y^(i)) ,其中 log(1y^(i)) y^(i) 应当接近于0

成本函数:

成本函数是损失函数在整个训练集上的平均。通过全局最小化成本函数,可以确定参数 w b 的值。
J(w,b)=1mmi=1L(y^(i),y(i))=1mmi=1y(i)[log(y^(i))+(1y(i))log(1y^(i)))]

你可能感兴趣的:(Logistic回归:成本函数)