二元交叉熵损失函数

交叉熵损失

交叉熵:
H(y(i), y ^ \hat{y} y^(i)) = - ∑ j = 0 q \sum_{j=0}^q j=0qyj(i) log y ^ \hat{y} y^j(i)

其中向量y(i)维度是(1, q),q为特征数量。交叉熵只关心对正确类别的预测概率,y(i)向量中只有某个值为1,其余全为0。

交叉熵损失函数定义为:

L = 1 n \frac{1}{n} n1 ∑ i = 1 n \sum_{i = 1}^n i=1nH(y(i), y ^ \hat{y} y^(i))

二元交叉熵损失

L(w) = - ∑ i = 0 N \sum_{i=0}^N i=0N[yilog σ \sigma σ(xi) + (1 - yi)log(1 - σ \sigma σ(xi))]

其中, σ \sigma σ(x)是sigmoid函数,即:

σ \sigma σ(x) = 1 1 + e − z \frac{1}{1 + e^{-z}} 1+ez1

解释

可视化的方法解释对数损失
交叉熵详解

你可能感兴趣的:(机器学习,概率论,线性代数)