NNDL 作业1:第二章课后题

本章为深度学习第一次习题作业,内容是第二章课后题,考察对于基础概念的掌握,掌握这些概念后较为容易解答。

习题 2-1  分析为什么平方损失函数不适用于分类问题 , 交叉熵损失函数不适用于回归问题.

首先要知道什么是平方损失函数和交叉熵损失函数:
平方损失函数是MSE的单个样本损失,又叫平方损失性能,是指预测值与实际值差的平方。在机器学习中,平方损失函数是直接测量机器学习模型的输出结果与实际结果之间的距离,若定义机器学习模型的输出为yi ,实际结果为ti ,那么平方损失函数可以被定义为

MSE = \frac{1}{m}\sum _{i=1}^{m}(y_{i})-({t_{i}})^{2}

交叉熵函数主要用于度量两个概率分布间的差异性,能够衡量同一个随机变量中的两个不同概率分布的差异程度,在机器学习中就表示为真实概率分布与预测概率分布之间的差异

H(p,q) = -\sum _{x}p(x)log(q(x))

平方损失函数不适用于分类问题,交叉熵损失函数不适用于回归问题。
因为平方损失函数对每一个输出结果都十分看重,而交叉熵损失函数只对正确分类的结果看重。例如,对于一个多分类模型结果输出为(a, b, c),而实际真实结果为(1, 0, 0)。那么根据两种损失函数的定义其损失函数可以写为:
平方损失函数:L = (a-1)^{2}+(b-0)^2+(c-0)^2 = (a-1)^2+ b^2+c^2
交叉熵损失函数:L = (-1)*log(a)-0*log(b)-0*log(c) = -log(a)
从结果可以看出交叉熵函数结果只和正确分类的结果有关,这正是我们所需要的;而平方损失函数还和错误的分类有关,它除了让正确分类尽量变大,还会使错误分类变得更平均,这一步对于分类问题来说是多余的,但对于回归问题来说则是不可缺少的,所以说平方损失函数适用于回归问题,不适用于分类问题;交叉熵损失函数适用于分类问题(离散),不适用于回归问题(连续)。

习题2-2 对于一个三分类问题 , 数据集的真实标签和模型的预测标签如下 :

NNDL 作业1:第二章课后题_第1张图片

分别计算模型的精确率、召回率、F1值以及它们的宏平均和微平均. 

精确率:也叫做精度或查准率,类别c的查准率是所有预测为类别c的样本中预测正确的比例.

P_{c} = \frac{TP_{c}}{TP_{c}+FP_{c}}

P_{1} = \frac{1}{2}, P_{2} = \frac{1}{2},P_{3} = \frac{2}{3}

召回率:也叫查全率,类别c的查全率是所有真实标签为类别c的样本中预测正确的比例.

R_{c} = \frac{TP_{c}}{TP_{c}+FN_{c}}

R_{1} = \frac{1}{2}, R_{2} = \frac{2}{3},R_{3} = \frac{1}{2}

F1值:是一个综合指标,为精确率和召回率的调和平均,其中β用于平衡精确率和召回率的重要性,一般取为1,此时F值称为F1值,是精确率和召回率的调和平均.

F_{1} = \frac{2P_{c}R_{c}}{P_{c}+R_{c}}

F1_{1} = \frac{1}{2},F1_{2} = \frac{4}{7},F1_{3} = \frac{4}{7}

宏平均:宏平均是每一类的性能指标的算术平均值.

P_{macro} = \frac{1}{C}\sum _{c=1}^{C}P_{c}

P_{macro} = \frac{1}{C}\sum _{c=1}^{C}R_{c}

F1_{macro} = \frac{2P_{macro}R_{macro}}{P_{macro}+R_{macro}}

P_{macro} = \frac{5}{9},R_{macro} = \frac{5}{9},F1_{macro} = \frac{5}{9}

微平均:是每个样本的性能指标的算术平均值.

P_{macro} = \frac{5}{9},R_{macro} = \frac{5}{9},F1_{macro} = \frac{5}{9}

你可能感兴趣的:(ui,深度学习)