深度学习_8_对Softmax回归的理解

回归问题,例如之前做房子价格预测的线性回归问题

而softmax回归是一个分类问题,即给定一个图片,从猫狗两种动物类别中选出最可靠的那种答案,这个是两类分类问题,因为狗和猫是两类

深度学习_8_对Softmax回归的理解_第1张图片

上述多个输出可以这样理解,假设一个图片让机器辨别这个图片的类别,假设是三类分类问题,分别是猫,狗,鸟,那么机器对图片分析假设会得出这样一个置信度的输出即[0.6, 0.3, 0.1]可以看出猫的置信度比较高为0.6,那么机器会判别这个图片为猫

深度学习_8_对Softmax回归的理解_第2张图片
继续拿上述猫狗鸟进行举例,那么y(注意这里不是小写y)可以是 [猫, 狗, 鸟]

假设上述让机器检测的图片就是猫,那么y1 = 1,其他都是0

即[1, 0, 0]

深度学习_8_对Softmax回归的理解_第3张图片
这其中的y就是被检测图片真实类别的标号

深度学习_8_对Softmax回归的理解_第4张图片

机器能对图片真实类别检测生成的置信度高于其他类别生成的置信度即可,朴素的来讲,只要机器识别这个图片是猫的概率比识别为其他动物的概率高即可
深度学习_8_对Softmax回归的理解_第5张图片

这里的exp是e的意思,即指数能化负数为正数,且这样算最后所有概率的和为1即上述0.6 + 0.3 + 0.1 =1
深度学习_8_对Softmax回归的理解_第6张图片

为什么要用这个交叉熵损失呢,好处在哪呢?

例如:

深度学习_8_对Softmax回归的理解_第7张图片

那么梯度是如何求出来的呢?

深度学习_8_对Softmax回归的理解_第8张图片
求法如下:

由于:

在这里插入图片描述
所以:

深度学习_8_对Softmax回归的理解_第9张图片
求偏导oj

注:exp是以e为底的意思,log在计算机中一般都是以e为底

你可能感兴趣的:(深度学习,回归,人工智能)