tensorflow学习之softmax使用详解

1. 什么是Softmax

Softmax 在机器学习和深度学习中有着非常广泛的应用。尤其在处理多分类(C > 2)问题,分类器最后的输出单元需要Softmax 函数进行数值处理。关于Softmax 函数的定义如下所示:

tensorflow学习之softmax使用详解_第1张图片

其中,Vi 是分类器类别的输出。i 表示类别索引,总的类别个数为 C。Si 表示的是当前元素的指数与所有元素指数和的比值。Softmax 将多分类的输出数值转化为相对概率,更容易理解和比较。我们来看下面这个例子。 一个多分类问题,C = 4。线性分类器模型最后输出层包含了四个输出值,分别是:

tensorflow学习之softmax使用详解_第2张图片

经过Softmax处理后,数值转化为相对概率:

tensorflow学习之softmax使用详解_第3张图片

很明显,Softmax 的输出表征了不同类别之间的相对概率。我们可以清晰地看出,S1 = 0.8390,对应的概率最大,则更清晰地可以判断预测为第1类的可能性更大。Softmax 将连续数值转化成相对概率,更有利于我们理解。 实际应用中,使用 Softmax 需要注意数值溢出的问题。因为有指数运算,如果 V 数值很大,经过指数运算后的数值往往可能有溢出的可能。所以,需要对 V 进行一些数值处理:即 V 中的每个元素减去 V 中的最大值.

tensorflow学习之softmax使用详解_第4张图片

2. Softmax 损失函数

我们知道,线性分类器的输出是输入 x 与权重系数的矩阵相乘:s = Wx。对于多分类问题,使用 Softmax 对线性输出进行处理。这一小节我们来探讨下 Softmax 的损失函数。tensorflow学习之softmax使用详解_第5张图片

其中,Syi是正确类别对应的线性得分函数,Si 是正确类别对应的 Softmax输出。 由于 log 运算符不会影响函数的单调性,我们对 Si 进行 log 操作:

 

 

我们希望 Si 越大越好,即正确类别对应的相对概率越大越好,那么就可以对 Si 前面加个负号,来表示损失函数:

tensorflow学习之softmax使用详解_第6张图片

对上式进一步处理,把指数约去:

tensorflow学习之softmax使用详解_第7张图片

这样,Softmax 的损失函数就转换成了简单的形式。 举个简单的例子,上一小节中得到的线性输出为:

tensorflow学习之softmax使用详解_第8张图片

假设 i = 1 为真实样本,计算其损失函数为:

tensorflow学习之softmax使用详解_第9张图片

 

3.tensorflow api

import tensorflow as tf

s=tf.constant([1,1,2,3,4,5,10],dtype=tf.float32)

sm=tf.nn.softmax(s)

with tf.Session()as sess:

    print(sess.run(sm))

    print(sess.run(tf.argmax(sm)))

你可能感兴趣的:(深度学习,机器学习,tensorflow)