深度学习-softmax

1.基本概念

softmax regression是logistics regression的一般形式,两者都用于解决分类问题。区别在于,logistic regression一般用来解决二分类问题,而softmax regression 用来解决多分类问题。举例:

分类问题:根据给出的图像判断图中的动物为猫、狗还是鸡。


输入:2*2的图片,对应四象素为

标签:猫,狗,鸡,对应的离散值为

参数:


      softmax 回归是一个简单的神经网络

计算公式:

假设最终,通过比较数值大小可知,该动物为猫。

输出问题:1.输出值大小不确定,没有具体含义。

                  2.真实值是离散值,与不确定范围的输出值之间的误差难以衡量。

解决办法:softmax operator。将一个K维的任意实数向量压缩(映射)成另一个K维的实数向量,其中向量中的每个元素取值都介于(0,1)之间并且和为1。 是不是有点像Logistic 中sigmod函数?

                              

                               

最终,输出值为。由此可知,该图中动物存在0.88的概率为猫,0.12的概率为狗,几乎不可能是鸡。因此该图中动物根据分类结果显示为猫。

你可能感兴趣的:(深度学习-softmax)