tensorflow小技巧--binary_crossentropy与BinaryCrossentropy的区别

tf.keras.losses下面有两个长得非常相似的损失函数,binary_crossentropy(官网传送门)与BinaryCrossentropy(官网传送门)。从官网介绍来看,博主也没看出这两个损失函数有什么区别,直到今天才明白过来,不多说,直接上代码:

#set loss func
loss=tf.losses.BinaryCrossentropy()

这样声明一个损失函数是没有问题的。

loss=tf.losses.binary_crossentropy()

TypeError: binary_crossentropy() missing 2 required positional arguments: 'y_true' and 'y_pred'

报错了,缺少入参。所以说明了binary_crossentropy()是用来计算给定输入y_true和y_pred的loss的,而BinaryCrossentropy()会声明一个类,然后可以使用eager execution计算y_true和y_pred的loss。

另外,二者返回的维度也是不同的:

import tensorflow as tf

label=tf.constant([[1,1],[0,0]],dtype=tf.int32)

pred=tf.constant([[0.7,0.6],[0.3,0.2]],dtype=tf.float32)

loss=tf.losses.BinaryCrossentropy()
#输出损失值,维度为1*1
loss(label,pred)

<tf.Tensor: shape=(), dtype=float32, numpy=0.36182958>


#输出损失值,维度与batch_size的维度相同
tf.losses.binary_crossentropy(label,pred)

<tf.Tensor: shape=(2,), dtype=float32, numpy=array([0.4337501, 0.2899091], dtype=float32)>

所以,BinaryCrossentropy()会返回一个最终结果,而binary_crossentropy是计算每个位置的损失值,最后返回一个矩阵,这种处理方式在某些场景下是非常有用的,可以看我的另一篇博文。

你可能感兴趣的:(深度学习,tensorflow,深度学习,人工智能,python,机器学习)