Pytorch交叉熵损失函数CrossEntropyLoss报错解决办法

在pytorch的官方论坛里有一个人也遇到了同样的问题,他把nn.CrossEntropyLoss()换成了nn.MultiLabelSoftMarginLoss()就不再报错了。但是经过实验发现,这个损失函数的效果非常差,远不如MSELoss

最终,我找到了一篇运用交叉熵损失函数的多分类代码一步步检查发现了报错的原因:

在多分类问题中,当损失函数为nn.CrossEntropyLoss()时,它会自动把标签转换成onehot形式。例如,MNIST数据集的标签为0到9的数字,有100个标签,则标签的形状为[100],而我们的模型的输出则为onehot形式,其形状为[100, 10]。所以,我们在运用交叉熵损失函数时不必将标签也转换成onehot形式。问题成功解决。(target仍然需要为int64类型)

https://www.jianshu.com/p/f5f458c9f37a

你可能感兴趣的:(pytorch)