CrossEntropyLoss的 device-side assert triggered报错

报错

Segmentation fault (core dumped)

该报错一搜索往往告诉你一些解决方案,当时在训练下,往往是cuda那边的锅,所有建议把详细信息打印出来,加上下边的代码:

import os
os.environ['CUDA_LAUNCH_BLOCKING'] = '1'

如果不是cuda的锅,就别往下看了……

详细报错出来了,我遇到的如下:

.......
return torch._C._nn.cross_entropy_loss(input, target, weight, _Reduction.get_enum(reduction), ignore_index, label_smoothing)
RuntimeError: CUDA error: device-side assert triggered

device-side 嗯顾名思义,和边界有关系
实际上CEloss的tartget输入的边界,是由前面模型输出的类别维度确定的

模型输出形状 torch.Size([n, cls_num,…])
target形状 torch.Size([n, …])

即:target的输入范围则是[0, cls_num-1],

解决

此时检查数据集的类别数量和模型训练指定的类别数量是否一致即可。

你可能感兴趣的:(训练报错,深度学习,机器学习,人工智能)