RuntimeError: CUDA error: device-side assert triggered

RuntimeError: CUDA error: device-side assert triggered_第1张图片

 跑了三轮迭代后,死掉了,遇到上面的bug,

 

/opt/conda/conda-bld/pytorch_1614378063927/work/aten/src/THCUNN/ClassNLLCriterion.cu:59: ClassNLLCriterion_updateOutput_no_reduce_kernel: block: [0,0,0], thread: [0,0,0] Assertion `cur_target >= 0 && cur_target < n_classes` failed.

跑的GitHub的模型,用官方给的数据集可以正确出结果,换成我自己的数据集开始报上边的错,

百度到的结果大概分三类:

loss  有的会出 现loss为负数的情况,这样在totch.log中加上

+1e-5torch.sum(weight)+1e-5

但是这种 方法对我不管用

参考链接:

你可能感兴趣的:(域不对称自适应论文与源码分享,bug,python,pytorch,深度学习,人工智能)