解决block: [0,0,0], thread: [11,0,0] Assertion `input_val >= zero && input_val <= one` failed 问题

今天在用 GPU 跑模型时,报了如下错误,绝望,简直是绝望。。。
解决block: [0,0,0], thread: [11,0,0] Assertion `input_val >= zero && input_val <= one` failed 问题_第1张图片
错误定位到了计算 loss 的位置,通过打日志,记录传入loss的label和预测值,发现出错时,预测值里有 nan
解决block: [0,0,0], thread: [11,0,0] Assertion `input_val >= zero && input_val <= one` failed 问题_第2张图片
检查代码,发现了除 0 运算,改之即可。

查阅资料发现,该错误还有可能由以下原因引起:

  • 预测值和标签长度不一致
  • 预测值或标签值不在 [0, 1] 范围内

你可能感兴趣的:(python,pytorch,gpu,bug)