使用pytorch遇到的异常总结(持续更新)

 本博客记录我在学习pytorch的过程中,遇到的一些问题以及解决方法。希望对大家有用。

 

  • 在编写第一个程序时,想尝试把模型代码搬到GPU上训练时出现的错误。
Expected object of backend CPU but got backend CUDA for argument #2 'weight'

这个错误是:程序需要一个CUDA tensor,我给的却是个CPU tensor。

这种问题出现的原因有很多种。比如在程序中创建一个新的tensor,但没指定CUDA,默认是CPU tensor的。还有可能是调用了某个函数,函数里的某些tensor或运算操作是运行在CPU的,然后等到需要传给CUDA tensor进行运算时,也可能会出现这种错误。

我的解决方法是从头检查代码,把所有用到的tensor数据和模型都设置为CUDA设备。比如其中一处:

network = Network().to(device)  # 模型
images, labels = images.to(device), labels.to(device)  # 数据

所以调试这种错误,有时候会比较麻烦,不得不一行行地手写 print 语句。调试这种错误也可以使用 TorchSnooper 包进行debug,说是比较方便,不过我没尝试过,可以自行百度一下用法。

 

 

参考链接:

1. https://blog.csdn.net/zz2230633069/article/details/93266950

你可能感兴趣的:(pytorch,pytorch,CUDA,报错,CPU)