神经网络代码总是停在to(device)很久之后才能继续运行(解决)

神经网络代码总是停在to(device)很久之后才能继续运行(解决)_第1张图片

如图所示,每次用cpu就能跑,但跑非常慢,然后就会把cuda设置为True,这样就在gpu上面跑了,但每次跑到 to(device) 的时候就会卡很久很久,总之还是很慢很慢,所以在朋友的帮助下解决了这个问题。

CUDA版本检查,我的显卡是3060,据说GeForce RTX 30系列显卡仅支持CUDA 11.1及以上版本,于是去安装了CUDA11.1。

检查下环境变量,没毛病:

神经网络代码总是停在to(device)很久之后才能继续运行(解决)_第2张图片

然后再在终端执行:nvcc -V 检查下,没毛病:

神经网络代码总是停在to(device)很久之后才能继续运行(解决)_第3张图片

接着,在pytorch官网找到cuda11.1对应的pytorch版本的安装方式:

神经网络代码总是停在to(device)很久之后才能继续运行(解决)_第4张图片

执行:

conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c conda-forge

后来又遇到了好多问题,这里不细节讲了吧,直接把我一些做法说出来:

cuda11.1 + python3.9 + 最新的torch,tensorflow,tensorbord等等(python3.7 和 cuda11.1貌似不匹配,老出错,直接改成python3.9,然后就成了)

另外还有一些细节的关于代码的错误,我发在其他博客里面了,不同的代码可能会遇到不同的错误,就不放在这里讲了

你可能感兴趣的:(深度学习,to,device,神经网络代码,cuda)