RuntimeError:CUDA error:out of memory问题解决

【说在前面】
复杂的机器学习程序,特别是已经训练好跑的时候出的问题,不是说改CUDA就能改的。因为很多参数已经在另一个gpu里面了,单纯改一个test的代码是不够的。
如果是上述情况,只有查运行情况了,看看到底是什么程序占用了那么那么多的内存,可以的话kill掉就行。

报错如下

RuntimeError:CUDA error:out of memory问题解决_第1张图片

思路

简洁明了,他已经告诉你了,默认使用的那gpu内存不足。

在操作系统输入如下,查一下memory现在的状态:

nvidia-smi

害,发现GPU-0有一个进程正在执行导致1GB剩余都不够。
我们用GPU-1执行就行啦!
RuntimeError:CUDA error:out of memory问题解决_第2张图片

问题解决

python文件中:

import os
os.environ["CUDA_VISIBLE_DEVICES"] = '1'

解决了。

你可能感兴趣的:(问题)