搞深度学习,跑程序遇到 out of memory的问题

我的系统是Ubuntu16.04,显卡是rtx 2080ti,跑ssd程序,结果报错 out of memory,像网上说的更改了batch_size ,改的很小也没有解决,还是会超出,考虑是不是够被占用了太多,都没有有效的释放才这样的,然后按下面办法进行了解决。
解决办法是:1.输入命令查看自己gpu的使用情况:watch -n 10 nvidia-smi
该命令可以监视gpu的动态,其中的数字代表10秒更新一次,你也可以设成别的数。
搞深度学习,跑程序遇到 out of memory的问题_第1张图片
会看到上面这样的一个图。
2.发现gpu被占用了太多,所以现在跑的没有足够的显存可以用了,可以查看都是什么占用了显存,然后可以手动释放掉。
查看:sudo fuser /dev/nvidia*
该命令会显示所有占用nvidia设备的进程pid,将这些pid逐个kill掉:
释放:kill -9 pid
pid 为显示出来的那些个占用显存的号,如下图
搞深度学习,跑程序遇到 out of memory的问题_第2张图片
这样完成后就可以重新跑了,没有错误出现。

你可能感兴趣的:(错误解决,out,of,memory,解决办法)