bug:RuntimeError: CUDA out of memory. Tried to allocate 9.00 MiB (GPU 0; 11.17 GiB total解决办法

亚马逊aws ec2 故障不停解决办法,解决流程

batch 2
out of memory只要不停就让它去吧,没事。
一定要先tmux new -t 0,跑停机了也可以拉回来,用tmux attach -t 0拉,很好用,在后台跑的。
步骤
用gpustat查看gpu占用情况,有时候0%,有时候3%,是有一个tmux session 的时候,有时候99%,这时候是有废弃的另外一个tmux在跑
把它杀死。命令查一下。
tmux kill-session -t session-name

3%的时候,tmux attach -t 0拉回
tmux ls
看是哪个session
再用tmux attach拉回

再cd CogQA
python3 文件ming
即可,跑吧。

你可能感兴趣的:(bug:RuntimeError: CUDA out of memory. Tried to allocate 9.00 MiB (GPU 0; 11.17 GiB total解决办法)