解决Pytorch训练意外停止显存不释放的问题

想要测试搭建的网络最多可以用多大的batch size训练,于是用不同的batch size测试显存的占用大小。用ctrl z结束进程后,发现显存还没有释放。

watch -n 1 nvidia-smi #查看显存占用情况,刷新时间为1

解决Pytorch训练意外停止显存不释放的问题_第1张图片
GPU的利用率为0,可是显存依然没有释放。

使用ps ax查看进程,发现python main.py依然存在。

解决Pytorch训练意外停止显存不释放的问题_第2张图片
可以看到main.py的进程ID为24779。

使用命令sudo kill -9 24779 杀死进程。

再查看显存占用情况,说明成功杀死进程了。
解决Pytorch训练意外停止显存不释放的问题_第3张图片

你可能感兴趣的:(python,深度学习,pytorch)