Ubuntu在pytorch训练过程中总是出现死机,重启

问题解析:一般是gpu或者cpu在和内存io的时候,内存容量不足被强制kill了,举个例子,我训练的模型大小约占用显存16g,但是在存储模型的过程会被32g的内存撑爆

1 在pycharm的设置文件将内置内存最大值拉满,不会的同学可以直接用命令行运行py文件

2如果还爆炸的话就可以考虑进行代码的优化,如减少存储变量的数量等等

3实在不行就加内存吧

你可能感兴趣的:(深度学习环境配置,pytorch)