《南溪的目标检测学习笔记》——训练PyTorch模型遇到显存不足的情况怎么办(“OOM: CUDA out of memory“)

1 前言

在目标检测中,可能会遇到显存不足的情况,我们在这里记录一下解决方案;

2 如何判断真正是出现显存溢出(不是“软件误报”)

当前需要分配的显存在600MiB以下
例如:

RuntimeError: CUDA out of memory. Tried to allocate 60.00 MiB (GPU 0; 10.76 GiB total capacity; 8.71 GiB already allocated; 59.00 MiB free; 8.81 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

否则就是“软件误报”引起的OOM错误,则重新运行程序,错误可能就会消失;

3 如何减少PyTorch模型需要的显存

3.1 减小batch_size的数量

最小的数量可以设置为2;

你可能感兴趣的:(目标检测,pytorch,人工智能)