RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 可能原因

可能原因:

  1. 没有安装CUDNN
  2. pytorch和cuda版本不对应。具体来说,是pytorch编译时cuda的版本和环境cuda版本不一致。
  3. 显卡和安装的CUDA及CUDNN版本不兼容。比如2080至少需要 cuda9.2及以上才可以较好运行。
  4. 内存不足,dataloder每次处理的数据过大
  5. 显存不足,OOM。有时候当程序调用cuDNN时遇到显存不足,此时可能不会报OOM,而会报cuDNN error

根据我的经验,如果在代码刚跑的时候就报cuDNN error,应该是前三种原因。

如果是运行一段时间之后再报错,应该是第4,5个原因。

 

https://blog.csdn.net/qq_44420246/article/details/108237097

https://www.cnblogs.com/naive-LR/p/14256624.html

https://github.com/pytorch/pytorch/issues/17543

你可能感兴趣的:(杂记)