解决RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

配置环境耽误了一天的时间,有必要记录一下以后少跳坑。

刚开始尝试的环境是:系统:Ubuntu 18.04、显卡:GTX 2080Ti、cuda9.0、cudnn7.1.2、pytorch0.4.0,其中cuda、cudnn和pytorch版本是从官网对应下来的,版本匹配肯定没问题。

我是用的 conda install pytorch=0.4.0 cuda=9.0 cudnn=7.1.2 来安装的。其中python版本是3.6.9(比较稳定,不建议用太新的),然后程序一开始运行就报错了,错误出现在/lib/python3.6/site-packages/torch/nn/模块,就是cudnn加速循环神经网络这块。我尝试着更换cuda/cudnn/pytorch/python各种版本,最终都无效。

然后把显卡类型换到了RTX3080,也是以上各种操作,最终都无果。我寻思着,cuda/cudnn/pytorch版本是不是太老了,在比较新的显卡上有问题,顺着这个想法走了走,把显卡换成了RTX1080Ti,环境匹配和上面的2080Ti的一摸一样,结果可以运行了,解决!

出现错误不只是版本匹配问题,当版本匹配时,还报错,可能是显卡太新/驱动太高。

你可能感兴趣的:(pytorch,深度学习,cuda)