记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)

目录

  • 前言
  • CUDA安装
    • 直接安装(失败)
    • 根据驱动程序版本对照安装(失败)
    • 重新安装驱动程序(失败)
    • 再次安装CUDA(失败)
    • 安装CUDA 10.2(成功)
  • cuDNN安装
  • 环境配置

前言

之前电脑出了一些问题,于是重装了系统,之前电脑安装的CUDA和cuDNN便不在了。重装后的系统需要装TensorFlow-GPU,于是必须得安装CUDA和cuDNN。

CUDA安装

直接安装(失败)

安装CUDA只需要到CUDA Toolkit Archive下载对应版本的安装包。目前最新版本为11.5.2,如下所示:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第1张图片
那么就存在一个问题,到底应该下载哪一个版本呢?

根据网上的一些教程:打开NVIDIA控制面板,找到系统信息,如下所示:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第2张图片
于是便去下载了最新版本的11.5.2,最后安装失败!然后下载11.4.4安装,还是失败,失去耐心了。

根据驱动程序版本对照安装(失败)

上网又查资料,说需要根据驱动程序的版本来进行下载,进入NVIDIA控制面板:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第3张图片
可以发现电脑的NVIDIA驱动程序版本为511.65,再参照官网给定的驱动程序版本-CUDA版本对照表:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第4张图片
可以发现,由于我的驱动程序版本文511.65,所以可以安装任意版本的CUDA,但是事实并非如此。

重新安装驱动程序(失败)

上网又查资料,说需要自己重新安装NVIDIA驱动(电脑上的驱动是由驱动精灵安装的),于是进入驱动精灵,卸载了之前的驱动,进入官网下载与自己GPU对应的GPU,如下所示:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第5张图片
GPU型号同样在NVIDIA控制面板查询:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第6张图片
可以看到的电脑的GPU型号为:GeForce MX150。

下载驱动程序后进行安装,电脑却提示:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第7张图片
于是将Win10的禁止更新选项关闭,然后重新将当前Win10更新到最新版本,然后再次安装,总算成功!!

注意安装时选定自定义,然后选择清洁安装,这样在安装时会自动清除以前安装的版本。

再次安装CUDA(失败)

此时再次满怀信心地安装CUDA 11.5.2,失败!安装11.4.4,失败!

此时开始怀疑,是不是版本过高,但是又不想一个一个去尝试,因为下载一个安装包还是需要老长时间的。

安装CUDA 10.2(成功)

偶然间突然想到之前的电脑有安装过PyG,当时有一条安装命令为:

pip install torch-scatter -f https://data.pyg.org/whl/torch-1.5.0+cu102.html

cu102!!

于是下载CUDA 10.2版本,安装成功!

总结:安装CUDA失败最大的原因可能是版本过高,如果有耐心的话可以从高到低一个个地去尝试。

cuDNN安装

cuDNN安装要简单很多,去cuDNN Archive选择对应的版本,如下所示:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第8张图片
这里需要注意的是:如果你是为了安装TensorFlow-GPU,那么就应该参照TensorFlow-GPU与CUDA以及CcuDNN的对照关系去下载,这里我选择了cuDNN 7.6.5。

但是下载cuDNN时又出现了一个问题:NVIDIA要求必须注册账号然后才能下载:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第9张图片
于是又去注册账号,这个时候你会发现网页总是卡着进不去,建议用手机热点或者关闭VPN再次尝试!

总算进入到注册页面,但是总是提示:“验证程序加载失败,请检查您的浏览器设置,例如广告拦截程序。”

这里有一种简单绕过注册下载cuDNN的方法:找到下载页面,然后右键复制下载链接,如下所示:
记录Win10正确安装CUDA和cuDNN的过程(记录一些坑)_第10张图片
然后去迅雷或者其他地方复制链接下载。

环境配置

关于环境配置网上有很多相应的博客,就是简单复制几个文件到相应位置,然后再写一下系统环境变量,这里就不介绍了。

你可能感兴趣的:(TensorFlow,tensorflow,深度学习,CUDA,cuDNN)