目录
前言
1. Anaconda的安装
2. 安装CUDA10.1与cudnn_10.1-v7.6.5
2.1 CUDA的下载与安装
2.2 cudnn的下载与安装
2.3 配置相应环境变量
2.4 测试CUDA与cudnn
3. 安装GPU版的PyTorch与TensorFlow
3.1 PyTorch的安装
3.2 TensorFlow的安装
emmm,第一次写博客,有很多不懂的地方,请大家多多指教……
最近因为各种电脑问题以及为笔记本电脑扩充了内存,重装了系统,导致之前配置好的环境不得不重新安装配置一遍,之前安装的GPU版的PyTorch与TensorFlow费了好大的功夫,也有很多错误的地方,所以这次总结之前的安装经验,加上各种网上安装教程的调研,总结了这次安装过程,希望能为大家多多少少带来一些便利,少走一些弯路,谢谢大家!
可能安装过程中有些地方没有及时截图,会用到网上资料中的一些截图,都会在最后标明出处,如有侵权,请私信联系,谢谢!
先说一下个人的电脑配置:
- 设备:联想拯救者y720(17年购入的机子)
(该硬件设施跑一些深度学习代码还是很吃力,不过感觉用于个人学习一些小demo还凑活)
- 操作系统:WIN10专业版
Anaconda的安装
注意安装时使用管理员权限打开安装包;
直接next,然后I Agree
注意到了第3步的时候有这样一个选择,这里解释一下:
Just Me:只为当前用户安装,win10为多用户操作系统,但一般我们常用的只有一个用户或者管理员用户;
All Users:为此设备所有用户安装,即相当于管理员权限,因为我们一般一台设备常用一个用户,因此这样推荐选择All Users;
然后Next;
这里设置安装路径,可以选自己想安装的路径,默认安装C盘,安装C盘有安装C盘的好处,默认路径有时候找一些东西也方便,但是个人不太喜欢安装到C盘,故选择了自己的安装路径;
然后Next
这一步的时候,如果设备里面之前没有安装过Python环境,第二项应该是默认勾选的,因为本人在写这篇博客时已经安装过一遍,所以这里手动打钩,而第一个选项是是创建环境变量,网上的其他教程对于此选项勾不勾选意见不一,但都可以安装成功,这里推荐勾选,可以免去自己配置环境变量的一些麻烦;
最后点击Install安装成功即可,可能等待时间较长,因设备配置而异。
可以说这一步是出错最多也是最麻烦的一步,在安装这一步之前,我们需要两个安装的“生存守则”,就是PyTorch与TensorFlow的官方配置文档,分别告诉我们不同版本分别对应的CUDA与cudnn的版本;
以下所有步骤都要基于以上两个“生存守则”,请务必牢记。
以下安装可能出现的问题不一,如果出现没有提到的其他问题,请自行百度解决(因为我其实啥也不知道……)
一般重装系统后利用驱动精灵等软件安装的N卡驱动都不是最新版,由TensorFlow的“生存指南”可以知道,CUDA10.1需要的驱动版本必须要高于418.x,因此我们需要安装更新版本的N卡驱动;
这里稍微提一个问题,我是安装CUDA安装包的时候才发现,其实CUDA包(2.多G)里面已经包含了适合该CUDA版本的N卡驱动程序,我当时不太清楚这一点,所以先进行了N卡驱动的安装,最后安装成功CUDA的时候,提示N卡驱动未安装,原因是系统已经有了更新版本的驱动程序。所以这里建议大家可以直接进行CUDA10.1的安装(如果出现问题,可以像我这样先根据自己的设备安装N卡驱动)。
特别注意的一点,最好电脑里面已经安装好visual studio 2017或者2019(社区版的就可以),因为如果不安装的话,可能会出现一些不可预料的问题,这里具体原因我也搞不懂,应该也有不安装vs安装成功的案例,但是这里建议大家还是安装一下vs,比较有保障。
因为我是先安装的N卡驱动在安装的CUDA,作为过程记录,我这里还是先安装N卡驱动;
https://www.nvidia.com/Download/index.aspx?lang=cn
到N卡官网下载符合自己设备的驱动程序,对于我的电脑,是这样选择的,供大家参考;
下载好后以管理员权限安装即可,比较简单,安装成功后打开N卡控制面板,查看驱动程序信息,可见当前版本为422.19,高于TensorFlow要求的418.x;(点击帮助->系统信息即可查看)
到官网下载CUDA10.1的安装包,链接如下:
https://developer.nvidia.com/cuda-toolkit-archive
注意一定要选择10.1版本的,因为“生存守则”!!!(我这里选择的是较新的CUDA Toolikit 10.1 update2)
下载完成后以管理员权限安装,安装路径可以自己设置,默认路径也可以;
同意并继续
注意这里要选择自定义(或者可以试试精简安装,如果安装成功了,那么恭喜你,你是成功安装党)
特别注意!!!这里不要勾选Visual Studio Integration!!!否则会安装失败,当然可以先勾选进行尝试安装,如果安装成功了那万事大吉,如果不成功要重装一下,把这一项取消掉再安装,应该就可以成功,如果还不成功,请自行百度,有可能是版本不匹配之类的。(因为本次安装的目的是配置深度学习环境,所以Visual Studio Integration不安装也完全可以,但如果是使用vs做与CUDA相关的开发,应该是必须得安装了,网上有很多解决方案,可以自行参考)
这里安装路径默认就好,如果自己设定,一定要记好路径!!!后续安装cudnn时需要;
可能安装时间比较长,安装成功后如下:
下面给出官网的下载链接,下载cudnn需要注册一个NVIDIA的账号,大家注册后下载就好;
https://developer.nvidia.com/cudnn
注意这里不要选择错了。一定要选择对应CUDA10.1的,这里的cudnn版本为v7.6.5,也符合TensorFlow“生存守则”中cudnn版本>=7.6的要求;
下载好后是一个压缩包,解压缩之后打开应该是这样;
将这三个红框文件夹复制粘贴到刚刚安装的CUDA目录下(之前提示要记住的目录),如果采用的是默认安装,则目录如下:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1
可以打开bin目录中查看是否有cudnn64_7.dll这个文件,有的话就OK啦;
此电脑 -> 属性 -> 高级系统设置 -> 环境变量
系统变量中找到Path;
可以看到有些环境变量安装时已经自动配置好了,这里包括之前安装anaconda时勾选红字自动添加的环境变量;
这里我们需要新添加这样几个变量,作为之前没有安装Visual Studio Integration的弥补;
有些是自己生成的,有些是需要手动添加的,我当时只添加了这3个:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite
剩余的我也放到这里,大家可以检查一下自己的环境变量,如果没有自动生成的话,大家也可以手动添加一下(一般情况下都会自动生成);
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\libnvvp
C:\Program Files (x86)\NVIDIA Corporation\PhysX\Common
C:\Program Files\NVIDIA Corporation\Nsight Compute 2019.4.0\
打开系统命令行工具,输入nvcc -V,查看CUDA版本信息(注意nvcc与-V之间有空格,V要大写);
再输入deviceQuery.exe,可以测试CUDA是否“抓到”你的显卡;
显示PASS,说明安装成功!!!
至此,可以说CUDA与cudnn已经安装成功,最艰难的一步已经跨过去啦!!!
这一步相对于前两步轻松很多,打开Anaconda Prompt
先将清华镜像源添加到默认源中,输入以下命令添加conda镜像:
(如果不使用清华源的话,从官方下载包速度会很慢,容易很容易安装不成功,所以还是推荐使用镜像进行下载安装,也可以使用中科大,阿里云等其他镜像源)
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
然后创建一个使用PyTorch的环境:
(-n后面是你要创建的环境的名称,可以自由设定,这里为方便直接使用PyTorch)
conda create -n PyTorch python=3.7
创建完成之后激活该环境:
conda activate PyTorch
如图已经进入刚才创建的环境中:
进入该环境后可以使用conda list查看当前已经安装的包,接下来进行PyTorch的安装:
输入PyTorch“生存指南”中的安装代码即可,但这里要注意去掉-c pytorch,根据提示输入y,然后进行安装;
conda install pytorch torchvision cudatoolkit=10.1
安装成功后再次使用conda list查看安装好的包,可以看到最重要的包已经安装成功!
输入python进入python编辑环境,输入以下测试代码进行测试:
import torch
print(torch.cuda.is_available())
a = torch.Tensor([1.0])
b = a.cuda()
print(b)
from torch.backends import cudnn
print(cudnn.is_acceptable(b))
同样,先创建一个使用TensorFlow的环境:
(官方文档表明目前python3.6的版本对于TensorFlow较为稳定,因此这样创建环境时python的版本设定为3.6)
conda create -n TensorFlow python=3.6
激活并进入环境后直接安装TensorFlow的GPU版本,网上很多资料都使使用pip安装(使用pip安装时也要注意添加镜像),当然也可以,我当时直接使用conda进行安装的,而且conda安装默认是当前最新版本的TensorFlow,即2.1.0;
conda install tensorflow-gpu
然后安装keras:
conda install keras
输入python进入python编辑环境,输入以下测试代码进行测试:
import tensorflow as tf
tf.test.is_gpu_available()
tf.__version__
到这里,整个深度学习环境就配置成功了,总结下来却是还是比较麻烦的,出现各种问题都有可能,希望各位小伙伴们在安装的时候务必仔细,耐心一些。
至于编程的IDE,可以选择pycharm或者jupyter等,这里相关的安装及配置就不在赘述了,大家可以自行百度一下,都比较简单。
以上安装过程中用到的安装包,如不想自己下载的或者下载速度慢的,这里我分享给大家;
链接:https://pan.baidu.com/s/1wC42j814PT5b1cAJXo2G8w
提取码:pzsx
整个安装过程中,我参考了如下资料:
https://zhuanlan.zhihu.com/p/59031211
https://blog.csdn.net/weixin_40802676/article/details/94753951
https://blog.csdn.net/weixin_44170512/article/details/103990592
https://www.bilibili.com/read/cv2425102
第一次写博客,有些地方比啰嗦,如果有不足之处请及时指出,谢谢大家!!!