手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置

手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow深度学习环境配置

本文用于配置深度学习环境。
                              _by 依雪观天澜
  工欲善其事必先利其器,想要使用深度学习,首先要配置好深度学习环境,下面首先对深度学习环境进行简介。
  TensorFlow,theano,Keras,pytorch都是比较常用深度学习框架。目前Keras已经被TensorFlow收录,添加到TensorFlow 中,成为其默认的框架,成为TensorFlow官方的高级API。
  深度学习框架都可以使用GPU进行硬件加速,往往可以比CPU运算快很多倍。因此如果你的显卡支持cuda的话,建议尽可能利用cuda加速模型训练。
  CUDA的本质是一个工具包,是NVIDIA推出的用于自家GPU的并行计算框架,也就是说CUDA只能在NVIDIA的GPU上运行,而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。
  cuDNN是一个SDK,是一个专门用于神经网络的加速包,注意,它跟我们的CUDA没有一一对应的关系,即每一个版本的CUDA可能有好几个版本的cuDNN与之对应,但一般有一个最新版本的cuDNN版本与CUDA对应更好。
nvidia与cuda需要满足关系:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html   (1)
cuda与cudnn需要满足关系:
https://developer.nvidia.com/rdp/cudnn-archive           (2)
cuda历史版本下载连接:
https://developer.nvidia.com/cuda-toolkit-archive          (3)
Tensorflow不同版本要求与CUDA及CUDNN版本对应关系:
https://blog.csdn.net/u013066730/article/details/88845083        (4)

根据上述的基本内容,选择自己的安装版本,有能跑深度学习显卡的可以考虑安装GPU加速版本。

1.安装GPU版本首先查看自己的显卡支持的版本,查看自己驱动版本的方式如下:
打开cmd,使用cd命令进入:
cd C:\Program Files\NVIDIA Corporation\NVSMI
使用“nvidia-smi”这个命令即可查看,如下我的版本为391.24
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第1张图片
2.进入网址,查找适合自己显卡的cuda的版本,我的电脑适合的最高版本为CUDA9.0。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第2张图片
3.进入网址下载需要的CUDA,并选择自己的系统;
图3
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第3张图片
4.点击download,进行本地下载,下载完成后以管理员身份打开,还有要退出360等安全软件(否则会遇到奇形怪状的错误);
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第4张图片
5.设置好安装路径,点击ok,然后等待安装包解压一会;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第5张图片
6.点击同意并继续,如果电脑里面没有vs,会出现下图。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第6张图片
7.Cuda提示,安装还需要visual studio的支持,所以需要安装vs,此处不做详细说明了(自主安装vs),有vs的忽略此步骤;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第7张图片
8.然后就是漫长的等待过程。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第8张图片
9.加载完之后,点击下一步,点击关闭,CUDA下载完毕。
10.检查CUDA是否安装成功,在cmd指令中输入nvcc -V;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第9张图片
11.出现了CUDA版本号,则CUDA安装成功。
此时显卡驱动版本也变为CUDA支持的最低版本,如需升级,可再自行升级。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第10张图片
12.下一步准备安装cuda对应的cudnn,进入网址2进行查询。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第11张图片
13.选择合适的cudnn,此处本人选择的是7.6.5,然后选择自己电脑的系统对应的选项,点击即可下载,(下载的时候需要注册nvidia账号,自行注册,此处不再讲解);
14.下载完成后将压缩包解压,包内包含三个问价夹。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第12张图片
15.将上述红框内文件复制到CUDA文件夹下,CUDA默认目录通常为C:\Program Files\NVIDIA GPU Computing Toolkit;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第13张图片
16.上述步骤操作完成后,能够看到CUDA文件所在路径已经添加到了系统环境之下;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第14张图片
17.下面检查cudnn是否安装成功,cmd指令进入文件cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite下,分别输入bandwidthTest.exe和deviceQuery.exe。出现下图:
输入bandwidthTest.exe时:
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第15张图片
出现 result = PASS 表示没有问题。

输入deviceQuery.exe时:
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第16张图片
出现 result = PASS 表示没有问题。

至此cudnn安装完毕,使用GPU训练的加速工具,已经全部安装完毕。
下面开始深度学习框架(工具包的安装)

深度学习框架有很多,版本也各种各样,编译不同代码时常常用到不同的框架以及不同版本,因此为不同的版本搭建自己的环境。本文以tensorflow为例:
18.搭建一个新的虚拟环境,进入cmd指令中,输入conda create -n tensorflow python=3.6;
图18
蓝色框内tensorflow1.10 为定义的虚拟环境名称,红色框内为虚拟环境内对应的python版本。

19.然后会加载预安装内容,输入y确认安装;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第17张图片
20.安装完成后如图所示;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第18张图片
conda activate tensorflow指令表示激活名为tensorflow的虚拟环境
conda deactivate指令表示关闭虚拟环境

21.查看虚拟环境:新建的虚拟环境位于anaconda安装包内,具体路径为C:\ProgramData\Anaconda3\envs,可以看到文件夹下有一个名为tensorflow的文件夹,即为新建的虚拟环境;
22.在cmd指令中激活刚刚建立好的虚拟环境;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第19张图片
图中红框内表示此时输入的指令正处于tensorflow这个虚拟环境中。
23.安装tensorflow工具包;
图22
此处采用清华镜像有效提高安装速度。
pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install tensorflow_gpu -i https://pypi.tuna.tsinghua.edu.cn/simple
通常上述指令安装的均是最新版本,选择指定版本为:
pip install tensorflow_gpu==1.11 -i https://pypi.tuna.tsinghua.edu.cn/simple

其他框架同上,需要注意tensorflow1.0以上版本与tensorflow2.0以上版本有很大差别,安装需要注意根据自已代码选择合适版本。

24.Pycharm中使用配置好的深度学习环境;
File-setting-project:(文件名)-python interprefer-add-existing-选择新建的环境路径。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第20张图片
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第21张图片
在Select Python interprefer界面可能会出现找不到Anaconda路径的情况,是因为Anaconda安装在C盘的隐藏文件夹下,点击界面上眼睛的符号,就可以展示出隐藏文件夹。
选择刚刚使用conda指令创建好的虚拟环境(envs)下python.exe解释器。
注:在Anaconda3文件夹下有一个Python解释器,此解释器处于base环境下的解释器,创建的虚拟环境的解释器均在(*\Anaconda3\envs\)文件夹内。
本人路径D:\ProgramData\Anaconda3\envs\tensorflow\python.exe

25.安装成功测试。
打开pycharm,创建.py文件,并输入:

import tensorflow as tf


a = tf.test.is_gpu_available()
print(a)
import tensorflow as tf


a = tf.test.is_gpu_available()
print(a)

手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置_第22张图片
当出现Ture字样,则表示tensorflow已经安装成功,且可以使用GPU对数据进行训练,False表示不能使用GPU进行训练,此时需要检查 Python cuda cudnn 显卡驱动号 以及tensorflow——gpu的版本对应关系。
对于使用CPU训练来说,只要能import tensorflow不报错,则表示,tensorflow安装成功。

你可能感兴趣的:(环境配置,tensorflow,python,深度学习)