Windows10创建Tensorflow-GPU环境(简单详细)

查看自己显卡支持的最高CUDA配置

打开NVIDIA控制面板,找不到的话在搜索NVIDIA Control Panel。
点击系统信息——组件,此处显示CUDA 11.5.125,这里的CUDA版本号指的是你的显卡支持的最高CUDA版本,需要下载不高于此版本的CUDA。
Windows10创建Tensorflow-GPU环境(简单详细)_第1张图片

确定tensorflow,keras,CUDA,cuDNN对应版本

tensorflow,CUDA,cudnn对应版本号查看
这里我选择的是TensorFlow=2.3.0,keras=2.4.3,CUDA=10.1,cuDNN=7.6.5

下载CUDA和cudnn

CUDA所有版本下载链接
Windows10创建Tensorflow-GPU环境(简单详细)_第2张图片

这里我选择的是CUDA Toolkit 10.1 update2 (Aug 2019), Versioned Online Documentation

cuDNN所有版本下载链接
Windows10创建Tensorflow-GPU环境(简单详细)_第3张图片

这里我选择的是Download cuDNN v7.6.5 (November 5th, 2019), for CUDA 10.1
Tips:下载cuDNN需要登录英伟达账号。

安装CUDA和cuDNN

安装CUDA

将安装包下载到自己指定的位置,双击运行cuda_10.1.243_426.00_win10.exe开始安装CUDA。这里采用NVIDA推荐的模式安装(不采用自定义),直接一路无脑点击即可。

安装cuDNN

解压下载好的cuDNN,打开后有如下目录
Windows10创建Tensorflow-GPU环境(简单详细)_第4张图片
将bin,include,lib三个文件夹中的文件复制到CUDA对应的文件夹中
Windows10创建Tensorflow-GPU环境(简单详细)_第5张图片
如果你采用了推荐的无脑安装模式,那CUDA路径就如上所示在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1中。如果自定义安装的就要去自定义的文件夹中找。

验证CUDA和cuDNN是否下载成功

此时我们已经下载完了CUDA和cudnn,接下来验证是否下载成功。
打开cmd命令行:输入nvcc --version。可以看到我们已经成功下载了CUDA10.1版本。
Windows10创建Tensorflow-GPU环境(简单详细)_第6张图片
打开C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include,找到cudnn.h
Windows10创建Tensorflow-GPU环境(简单详细)_第7张图片
红框内显示的即为版本号,7.6.5。

配置环境变量

打开系统变量——选择Path编辑——新建——浏览Windows10创建Tensorflow-GPU环境(简单详细)_第8张图片
点击编辑——新建——浏览,将如下两个目录添加到环境变量即可。
在这里插入图片描述

下载tensorflow

这里推荐使用Anaconda,新建一个虚拟环境来安装tensorflow,安装时强烈建议使用pip不使用conda。因为conda下载容易有文件缺失。
如果没有添加pip清华源的话先添加一下清华源

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

使用清华源的时候记得关掉VPN,不然会有URL ERROR
激活我们的虚拟环境(env-name为自定义的虚拟环境名):

conda activate env-name

使用pip命令下载tensorflow指定版本和keras指定版本:

pip install tensorflow==2.3.0
pip install keras==2.4.3

注意,不需要pip install tensorflow-gpu,因为pip下载的tensorflow默认可以使用GPU。

验证tensorflow是否能检测到GPU

运行如下代码

import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))

输出[]为失败。
如下输出成功:
Windows10创建Tensorflow-GPU环境(简单详细)_第9张图片
这个时候就可以用GPU进行运算了!
跑一个代码看看时间:
Windows10创建Tensorflow-GPU环境(简单详细)_第10张图片
之前CPU运算时每个例子要跑4ms,GPU只要300us。
还可以从任务管理器查看GPU是否工作:
Windows10创建Tensorflow-GPU环境(简单详细)_第11张图片
如果是CPU工作的话,运行机器学习代码的时候,CPU使用率会飙到100%。

问题总结

安装不成功主要有两点:
1,tensorflow,CUDA,cuDNN版本不匹配。
2,使用conda安装了tensorflow和keras。
我遇到的主要是第二点问题。如果帮到你了点个赞再走吧QAQ。

你可能感兴趣的:(环境配置,机器学习,keras,tensorflow)