TensorFlow-gpu在windows上的开发环境搭建

Step1:Nvidia显卡驱动安装

官网下载系统版本一致的显卡驱动,针对安装失败的情况,需要退出杀毒软件,重新安装。

image.png

成功安装后,桌面电脑->右击->属性->设备管理->显示设备,可以看到NVIDIA TITAN Xp上面没有感叹号

image.png

Step2:安装VS2017+Windows10 SDK**

安装vs2017后通过Visual Studio Installer修改安装

Step3:安装CUDA10.0+cuDNN

Cuda的最新版本为cuda10.1, 一开始我安装的是最新的cuda,但是安装完TensorFlow-GPU后,出现了TensorFlow模块导入失败的错误(faile to load to load native tensorflow runtime)。卸载cuda10.1,重新安装cuda10.0此问题可解决,此问题的原因可能是TensorFlow-gpu版本不支持最新版本的CUDA。

Nvidia官网选择下载系统版本一致的CUDA版本

image.png

安装完成,添加以下环境变量。

image.png

安装完成后,在命令行输入nvcc –v出现如下信息,则cuda安装成功。

image.png

Step4:Python环境安装

Anaconda是一个Python的科学计算发行版,包含了超过300个流行的用于科学、数学、工程和数据分析的Python Packages。由于Python有2和3两个版本,因此Anaconda也在Python2和Python3的基础上推出了两个发行版,即Anaconda2Anaconda3

针对开源资料要么使用Anaconda2就是Anaconda3,所以电脑上很有可能同时使用Anaconda2和Anaconda3两个版本,因此需要同时安装两个版本。一般的使用场景是以其中一个版本为主,另外一个版本为辅,因此只需要达到能方便的切换到备用版本,且备用版本的pip等命令能正常使用即可。

操作步骤


  1. 首先安装主版本,选择Anaconda2,按照正常步骤安装即可,这里假定安装目录为D:\Anaconda2。
image.png
  1. 在这一步打上那两个勾。
image.png

第一个选项是将安装目录加入到系统的PATH环境变量中,以后在CMD中便可以直接用python命令启动python。 第二个选项是让其他IDE能够检测到Anaconda2并将Anaconda2作为默认的Python 2.7。

  1. 安装好Anaconda2之后,再安装Anaconda3,这里Anaconda3的安装目录必须选在D:\Anaconda2\envs子目录下,如图所示,最后的”py3”可以自己另取。
image.png
  1. 这里取消掉那两个勾(按照字面意思理解,打上第二个勾应该是没有影响的。至于第一个选项,由于之前已经把Anaconda2添加到系统PATH路径下了,因此再把Anaconda3添加进去,由于顺序在Anaconda2的后面,几乎是没有作用的,所以这里没有勾上)。
image.png
  1. 安装完成之后,在CMD里面直接输入python会启动Python2,而使用activate py3(py3即之前Python3安装目录文件夹的名字)命令之后,再使用python即可切换至Python3,如下图所示。使用activate py3命令之后,在命令行前面会出现一个[py3]标记,此时使用任何的python命令都是在Python3下进行的。使用deactivate命令可取消激活Python3
image.png

Step5:Tensorflow安装

  1. 这里安装基于python3.7的环境
image.png
  1. 安装pip3
image.png
  1. 安装虚拟环境,Python虚拟环境用于将软件包安装与系统隔离开来
image.png
  1. 安装支持GPU的TensorFlow版本
pip3 install –upgrade tensorflow-gpu
image.png

安装完成后,输入以下两行验证TensorFlow-gpu是否能正常运行

import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
image.png

红线标识的第一行是一个警告,可以忽略;

红线标识的第二行是因为CUDA未添加环境变量导致,按cuda部分安装说明添加环境变量,可以解决该问题;

红线标识的第三行提示显卡设备映射问题,一开始我一直怀疑驱动版本问题,重复安装了几遍驱动都不行,后来通过重新回到第一步找原因,发现显卡设备未正常工作,开始怀疑硬件原因,重新动了动两块显卡及显卡间的搭桥。重新开机,桌面电脑右击属性->设备管理->显示设备两块显卡并没有感叹号。

而且运行CUDA安装目录下的deviceQuery.exe,能正常显示两块显卡设备信息。

image.png

再次使用以下这两行,也能显示正常运行:

import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
image.png

至此,TensorFlow-gpu在windows上的开发环境搭建彻底完成

需注意事项:

  1. 每安装完一项,验证一项是否安装成功,确保后徐的环境搭建顺利;

  2. 注意TensorFlow和Cuda版本的兼容性问题;

  3. 注意显卡驱动和显卡的兼容性问题(官网下载相应显卡的最新驱动,安装的时候采用执行清洁安装,一般不会出现任何问题)。

你可能感兴趣的:(TensorFlow-gpu在windows上的开发环境搭建)