Ubuntu18.0 下 Tensorflow-GPU安装

前言: 因为要跑比赛,要用到GPU,所以决定安装tensorflow-gpu版本,首先感谢广大博客网友的无私奉献,当然每个人遇到的情况不一样,会有一些坑,因为显卡驱动和tensorflow一直在更新,所以不同版本的安装方式也不一样,本文配置如下

  •   x86_64
  •   Ubuntu 18.0
  •   python2.7
  •   GPU:Quadro k600 / Tesla k20c
  •   cuda-10.0
  •   cudnn runtime+cudnn developer
  •   tensorflow-gpu-1.12.1

确认电脑显卡支持cuda

$ lspci | grep -i nvidia

 此时你的电脑会显示显卡个数和型号

$ lspci | grep -i nvidia
02:00.0 VGA compatible controller: NVIDIA Corporation GK107GL [Quadro K600] (rev a1)
02:00.1 Audio device: NVIDIA Corporation GK107 HDMI Audio Controller (rev a1)
03:00.0 3D controller: NVIDIA Corporation GK110GL [Tesla K20c] (rev a1)

然后去NVIDIA官网查看对应型号及其性能,性能大于等于3.0的NVIDIA的显卡
(不知道自己的NVIDIA GPU的计算性能的可以在这里查到: https://developer.nvidia.com/cuda-gpus

查看电脑系统

$ uname -m && cat /etc/*release

确定gcc已经安装

$ gcc --version

确定kernel版本

$ uname -r

安装kernel

$ sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

以上内容都准备好的话就可以安装了cuda了

 

 

 

到官网下载对应版本https://developer.nvidia.com/cuda-downloads

Ubuntu18.0 下 Tensorflow-GPU安装_第1张图片

定位到下载的文件夹下,运行官网提示命令

此时系统会进行安装,但是会要求你读很多文档,此时需要一直按ENTER键,直到100%。然后会有以下提示你输入的内容

Ubuntu18.0 下 Tensorflow-GPU安装_第2张图片

此时注意:如果你已经安装了显卡驱动,则

  • Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?
  • (y)es/(n)o/(q)uit: n

     否则选择y

另外红色方框里的也选择n,不要安装OpenGL

其它选项均选择y。

 

添加环境变量

安装好CUDA后会提醒你添加路径,以系统提醒为准

$ sudo vim ~/.bashrc

在 ~/.bashrc 的最后添加

  1. export PATH=$PATH:/usr/local/cuda-10.0/bin
  2. export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
  3. export CUDA_HOME=/usr/local/cuda

其中,

前 2 个(PATH, LD_LIBRARY_PATH) 是 CUDA 官网安装文档中建议的变量。

第 3 个(CUDA_HOME)是 tensorflow-GPU 版本要求的变量。

配置完环境变量之后,一定要更新一下,否则不能立即生效。也可以通过重启电脑使得环境变量生效。

  1. $ source ~/.bashrc

检查驱动安装情况

$ nvidia-smi

Thu Dec 20 10:06:35 2018       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.48                 Driver Version: 410.48                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Quadro K600         Off  | 00000000:02:00.0  On |                  N/A |
| 25%   52C    P8    N/A /  N/A |    176MiB /   976MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  Tesla K20c          Off  | 00000000:03:00.0 Off |                    0 |
| 31%   43C    P8    26W / 225W |      0MiB /  4743MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0       995      G   /usr/lib/xorg/Xorg                            18MiB |
|    0      1327      G   /usr/lib/xorg/Xorg                           156MiB |
+-----------------------------------------------------------------------------+

 

如果要卸装:

To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.0/bin 

然后 apt purge nvidia*

 

安装深度学习库cuDNN

首先到官网下载cuDNN5.1 ( https://developer.nvidia.com/cudnn ),需要先在网站注册,然后下载,下载的是deb格式

Ubuntu18.0 下 Tensorflow-GPU安装_第3张图片

 

讲道理找到对应版本直接下载,定位到下载目录安装即可

$sudo dpkg -i cuDNN Developer Library.xxxx.deb

但是可能安装不成功,出现如下问题:

libcudnn7 can't open or find

此时,解决办法是,先安装运行版本,再安装开发版本即

$sudo dpkg -i cuDNN Runtime Library.xxxx.deb

$sudo dpkg -i cuDNN Developer Library.xxxx.deb

 最后一步:安装TensorFlow的GPU版本

$ sudo pip install tensorflow-gpu

此命令默认安装的是1.5版本,可能和cuda不匹配,import tensorflow 可能出错,更新到最新版本即可:

$ pip install --upgrade tensorflow 

 此时就安装成功了,测试一下:

python

import tensorflow

如果没出错就成功了。

 

我在安装过程中,走了一些弯路,电脑差点崩溃,无法开机。但保持耐心,办法总比问题多,有问题可以留言

 

 

 

 

你可能感兴趣的:(tensorflow)