前言: 因为要跑比赛,要用到GPU,所以决定安装tensorflow-gpu版本,首先感谢广大博客网友的无私奉献,当然每个人遇到的情况不一样,会有一些坑,因为显卡驱动和tensorflow一直在更新,所以不同版本的安装方式也不一样,本文配置如下
$ lspci | grep -i nvidia
此时你的电脑会显示显卡个数和型号
$ lspci | grep -i nvidia
02:00.0 VGA compatible controller: NVIDIA Corporation GK107GL [Quadro K600] (rev a1)
02:00.1 Audio device: NVIDIA Corporation GK107 HDMI Audio Controller (rev a1)
03:00.0 3D controller: NVIDIA Corporation GK110GL [Tesla K20c] (rev a1)
然后去NVIDIA官网查看对应型号及其性能,性能大于等于3.0的NVIDIA的显卡
(不知道自己的NVIDIA GPU的计算性能的可以在这里查到: https://developer.nvidia.com/cuda-gpus )
$ uname -m && cat /etc/*release
$ gcc --version
$ uname -r
$ sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
以上内容都准备好的话就可以安装了cuda了
到官网下载对应版本https://developer.nvidia.com/cuda-downloads
定位到下载的文件夹下,运行官网提示命令
此时系统会进行安装,但是会要求你读很多文档,此时需要一直按ENTER键,直到100%。然后会有以下提示你输入的内容
此时注意:如果你已经安装了显卡驱动,则
否则选择y
另外红色方框里的也选择n,不要安装OpenGL
其它选项均选择y。
安装好CUDA后会提醒你添加路径,以系统提醒为准
$ sudo vim ~/.bashrc
在 ~/.bashrc 的最后添加
其中,
前 2 个(PATH, LD_LIBRARY_PATH) 是 CUDA 官网安装文档中建议的变量。
第 3 个(CUDA_HOME)是 tensorflow-GPU 版本要求的变量。
配置完环境变量之后,一定要更新一下,否则不能立即生效。也可以通过重启电脑使得环境变量生效。
$ nvidia-smi
Thu Dec 20 10:06:35 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.48 Driver Version: 410.48 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Quadro K600 Off | 00000000:02:00.0 On | N/A |
| 25% 52C P8 N/A / N/A | 176MiB / 976MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla K20c Off | 00000000:03:00.0 Off | 0 |
| 31% 43C P8 26W / 225W | 0MiB / 4743MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 995 G /usr/lib/xorg/Xorg 18MiB |
| 0 1327 G /usr/lib/xorg/Xorg 156MiB |
+-----------------------------------------------------------------------------+
如果要卸装:
To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.0/bin
然后 apt purge nvidia*
安装深度学习库cuDNN
首先到官网下载cuDNN5.1 ( https://developer.nvidia.com/cudnn ),需要先在网站注册,然后下载,下载的是deb格式
讲道理找到对应版本直接下载,定位到下载目录安装即可
$sudo dpkg -i cuDNN Developer Library.xxxx.deb
但是可能安装不成功,出现如下问题:
libcudnn7 can't open or find
此时,解决办法是,先安装运行版本,再安装开发版本即
$sudo dpkg -i cuDNN Runtime Library.xxxx.deb
$sudo dpkg -i cuDNN Developer Library.xxxx.deb
最后一步:安装TensorFlow的GPU版本
$ sudo pip install tensorflow-gpu
此命令默认安装的是1.5版本,可能和cuda不匹配,import tensorflow 可能出错,更新到最新版本即可:
$ pip install --upgrade tensorflow
此时就安装成功了,测试一下:
python
import tensorflow
如果没出错就成功了。
我在安装过程中,走了一些弯路,电脑差点崩溃,无法开机。但保持耐心,办法总比问题多,有问题可以留言