之前一直用Ubuntu16.04的系统,也写过一篇如何在Ubuntu16.04系统上安装tensorflow-gpu的博客,但是自己前几天手贱把系统更新到了Ubuntu18.04,照常的打开Pycharm,输入import tensorflow as tf
,发现没卵用了。估计是NVIDIA的驱动升级了,Cuda不能用了,而且Ubuntu16.04系统默认python3.5
,Ubuntu18.04系统默认python3.6
,这么看来也只有重新装Tensorflow了。
还是跟之前的安装步骤类似:
检查NVIDIA驱动的型号
检查gcc版本
安装对应版本的Cuda
修改环境变量
安装对应版本的Cudnn
安装Tensorflow-gpu
下面将对上述步骤详细说明:
1)查看NVIDIA驱动型号
可以在终端输入nvidia-smi
查看具体型号,如果系统有安装NVIDIA驱动,则会显示驱动的型号等信息。
如果系统没有安装NVIDIA驱动或者驱动版本较低,可以通过在终端输入ubuntu-drivers devices
查看系统为你推荐的驱动型号。
可以看到系统推荐安装的NVIDIA-410
的驱动,为了防止Tensorflow不能支持过新的驱动,我最后安装了NVIDIA-396
型号的驱动。在终端输入
sudo apt install nvidia-driver-396
中间如果提醒有依赖包未安装,则先安装依赖包再返回安装驱动,其余根据提示进行安装即可。别忘了安装之后在终端输入nvidia-smi
检查是否安装成功。
这里贴一张官网Cuda版本对应NVIDIA驱动型号的示意图。
从图中可以看到,NVIDIA-396
可以安装Cuda-9.2
,但实际中基于Cuda9.2安装Tensorflow一直未成功(可能是我有什么地方没有装正确),所以最后我很保险的选择了Cuda-9.0
。
2)降级gcc
由于Cuda-9.0
只支持gcc-6.0
以下的版本,而Ubuntu18.04系统默认安装的gcc-7.3
版本(可以在终端输入gcc --version
查看系统安装的gcc版本),所以首先需要降级为gcc-5
版本。
- 首先需要安装
gcc-5
在终端输入:
sudo apt install gcc-5
sudo apt install g++-5
- 链接至
gcc-5
版本
在终端输入:
cd /usr/bin
sudo mv gcc gcc.bak #备份
sudo ln -s gcc-5 gcc
sudo mv g++ g++.bak
sudo ln -s g++-5 g++
通过gcc --version
查看系统的gcc版本是否已更改
3)安装对应版本的Cuda
从官网下载Cuda-9.0
的run文件安装包,注意官网的主文件下面还有四个更新包,一并下载下来。然后在终端输入:
- 基础安装包
sudo sh cuda_9.0.176.384.81_linux.run --override
在安装过程中,会出现几个是否选装和安装位置的选项,其中第二个不需要安装NVIDIA驱动(系统已安装),其余都选择yes或者敲回车。
- 四个更新包
sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
sudo sh cuda_9.0.176.3_linux.run
sudo sh cuda_9.0.176.4_linux.run
分别安装每个更新包。
4)修改环境变量
安装完Cuda-9.0
后,还需要将其添加至系统环境变量。
打开.bashrc
文件:
sudo gedit .bashrc
在文本的最后添加以下代码:
export PATH="$PATH:/usr/local/cuda-9.0/bin"
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64"
保存文本后,更新系统环境变量:
source .bashrc
至此,可以通过在终端输入nvcc -V
,检查Cuda-9.0
是否安装成功。
5)安装Cuda对应的Cudnn版本
安装完Cuda之后,继续安装与Cuda-9.0
版本对应的Cudnn。去官网下载三个deb安装包。
按照下面的顺序分别安装三个deb包。
sudo dpkg -i 'Runtime Library.deb'
sudo dpkg -i 'Developer Library.deb'
sudo dpkg -i 'Code Sample and User Guide.deb'
sudo apt-get update
安装完之后可以检查是否安装成功,在终端输入下面代码,如果安装成功会显示Test Passed
字样。
cd /usr/src/cudnn_samples_v7/mnistCUDNN
sudo make
./mnistCUDNN
6)安装tensorflow-gpu
直接通过pip安装Tensorflow-gpu
,默认下载的是最新的1.10版本。
sudo pip3 install tensorflow-gpu
7)卸载Cuda和Cudnn
- 卸载
Cuda-9.0
在终端输入:
cd /usr/local/cuda-9.0/bin
sudo ./uninstall_cuda_9.0.pl
- 卸载
Cudnn-7.1.3
在终端输入:
sudo apt remove cudnn*