[安装一] ubuntu16.04-LTS下安装Tensorflow-gpu

20180603qzd
(注:显卡驱动版本:396.24- cuda版本:9.1- cudnn版本:7.1 要对应)

一 显卡驱动

  • 查看GPU型号

lspci | grep -i nvidia

  • 查看NVIDIA驱动版本

cat /proc/driver/nvidia/version

  • 查看CUDA toolkit releaseNote,发现CUDA版本对显卡驱动版本有要求:

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

[安装一] ubuntu16.04-LTS下安装Tensorflow-gpu_第1张图片
image

大家可以通过此网站获取自己显卡的最新驱动https://www.nvidia.cn/Download/index.aspx?lang=cn

二 禁止集成的nouveau驱动

  • Ubuntu系统集成的显卡驱动程序是nouveau,它是第三方为NVIDIA开发的开源驱动,我们需要先将其屏蔽才能安装NVIDIA官方驱动。

  • 将驱动添加到黑名单blacklist.conf中,但是由于该文件的属性不允许修改。所以需要先修改文件属性。

  • 查看属性

$sudo ls -lh /etc/modprobe.d/blacklist.conf

  • 修改属性

$sudo chmod 666 /etc/modprobe.d/blacklist.conf

用gedit编辑器打开

$sudo gedit /etc/modprobe.d/blacklist.conf

在该文件后添加一下几行:

blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb

三 安装显卡驱动

  • 卸载原驱动

apt-get remove --purge nvidia-*

  • 先按Ctrl + Alt + F1到控制台,关闭当前图形环境

$sudo service lightdm stop

  • 再安装驱动程序

sudo ./NVIDIA-Linux-x86_64-xxx.run -no-x-check -no-nouveau-check -no-opengl-files

  • 最后重新启动图形环境

$sudo service lightdm start

  • 查看显卡驱动版本(检查)

$cat /proc/driver/nvidia/version

  • 配置环境变量

sudo gedit ~/.bashrc
加入:
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:LD_LIBRARY_PATH

四 安装cuda9.1

(装cuda的时候不要在装驱动了)

  1. sudo sh ./cuda_9.1.85_3

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 387.26? 要选否。
安装默认位置: /usr/local/cuda-9.1
samples位置: /home/admin1
具体选项如下:

Description
This package includes over 100+ CUDA examples that demonstrate
various CUDA programming principles, and efficient CUDA
implementation of algorithms in specific application domains.
The NVIDIA CUDA Samples License Agreement is available in
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y
Enter CUDA Samples Location
[ default is /home/c302 ]:
Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...
Installing the CUDA Samples in /home/c302 ...
Copying samples to /home/c302/NVIDIA_CUDA-8.0_Samples now...
Finished copying samples.

  1. 配置CUDA环境变量

sudo gedit ~/.bashrc
加入:
export PATH=/usr/local/cuda/bin:LD_LIBRARY_PATH
时配置生效:
source ~/.bashrc

  1. 检查cuda是否安装成功
  • 检查路径 ~/dev 下 有无存在名为 nvidia* (以nvidia开头)的多个文件(device files) ,若无,安装错误.
  • 检查 CUDA Toolkit是否安装成功
    终端输入 :nvcc -V
  • 编译samples例子
    进入到Samples安装目录,然后在该目录下终端输入make,等待十来分钟。
  • 编译完成后测试
    可以在Samples里面找到bin/x86_64/linux/release/目录,并切换到该目录
    运行deviceQuery程序,sudo ./deviceQuery
    查看输出结果,重点关注最后一行,Pass表示通过测试
    运行bandwidthTest程序,sudo ./bandwidthTest
    查看输出结果,显示结果为PASS表示通过测试

五 安装cudnn7.1

  • 下载cudnn-9.1-linux-x64-v7.1
  • 安装

sudo tar -xzvf cudnn-9.1-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

六 安装Tensorflow-gpu1.?

pip install tensorflow-gpu==1.?
tensorflow gpu版本总结传送门:https://www.jianshu.com/p/d1bb4c694dc0


终结撒花!!!

所以还是重新安装cuda9.0及相对应的cudnn吧。哭三分钟先!!!!!!!
完结。

你可能感兴趣的:([安装一] ubuntu16.04-LTS下安装Tensorflow-gpu)