ubuntu18.04配置深度学习环境tensorflow-gpu(CUDA9.0+CUDNN7.4+Tensorflow1.9.0)

一、硬件配置

在安装之前最好先检查自己的显卡是否支持GPU。
内存:8G
处理器:Intel® Core™ i5-7500 CPU @ 3.40GHz × 4
显卡:GeForce GT 730/PCIe/SSE2
操作系统类型:64位


二、安装

安装参照链接(https://zhuanlan.zhihu.com/p/50302396),非常感谢黄大佬的分享,参照以上链接安装基本没问题。
本人一开始错以root用户安装,导致后面在普通用户环境下“他import tensorflow as tf”出现错误

Traceback (most recent call last):
File "", line 1, in
ModuleNotFoundError: No module named 'tensorflow'
以及错误
ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
Failed to load the native TensorFlow runtime.

后来是改到普通用户环境下重新执行安装步骤解决问题。

具体安装步骤如下:

1. 英伟达显卡驱动安装

默认安装的显卡驱动不是英伟达的驱动,所以先把旧得驱动删除掉。

sudo apt-get purge nvidia*

禁止自带的nouveau nvidia驱动

sudo vim /etc/modprobe.d/blacklist-nouveau.conf # 打开配置文件

填写禁止配置的内容:

blacklist nouveau
options nouveau modeset=0

更新配置文件,

sudo update-initramfs -u

添加Graphic Drivers PPA

  1. sudo add-apt-repository ppa:graphics-drivers/ppa
  1. sudo apt-get update

查看合适的驱动版本:

ubuntu-drivers devices

ubuntu18.04配置深度学习环境tensorflow-gpu(CUDA9.0+CUDNN7.4+Tensorflow1.9.0)_第1张图片
image.png

从图中可以看出可以选择的驱动版本,在这里我选择的版本是396。通过如下命令进行安装:安装完后需要进行重启。

1 # 安装
2 sudo apt-get install nvidia-driver-396
3 # 重启
4 sudo reboot

安装完后,通过如下命令检测是否安装成功,如果成功会显示如下图所示。

sudo nvidia-smi

ubuntu18.04配置深度学习环境tensorflow-gpu(CUDA9.0+CUDNN7.4+Tensorflow1.9.0)_第2张图片
image.png

sudo nvidia-settings

ubuntu18.04配置深度学习环境tensorflow-gpu(CUDA9.0+CUDNN7.4+Tensorflow1.9.0)_第3张图片
image.png

完成显卡驱动的安装。


2. cuda 9.0 安装

2.1 下载文件

首先在官网上下载run 文件,如图所示,选择合适run文件。

ubuntu18.04配置深度学习环境tensorflow-gpu(CUDA9.0+CUDNN7.4+Tensorflow1.9.0)_第4张图片
image.png

同时下载4个Patch

2.2 安装依赖库

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

2.3 降低gcc、g++的版本

g++ --version # 查看版本

安装指定版本

  1. sudo apt-get install gcc-5
  2. sudo apt-get install g++-5

通过命令替换掉之前的版本:

  1. sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
  2. sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

最后记得再次查看版本是否修改成功。

2.4 安装cuda

进入下载目录后,依次执行命令:
注意:在安装过程中会提示是否需要安装显卡驱动,在这里要选择n,其他的选择y或者回车键进行安装:

  1. sudo sh cuda_9.0.176_384.81_linux.run
  2. sudo sh cuda_9.0.176.1_linux.run
  3. sudo sh cuda_9.0.176.2_linux.run
  4. sudo sh cuda_9.0.176.3_linux.run
  5. sudo sh cuda_9.0.176.4_linux.run

在~/.bashrc 中设置环境变量:

sudo vi ~/.bashrc

在最后添加:

export PATH=/usr/local/cuda-9.0/bin{PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64{LD_LIBRARY_PATH}}

运行

source ~/.bashrc

重启后,测试CUDA是否成功

第一步,进入例子文件
cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
第二步,执行make命令
sudo make
第三步
./deviceQuery

如果结果有GPU的信息,说明安装成功。


3. 安装CUDNN

下载链接: 官网

需要登录,同意后才能下载。
Download cuDNN v7.4.1(Nov 8, 2018), for CUDA 9.0 --cuDNNLibrary for Linux
下载时候保存为:cudnn-9.0-linux-x64-v7.4.1.5.tgz
进入下载目录,并执行以下命令:

  1. tar -zxvf cudnn-9.0-linux-x64-v7.4.1.5.tgz
  2. sudo cp cuda/include/cudnn.h /usr/local/cuda/include
  3. sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
  4. sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

没有报错就是全部安装完成了。


4. 安装anaconda

1. 下载地址:https://www.anaconda.com/download/

这里下载的是Python 3.7 64bit 的Anaconda3-5.3.0-Linux-x86_64.sh,首先进入下载目录i,直接安装即可。

bash Anaconda3-5.3.0-Linux-x86_64.sh

2. 更改pip和conda为国内的源

A. 更改pip的源为阿里云:

mkdir ~/.pip

cat > ~/.pip/pip.conf << EOF
[global]
trusted-host=mirrors.aliyun.com
index-url=https://mirrors.aliyun.com/pypi/simple/
EOF

B. 更改conda的源为清华大学:

  1. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  2. conda config --set show_channel_urls yes

3. 在Anaconda中安装Python3.6的虚拟环境

conda create --name tensorflow python=3.6 #创建tensorflow环境

虚拟环境主要命令:

  1. source activate tensorflow #激活tensorflow环境
  2. source deactivate tensorflow #退出tensorflow环境
  3. conda remove --name tensorflow --all #删除tensorflow环境(全部删除)

5. 安装Tensorflow GPU 1.9.0

注意:这里如果直接用pip安装的话,在ubuntu上会直接默认安装到系统默认的python环境中,而不是虚拟环境tensorflow中
激活虚拟环境tensorflow,用conda进行安装

conda install tensorflow-gpu==1.9.0

在使用conda命令时,如果遇到conda命令错误,可以在终端执行

export PATH=~/anaconda3/bin:$PATH

然后再使用conda命令进行安装

参考链接:

  1. https://zhuanlan.zhihu.com/p/50302396
  2. https://blog.csdn.net/weixin_41863685/article/details/80303963

喜欢就点个赞吧

你可能感兴趣的:(ubuntu18.04配置深度学习环境tensorflow-gpu(CUDA9.0+CUDNN7.4+Tensorflow1.9.0))