ubuntu下安装tensorflow-gpu教程以及遇到的一些问题

很早之前在ubuntu下安装tensorflow就遇到了各种问题,当时网上都没什么教程,基本上完全靠自己摸索下来的,所以当时粗略的写了一个文档记录一下步骤,现在把他上传到CSDN里,有什么问题欢迎留言。

1、u盘安装ubuntu18.04,重启时进入BIOS,关闭安全启动模式,若主板不支持UFEI模式则BIOS默认为关闭安全启动模式(ubuntu下安全启动模式和nvidia显卡驱动冲突)

2、开机输入密码进入系统之后禁用Nouveau:

sudo gedit /etc/modprobe.d/blacklist.conf

输入密码后在最后一行加上:

blacklist nouveau

作用是将Ubuntu自带的显卡驱动加入黑名单

Ctrl +C保存后注意此时还需执行以下命令使禁用 nouveau 真正生效终端输入 :

sudo update-initramfs -u

3、sudo ubuntu-drivers autoinstall 安装显卡驱动

重启

4、重启之后 nvidia-smi 查看显卡信息

5、显卡驱动安装完毕之后要对GCC降级,

sudo add-apt-repository ppa:ubuntu-toolchain-r/test
sudo apt-get update

如果提示未安装,还需要先安装它的包:

sudo apt-get install software-properties-common

sudo apt-get upgrade

sudo apt-get install gcc-4.8 g+±4.8

装完后进入到/usr/bin目录下

cd /usr/bin

ls -l gcc*

会显示以下结果

lrwxrwxrwx 1 root root 7th May 16 18:16 /usr/bin/gcc -> gcc-7.3

发现gcc链接到gcc-7.0, 需要将它改为链接到gcc-4.8,方法如下:

sudo mv gcc gcc.bak #备份
sudo ln -s gcc-4.8 gcc #重新链接

同理,对g++也做同样的修改:

ls -l g++*

lrwxrwxrwx 1 root root 7th May 15:17 g++ -> g++-7.3

需要将g++链接改为g+±4.8:

sudo mv g++ g++.bak
sudo ln -s g++-4.8 g++

再查看gcc和g++版本号:

均显示gcc version 4.8 ,说明gcc 4.8安装成功。

gcc --version
g++ --version

6、选择cuda版本 注意CUDA的版本要和TENSORFLOW版本对应

7、安装CUDA和cuDNN
下载cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb
cd /home/a6029/下载/

sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb

sudo aptitude update

sudo aptitude install cuda

设置环境变量

gedit .bashrc

输入:

export PATH=/usr/local/cuda-8.0/bin: P A T H e x p o r t L D L I B R A R Y P A T H = / u s r / l o c a l / c u d a − 8.0 / b i n / l i b 64 : PATH export LD_LIBRARY_PATH=/usr/local/cuda-8.0/bin/lib64: PATHexportLDLIBRARYPATH=/usr/local/cuda8.0/bin/lib64:LD_LIBRARY_PATH

之后终端中输入:

source ~/.bashrc

之后再输入:

nvcc --version

查看CUDA版本

下载对应的cudnn

sudo tar -xzvf ./cudnn-8.0-linux-x64-v5.1.tgz

设置环境变量

sudo cp cuDNN/cuda/include/cudnn.h /usr/local/cuda-8.0/include
sudo cp cuDNN/cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda-8.0/lib64/libcudnn*

8、下载并安装anaconda

bash ./Anaconda3-5.0.0-Linux-x86_64.sh

设置环境变量

sudo gedit ~/.bashrc

在文末 加入

export PATH="/home/用户名/anaconda3/bin:$PATH"

重启

9、通过Anaconda安装Tensorflow

首先需要新建一个conda环境,命名为tensorflow-gpu:

conda create -n tensorflow-gpu python=3.5

要注意Python版本需要写对。

待创建完成之后可以使用以下命令管理这个环境:

source activate tensorflow-gpu #激活环境
source deactivate tensorflow-gpu #关闭环境

在激活环境的情况下输入以下命令进行安装tensorflow的gpu版本:

pip install tensorflow-gpu==1.2.0

之后等候安装即可。安装完后会提示pip的版本有点低,需要更新,安装它给的提示命令进行更新即可。

接着,在环境激活的情况下,输入

python

然后输入

import tensorflow as tf

如果不报错的话,说明安装成功。

你可能感兴趣的:(深度学习)