ubuntu18.04安装tensorflow-gpu==1.14.0(CUDA10.0+cuDNN7.4.1)

系统版本:ubuntu 18.04
系统架构:x86_64
nvidia driver 驱动版本:440.59
CUDA版本:10.0
cuDNN:7.4.1
gcc:4.8.5
tensorflow-gpu:1.14.0

前提

  • step1:确定是否安装了驱动:nvidia-smi
  • step2:查看gcc版本:gcc --version
    若gcc版本太高就更改版本:sudo apt-get install gcc-4.8 g++-4.8
    切换gcc版本:sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 100
    激活生效:sudo update-alternatives --config gcc
  • step3:确定GPU卡可以进行CUDA计算,并且计算力>3.5
    到nvidia官网查
  • step4:找好对应的版本:
    tensorflow版本<—>CUDA版本<—>cuDNN版本。tensorflow,CUDA,cuDNN之间有严格依赖关系,对应版本一定要对应好。
    驱动版本与CUDA有关联,CUDA要求驱动大于某个版本。

1.anaconda安装

  • step1:下载anaconda安装包
    wget https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh
  • step2:安装anaconda
    bash Anaconda3-5.0.1-Linux-x86_64.sh
  • step3:在安装过程中,一直按enter, 直至出现yes/no,输入yes
    当询问是否加入环境变量时,一定要输入yes
  • step4查看anaconda是否安装成功
    断开服务器连接,再重新连接服务器,输入python,若无报错,则证明安装成功

意外情况:若环境变量没有配置成功,需进行以下操作

(1)在终端下输入以下命令:vim ~/.bashrc 打开bashrc文件并编辑
(2)在bashrc文件后加上这一行字, PATH后加的是安装的anaconda的路径:export PATH=/home/.../bin:$PATH
(3)激活文件:source ~/.bashrc

2.安装CUDA10.0

  • step1:到官网找到对应版本
    CUDA下载网址:https://developer.nvidia.com/cuda-toolkit-archive
  • step2:下载安装
    前提:下载的cuda_10.0.130_410.48_linux.run文件为可执行文件(绿色为可执行文件),然后再执行sudo sh cuda_10.0.130_410.48_linux.run
    我这里下载后并不是可执行文件,因此修改了权限,修改权限方法如下:
# 查看文件权限
ls -l cuda_10.0.130_410.48_linux.run
# 修改文件权限
sudo chmod u=rwx,g=rw,o=r cuda_10.0.130_410.48_linux.run

安装过程一步一步来:一直enter,直到出现如下画面,输入accept,不安装驱动,安装CUDA 10.0 Toolkit,设置安装路径,不建立链接,安装Samples,设置Samples路径
ubuntu18.04安装tensorflow-gpu==1.14.0(CUDA10.0+cuDNN7.4.1)_第1张图片
最后安装完成的画面:
ubuntu18.04安装tensorflow-gpu==1.14.0(CUDA10.0+cuDNN7.4.1)_第2张图片

  • step3:添加环境变量
    (1)在终端执行:vim ~/.bashrc
    (2)在末尾加上如下几行,保存退出
export PATH="/home/yxh/cuda-10.0/bin:$PATH"
export LD_LIBRARY_PATH="/home/yxh/cuda-10.0/lib64/:$LD_LIBRARY_PATH"

(3)激活生效:source ~/.bashrc

  • step4:测试是否安装成功
    (1)输入nvcc --version
    在这里插入图片描述
    (2)测试例子,在终端依次输入:
cd /home/yxh/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

ubuntu18.04安装tensorflow-gpu==1.14.0(CUDA10.0+cuDNN7.4.1)_第3张图片
显示Result=PASS,则表明CUDA可用!

3.安装cuDNN7.4.1

  • step1:到官网查看CUDA10.0对应的cuDNN版本,与tensorflow版本也要对应好,我这里查到是cuDNN7.4.1
    https://developer.nvidia.com/rdp/cudnn-download#a-collapse765-101
    ubuntu18.04安装tensorflow-gpu==1.14.0(CUDA10.0+cuDNN7.4.1)_第4张图片
  • step2:解压文件
    害~下载完是cudnn-10.0-linux-x64-v7.4.1.5.solitairetheme8。这后缀变了,执行以下代码
# 更改文件名
mv cudnn-10.0-linux-x64-v7.4.1.5.solitairetheme8 cudnn-10.0-linux-x64-v7.4.1.5.tgz
# 解压文件
tar -xvf cudnn-10.0-linux-x64-v7.4.1.5.tgz

解压后显示如下
ubuntu18.04安装tensorflow-gpu==1.14.0(CUDA10.0+cuDNN7.4.1)_第5张图片

  • step3:解压出的文件复制到CUDA安装环境下
sudo cp cuda/include/cudnn.h /home/yxh/cuda-10.0/include/
sudo cp cuda/lib64/libcudnn* /home/yxh/cuda-10.0/lib64/
# 更改文件权限
sudo chmod a+r cuda-10.0/include/cudnn.h 
sudo chmod a+r cuda-10.0/lib64/libcudnn*

在这里插入图片描述

4.安装tensorflow-gpu

  • step1:创建conda虚拟环境
    conda create -n tf1-py35-gpu python==3.5 jupyter
    查看已有虚拟环境:conda info --envs
  • step2:激活环境
    source activate tf1-py35-gpu
  • step3:安装tensorflow-gpu==1.14.0
    pip install tensorflow-gpu==1.14.0
  • step4:测试是否安装成功
# 1.测试CUDA是否可用
import tensorflow as tf
a = tf.test.is_built_with_cuda()  
print(a)

# 2.测试GPU是否可用
b = tf.test.is_gpu_available(
    cuda_only=False,
    min_cuda_compute_capability=None)
print(b)

# 3.打印hello,tensorflow
import tensorflow as tf
hello = tf.constant('hello,tensorflow')
sess = tf.Session()
print(sess.run(hello))

# 4.指定设备执行
import os
os.environ["CUDA_VISIBLE_DEVICE"]="0" 
import tensorflow as tf
config = tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)
with tf.device('/gpu:0'):
	a = tf.constant(1)
	b = tf.constant(2)
	c = a+b
sess=tf.Session(config=config)
print(sess.run(c))

测试不成功有可能是因为numpy版本过高,降低numpy版本即可!

pip uninstall numpy
pip install numpy==1.14.5

你可能感兴趣的:(安装记录/环境配置,tensorflow)