Tensorflow2.0 GPU版本安装(CUDA10.0 + cuDNN7.5 + Tensorflow2.0 Alpha)

(本人小白一名,总结了一些自己的操作经验,仅供参考)


前段时间Tensorflow 2.0 Alpha版本发布,作为刚入门深度学习的小白之前没有学过 Tensorflow1.x 系列,只学过一些keras,也懒得再学习 Tensorflow1.x 系列了,直接平滑过渡到 Tensorflow 2.0 多好。首先面临的问题就是CUDA等的安装及配置。

操作过程中参考了一些网络上的教程,但版本都不太匹配,并且操作似乎也不太一致,把自己整得很懵。但胡乱尝试一通,总算是成功了。效果如下:

$ nvidia-smi
Sun May 12 13:19:09 2019       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.104      Driver Version: 410.104      CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce 940M        On   | 00000000:01:00.0 Off |                  N/A |
| N/A   45C    P5    N/A /  N/A |    246MiB /  2004MiB |     11%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1339      G   /usr/lib/xorg/Xorg                           126MiB |
|    0      1497      G   /usr/bin/gnome-shell                         116MiB |
|    0      2432      G   /usr/lib/firefox/firefox                       1MiB |
+-----------------------------------------------------------------------------+

$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130

$ ls
bin  cuda  cuda-10.0  etc  games  include  lib  man  sbin  share  src

在一个技术群里问了一下,一个大佬说这样就算安装成功了,经过尝试发现之后的进一步操作也没有出现问题。
下面就来简单捋一下我的操作经历。


首先我们参考的当然是Tensorflow的官方说明:https://www.tensorflow.org/install/gpu

硬件要求

系统支持以下支持 GPU 的设备:

CUDA® 计算能力为 3.5 或更高的 NVIDIA® GPU 卡。请参阅支持 CUDA 的 GPU 卡列表。

软件要求

必须在系统中安装以下 NVIDIA® 软件:
NVIDIA® GPU 驱动程序 - CUDA 10.0 需要 410.x 或更高版本。
CUDA® 工具包 - TensorFlow 支持 CUDA 10.0(TensorFlow 1.13.0 及更高版本)
CUDA 工具包附带的 CUPTI。
cuDNN SDK(7.4.1 及更高版本)
(可选)TensorRT 5.0,可缩短在某些模型上进行推断的延迟并提高吞吐量。

这里详细列出了安装Tensorflow 2.0 Alpha GPU版本的前提要求。下面就开始操作:

1. 安装CUDA

这一步在Tensorflow的官方教程中有详细介绍,直接按照上面的教程操作即可:

Ubuntu 18.04 (CUDA 10)

   #Add NVIDIA package repositories
   wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
   sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
   sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
   sudo apt-get update
   wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
   sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
   sudo apt-get update

   # Install NVIDIA driver
   sudo apt-get install --no-install-recommends nvidia-driver-410
   # Reboot. Check that GPUs are visible using the command: nvidia-smi

   # Install development and runtime libraries (~4GB)
   sudo apt-get install --no-install-recommends \
       cuda-10-0 \
       libcudnn7=7.4.1.5-1+cuda10.0  \
       libcudnn7-dev=7.4.1.5-1+cuda10.0
   

   # Install TensorRT. Requires that libcudnn7 is installed above.
   sudo apt-get update && \
           sudo apt-get install nvinfer-runtime-trt-repo-ubuntu1804-5.0.2-ga-cuda10.0 \
           && sudo apt-get update \
           && sudo apt-get install -y --no-install-recommends libnvinfer-dev=5.0.2-1+cuda10.0

2. 安装cuDNN

这里我们安装cuDNN 7.5
首先打开连接 https://developer.nvidia.com/rdp/cudnn-archive 下载对应的版本。
Tensorflow2.0 GPU版本安装(CUDA10.0 + cuDNN7.5 + Tensorflow2.0 Alpha)_第1张图片点击第三个,下载压缩包 cudnn-10.0-linux-x64-v7.5.0.56.tgz
下在之后解压,拷贝,配置环境变量

# 解压
$ tar -zxvf cudnn-10.0-linux-x64-v7.5.0.56.tgz

# 拷贝
$ cd cudnn-10.0-linux-x64-v7.5.0.56
$ sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64

# 修改权限
$ sudo chmod a+r /usr/local/cuda-10.0/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*

将以下内容追加到 ~/.bashrc 文件末尾:

export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH
export CUDNN_PATH="/usr/local/cuda-10.0/lib64/libcudnn.so"

3. 验证cuDNN

$ echo -e '#include"cudnn.h"\n void main(){}' | nvcc -x c - -o /dev/null -lcudnn

上面这个命令不报错就说明没问题。

4. 安装Tensorflow2.0 GPU版本

可以先创建一个名为 tensorflow2_gpu 的虚拟环境,创建好之后进入虚拟环境,用pip安装Tensorflow2.0 GPU版本:

pip install tensorflow-gpu==2.0.0-alpha0

安装成功的话就大功告成啦!赶紧去使用试试吧

其他说明

安装过程中难免会出现一些其他问题,报错或者其他提示。出现这种情况就把报错复制到百度里,基本都会找到相关的解决办法。遇到其他问题也可以请教身边的大佬。
总之要不怕麻烦动起手来!

祝你操作顺利!

参考

[1]http://www.cnblogs.com/journeyonmyway/p/10316292.html
[2]https://www.tensorflow.org/install/gpu
[3]https://blog.csdn.net/weixin_42106049/article/details/85065489

你可能感兴趣的:(Tensorflow2.0 GPU版本安装(CUDA10.0 + cuDNN7.5 + Tensorflow2.0 Alpha))