(本人小白一名,总结了一些自己的操作经验,仅供参考)
前段时间Tensorflow 2.0 Alpha版本发布,作为刚入门深度学习的小白之前没有学过 Tensorflow1.x 系列,只学过一些keras,也懒得再学习 Tensorflow1.x 系列了,直接平滑过渡到 Tensorflow 2.0 多好。首先面临的问题就是CUDA等的安装及配置。
操作过程中参考了一些网络上的教程,但版本都不太匹配,并且操作似乎也不太一致,把自己整得很懵。但胡乱尝试一通,总算是成功了。效果如下:
$ nvidia-smi
Sun May 12 13:19:09 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.104 Driver Version: 410.104 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce 940M On | 00000000:01:00.0 Off | N/A |
| N/A 45C P5 N/A / N/A | 246MiB / 2004MiB | 11% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1339 G /usr/lib/xorg/Xorg 126MiB |
| 0 1497 G /usr/bin/gnome-shell 116MiB |
| 0 2432 G /usr/lib/firefox/firefox 1MiB |
+-----------------------------------------------------------------------------+
$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130
$ ls
bin cuda cuda-10.0 etc games include lib man sbin share src
在一个技术群里问了一下,一个大佬说这样就算安装成功了,经过尝试发现之后的进一步操作也没有出现问题。
下面就来简单捋一下我的操作经历。
首先我们参考的当然是Tensorflow的官方说明:https://www.tensorflow.org/install/gpu
硬件要求
系统支持以下支持 GPU 的设备:
CUDA® 计算能力为 3.5 或更高的 NVIDIA® GPU 卡。请参阅支持 CUDA 的 GPU 卡列表。
软件要求
必须在系统中安装以下 NVIDIA® 软件:
NVIDIA® GPU 驱动程序 - CUDA 10.0 需要 410.x 或更高版本。
CUDA® 工具包 - TensorFlow 支持 CUDA 10.0(TensorFlow 1.13.0 及更高版本)
CUDA 工具包附带的 CUPTI。
cuDNN SDK(7.4.1 及更高版本)
(可选)TensorRT 5.0,可缩短在某些模型上进行推断的延迟并提高吞吐量。
这里详细列出了安装Tensorflow 2.0 Alpha GPU版本的前提要求。下面就开始操作:
这一步在Tensorflow的官方教程中有详细介绍,直接按照上面的教程操作即可:
Ubuntu 18.04 (CUDA 10)
#Add NVIDIA package repositories
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update
# Install NVIDIA driver
sudo apt-get install --no-install-recommends nvidia-driver-410
# Reboot. Check that GPUs are visible using the command: nvidia-smi
# Install development and runtime libraries (~4GB)
sudo apt-get install --no-install-recommends \
cuda-10-0 \
libcudnn7=7.4.1.5-1+cuda10.0 \
libcudnn7-dev=7.4.1.5-1+cuda10.0
# Install TensorRT. Requires that libcudnn7 is installed above.
sudo apt-get update && \
sudo apt-get install nvinfer-runtime-trt-repo-ubuntu1804-5.0.2-ga-cuda10.0 \
&& sudo apt-get update \
&& sudo apt-get install -y --no-install-recommends libnvinfer-dev=5.0.2-1+cuda10.0
这里我们安装cuDNN 7.5
首先打开连接 https://developer.nvidia.com/rdp/cudnn-archive 下载对应的版本。
点击第三个,下载压缩包 cudnn-10.0-linux-x64-v7.5.0.56.tgz
下在之后解压,拷贝,配置环境变量
# 解压
$ tar -zxvf cudnn-10.0-linux-x64-v7.5.0.56.tgz
# 拷贝
$ cd cudnn-10.0-linux-x64-v7.5.0.56
$ sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64
# 修改权限
$ sudo chmod a+r /usr/local/cuda-10.0/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*
将以下内容追加到 ~/.bashrc 文件末尾:
export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH
export CUDNN_PATH="/usr/local/cuda-10.0/lib64/libcudnn.so"
$ echo -e '#include"cudnn.h"\n void main(){}' | nvcc -x c - -o /dev/null -lcudnn
上面这个命令不报错就说明没问题。
可以先创建一个名为 tensorflow2_gpu 的虚拟环境,创建好之后进入虚拟环境,用pip安装Tensorflow2.0 GPU版本:
pip install tensorflow-gpu==2.0.0-alpha0
安装成功的话就大功告成啦!赶紧去使用试试吧
安装过程中难免会出现一些其他问题,报错或者其他提示。出现这种情况就把报错复制到百度里,基本都会找到相关的解决办法。遇到其他问题也可以请教身边的大佬。
总之要不怕麻烦动起手来!
祝你操作顺利!
[1]http://www.cnblogs.com/journeyonmyway/p/10316292.html
[2]https://www.tensorflow.org/install/gpu
[3]https://blog.csdn.net/weixin_42106049/article/details/85065489