在ubuntu16.04上配置tensorflow-gpu

所配环境:ubuntu16.04+Anaconda3+python3.5.4+CUDA10.1+cudnn7.6.5

anaconda3、pycharm的安装不在本文赘述。参考文章:https://blog.csdn.net/yiyayiya557/article/details/105641706

我在anaconda3的虚拟环境进行配置,便于我管理不同的深度学习框架,例如tensorflow、pytorch、theano。

1. 建立tensorflow_gpu环境

安装好anaconda3后,创建tensorflow虚拟环境,python版本必须为3.5或3.6,不然keras安装会报错,同时为了与windows的开发环境保持一致,选择python 3.5.4

conda create -n tensorflow python=3.5.4

建议配置为镜像环境,例如清华镜像,pip安装会快很多,不然很慢。

查看所有环境

conda env list

conda info --envs

删除环境

conda env remove -n tensorflow

激活环境

conda activate tensorflow

进入tensorflow虚拟环境,先安装tensorflow-cpu

pip install tensorflow

确认tensorflow已经安装成功,不报错,就说明tensorflow-cpu已经安装成功。

python

import tensorflow

2. CUDA下载及安装

到这里,基本都已经安装好显卡驱动了,如果有问题,参考:https://blog.csdn.net/yiyayiya557/article/details/105574008

(1)确认是否安装gcc

gcc --version

(2)确认nouveau已禁用,如果没有输出则说明已禁用。

lsmod | grep nouveau

输入nvidia-smi,有如下显示则说明驱动安装成功:

在ubuntu16.04上配置tensorflow-gpu_第1张图片

然后确认CUDA与cudnn配对版本,并下载适合自己系统的版本

https://blog.csdn.net/omodao1/article/details/83241074

我下载了cuda10.1, cudnn7.6.5

下载地址:https://developer.nvidia.com/cuda-downloads?target_os=Linux

建议下载run文件,安装比较方便。

在ubuntu16.04上配置tensorflow-gpu_第2张图片

输入

wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run

sudo sh cuda_10.1.243_418.87.00_linux.run

选择accept EULA,不安装显卡驱动,其他用默认设置,如下

在ubuntu16.04上配置tensorflow-gpu_第3张图片

配置系统环境

sudo gedit ~/.bashrc

在文件末尾输入

export PATH="/usr/local/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH"
export CUDA_HOME="/usr/local/cuda-10.1"

重启环境

source ~/.bashrc

nvcc --version

如果显示CUDA版本信息代表正常。

测试sample例子:

#编译并测试设备 deviceQuery:
cd ~/NVIDIA_CUDA-10.1_Samples/1_Utilities/deviceQuery
make deviceQuery
./deviceQuery
 
#编译并测试带宽 bandwidthTest:
cd ../bandwidthTest
make bandwidthTest
./bandwidthTest

如果这两个测试的最后结果都是Result = PASS,说明CUDA安装成功。

在ubuntu16.04上配置tensorflow-gpu_第4张图片

在ubuntu16.04上配置tensorflow-gpu_第5张图片

3. cudnn下载及配置

下载地址:https://developer.nvidia.com/rdp/cudnn-archive

下载cudnn-10.1-linux-x64-v7.6.5.32.tgz,提取到本地。

将库(.lib)和头文件(.h)copy到cuda目录

sudo cp /home/robert/下载/cuda/include/cudnn.h /usr/local/cuda-10.1/include
sudo cp /home/robert/下载/cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64

修改文件访问权限:

sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*

到这里tensorflow配置完成。

测试tensorflow,输入conda activate tensorflow,

库文件打不开,解决办法参考文章:https://blog.csdn.net/yiyayiya557/article/details/105700696

如代码所示:

import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))

在ubuntu16.04上配置tensorflow-gpu_第6张图片

参考文章:https://blog.csdn.net/qq_38901147/article/details/90049666

你可能感兴趣的:(cuda,tensorflow,深度学习,linux,python)