【深度学习环境配置】Ubuntu安装Cuda、cuDNN、TensorFlow

【深度学习环境配置】

前言

深度学习配置环境很麻烦,因为要安装各种NVIDIA的库,尤其是cuDNN还得登录才能下载,今天总结一下Ubuntu安装Cuda、cuDNN、TensorFlow。

本机配置:

  1. Ubuntu:18.04

  2. 显卡:1080ti *6

安装之前需要确认已安装gcc和g++

$ gcc --version
$ g++ --version

安装cuda

去找到自己适合的版本CUDA Toolkit Archive | NVIDIA Developer,我要安装TensorFlow,官方案例版本为11.0。

选择版本后会进入下面页面CUDA Toolkit 11.0 Download | NVIDIA Developer

【深度学习环境配置】Ubuntu安装Cuda、cuDNN、TensorFlow_第1张图片

选择unfile安装方式,由于服务器网络原因,weget不到,所以手动在本地windows下载,直接复制weget后面的网址就行:

【深度学习环境配置】Ubuntu安装Cuda、cuDNN、TensorFlow_第2张图片

然后拖进xshell,发送到服务器里面,完事之后执行 sudo sh cuda_11.0.2_450.51.05_linux.run

因为装过驱动了,所以按enter键,取消选择Driver,然后install

【深度学习环境配置】Ubuntu安装Cuda、cuDNN、TensorFlow_第3张图片

安装完后,会提醒你添加环境变量:

【深度学习环境配置】Ubuntu安装Cuda、cuDNN、TensorFlow_第4张图片

# 1.切换回home目录
cd ~  
# 2.修改.bashrc文件
vim .bashrc     
# 3.进入.bashrc文件后,拉到最下面,然后键盘按E键,进入编辑模式添加:
export PATH="/usr/local/cuda-11.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH"  
# 4.按ESC键退出编辑
:wq   # 退出保存
# 5. 应用生效
source .bashrc 

编辑的其他操作:

:wq # 保存后退出i,若为 :wq! 则为强制存储后退出。
:w # 保存但不退出。
:w! # 若文件属性为【只读】,强制写入该档案。
:q # 离开vi。
:q! # 若曾经修改过档案,又不想存储,使用!为强制离开不存储档案。
:e! # 将档案还原到最原始状态!

检查安装cuda是否成功:nvcc -V,如下图已经变为11.0了

【深度学习环境配置】Ubuntu安装Cuda、cuDNN、TensorFlow_第5张图片

安装cudnn

进入官网选择对应的版本:cuDNN Archive | NVIDIA Developer

我安装的是11.0对应的版本:Download cuDNN v8.1.1 (Feburary 26th, 2021), for CUDA 11.0,11.1 and 11.2

下载下面三个文件到本地电脑,然后用xshell或其他传到Ubuntu

【深度学习环境配置】Ubuntu安装Cuda、cuDNN、TensorFlow_第6张图片

安装命令:

ls #查看当前文件夹的所有文件
sudo dpkg -i libcudnn8_8.1.1.33-1+cuda11.2_amd64.deb  #安装runtime
sudo dpkg -i libcudnn8-dev_8.1.1.33-1+cuda11.2_amd64.deb  #安装dev
sudo dpkg -i libcudnn8-samples_8.1.1.33-1+cuda11.2_amd64.deb  #安装samples

安装后可以进入/usr/src看看有没安装好的文件

cd ~         # 回到home
cd /usr/src  # 进入/usr/src
ls           # 查看文件列表

测试安装是否成功:

1)复制cuDNN samples到home目录下
$ cp -r /usr/src/cudnn_samples_v8 /$HOME

2) 进入home目录
$ cd $HOME/cudnn_samples_v8/mnistCUDNN/

3) 编译mnistCUDNN 
$ sudo make clean 
$ sudo make

4)运行mnistCUDNN 
$ sudo ./mnistCUDNN

第三步的时候出现fatal error: FreeImage.h: No such file or directory问题

解决:sudo apt-get install libfreeimage3 libfreeimage-dev

重新第三步 然后第四步得到结果:

安装TensorFlow

pip install tensorflow

测试是否能使用gpu,py文件:

import tensorflow as tf
print(tf.__version__)
# print(tf.test.is_gpu_available(cuda_only=True))
print(tf.config.list_physical_devices('GPU'))

运行出现:Could not load dynamic library 'libcusolver.so.11',检测不到显卡

解决方案:

sudo ln -s /usr/local/cuda-11.0/targets/x86_64-linux/lib/libcusolver.so.10 /usr/local/cuda-11.0/targets/x86_64-linux/lib/libcusolver.so.11

如果不确定是否有这个文件夹,或者是否为11.0

cd /usr/local/ # 进入文件夹

ls # 展示文件列表

解决方案参考:

tensorflow - How to install libcusolver.so.11 - Stack Overflow、(5条消息) Ubuntu 20.04 系统(双系统环境下)中深度学习环境配置(Pytorch + GPU)_白白净净吃了没病的博客-CSDN博客_虚拟机ubuntu能用gpu吗

参考文章:

[Ubuntu18.04上安装CUDA和cuDNN【Ubuntu上安装GPU版MindSpore1.0.1前的环境准备】-云社区-华为云 (huaweicloud.com)](

你可能感兴趣的:(深度学习,tensorflow,ubuntu,深度学习)