Ubuntu20.04配置GPU,并安装TensorFlow和torch

首先更新依赖:

sudo apt-get update
sudo apt-get upgrade
sudo apt-get install build-essential

第一步:禁用nouveau

终端中执行:

sudo gedit /etc/modprobe.d/blacklist.conf

打开文本后,在最后一行添加:

blacklist nouveau
options nouveau modeset=0

保存关闭,执行:

sudo update-initramfs -u

重启:

sudo reboot

重启后执行下面代码检查nouveau是否禁用成功:

lsmod | grep nouveau

没有输出说明禁用成功

第二步:Nvidia驱动安装
1.查找自己显卡的型号,去官网下载对应驱动
https://www.nvidia.cn/geforce/drivers/
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第1张图片

2.在驱动的目录下,执行如下命令:

sudo chmod a+x NVIDIA-Linux-x86_64-455.45.01.run #(最后是你下载的显卡名字,和我的可能不一样)
sudo ./NVIDIA-Linux-x86_64-455.45.01.run --no-opengl-files --no-x-check --no-
nouveau-check

说明:
-no-opengl-files 只安装驱动文件,不安装 OpenGL 文件
–no-x-check 安装驱动时不检查 X 服务
–no-nouveau-check 安装驱动时不检查 nouveau

3.安装过程中出现的选项
(1)选择continue installation
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第2张图片

(2)选择No

Ubuntu20.04配置GPU,并安装TensorFlow和torch_第3张图片

(3)选择No
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第4张图片

(4)显卡驱动安装完成
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第5张图片

检查是否安装成功,执行代码:

nvidia-smi

Ubuntu20.04配置GPU,并安装TensorFlow和torch_第6张图片

出现上图表示安装成功

安装过程中可能出现的问题

  1. Unable to find the tool"cc"(注意是cc)
    Ubuntu20.04配置GPU,并安装TensorFlow和torch_第7张图片

解决办法:

sudo apt-get install gcc

2.Unable to find the tool"make"(注意是make)
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第8张图片
解决办法:

sudo apt-get install make

3.显卡安装完成后可能会显示不出来,出现如下问题:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
解决办法,输入如下代码:
cd /usr/src
ls
查找对应的驱动版本
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第9张图片
例如我的455.45.01
执行如下代码:
sudo apt-get install dkms
sudo dkms install -m nvidia -v 455.45.01(对应你的驱动版本号)
再次执行nvidia-smi 检查

第三步:CUDA 安装
查看tensorflow对应版本的CUDA,Cudnn,gcc,链接:
https://tensorflow.google.cn/install/source

下载对应版本的CUDA,链接:
https://developer.nvidia.com/zh-cn/cuda-downloads

输入gcc-v可以看到目前默认gcc版本

gcc –v

在这里插入图片描述

安装gcc7

sudo apt install gcc-7 g++-7

查看系统中存在的gcc版本

ls /usr/bin/gcc*

在这里插入图片描述
使用update-alternatives进行版本切换,执行如下命令:

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 50
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 100
sudo update-alternatives --config gcc

再次输入gcc -v可以看到目前默认gcc版本

gcc -v

在这里插入图片描述
安装CUDA

在安装包的目录下,执行如下命令:

sudo sh cuda_10.1.168_418.67_linux.run

1.选择accept
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第10张图片
2.不选择Driver,点击空格即可,然后选择install安装
Ubuntu20.04配置GPU,并安装TensorFlow和torch_第11张图片
配置环境变量:

gedit ~/.bashrc

文件最后添加

export PATH=/usr/local/cuda-10.1/bin/${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

更新环境变量

source ~/.bashrc

检测是否安装成功:

nvcc –V

Ubuntu20.04配置GPU,并安装TensorFlow和torch_第12张图片

第四步: cudnn安装
下载对应版本的cudnn(需要注册,很简单):
https://developer.nvidia.com/cudnn-download-survey

在安装包的目录下解压:

tar -xvf cudnn-10.1-linux-x64-v7.6.5.32.tgz

复制并添加读取权限

sudo cp ./cuda/lib64/* /usr/local/cuda/lib64
sudo cp ./cuda/include/cudnn.h /usr/local/cuda/include
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

检查是否安装成功

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

出现下图说明安装成功

Ubuntu20.04配置GPU,并安装TensorFlow和torch_第13张图片
至此,ubuntu的GPU已经配置完成

由于ubuntu系统自带Python3.8,所以我们不需要重新去安装Python

根据自己的需求安装TensorFlow,pytorch等

1.安装TensorFlow

sudo pip3 install tensorflow-gpu==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

2.安装pytorch

sudo pip3 install torch -i https://pypi.tuna.tsinghua.edu.cn/simple

终端输入:

python
import tensorflow
import torch

没有报错说明安装成功!
这篇文章是根据自己的理解写的,哪里写的不对敬请指正。

结束~

你可能感兴趣的:(tensorflow,ubuntu,python,cuda,pytorch)