Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)

修正:Ubuntu 18.04+RTX2080Ti建议安装cuda10.0,cudnn7.5.1,pytorch1.4.0+cu100 / torchvision0.5.0+cu100,tensorflow-gpu1.14.0
修正日期:20200611

安装方式与下文描述类似,只要选择上面的版本安装即可


一、安装cuda(准备工作

1、检查Linux版本是否支持CUDA
Ubuntu18.04 + RTX2080ti 支持

2、检查系统是否安装gcc

gcc --version

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第1张图片
3、 检查是否安装了kernel header和 package development

在终端中输入: uname -r 可以查看自己的kernel版本信息
在终端中输入: sudo apt-get install linux-headers-$(uname -r)
可以安装对应kernel版本的kernel headerpackage development

4、运行nvidia-smi 查看现有驱动支持的cuda版本
Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第2张图片
(重要)根据上述运行结果查看driver version和CUDA Version的版本。此外,如果需要安装pytorch或者tensorflow,可登陆pytorch官网进行查看当前pytorch支持的cuda的版本,根据对应的版本下载pytorch。

5、下载官网run文件:cuda官网
Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第3张图片
下载完成后

6、runfile安装
A) 禁用 nouveau
终端中运行: lsmod | grep nouveau,如果有输出则代表nouveau正在加载。
因为我早就安装了NVIDIA的显卡驱动,禁用了nouveau,所以没有输出。
在这里插入图片描述
B) 切换到.run安装文件的路径,运行
sudo sh cuda_10.1.105_418.39_linux.run (10.2版本类似)!Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第4张图片Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第5张图片
注意:不安装driver,否则重启之后电脑一直蓝屏(踩坑)。

7、设置环境变量

终端输入:sudo gedit /etc/profile,输密码后进入,打开文件末尾,加入以下两行后保存。(10.2版本类似)

export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda10.1/lib64 

1)在终端输入sudo gedit ~/.bashrc

2)在文本的最后输入

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export PATH=$PATH:/usr/local/cuda-10.1.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1

目录要对应自己的cuda版本
3)然后source ~/.bashrc 激活环境
4)在终端输入nvcc -V出现下面画面则安装成功
!blog.csdnimg.cn/20200528154419611.pngUbuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第6张图片
(图片参考:https://blog.csdn.net/hou9021/article/details/104311088)


重启:sudo reboot
开始测试cuda是否安装成功:
命令如下:

cd /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

最后结果显示,如下:
Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第7张图片
(图片参考:https://blog.51cto.com/14204744/2464180?source=dra)

有些地方可能会不一样,只要最后是Result = PASS就代表这cuda10.1安装成功了。


CUDA卸载:

cd /usr/local/cuda/bin
sudo ./cuda-uninstaller

CUDNN安装

安装cuDNN 7.6.5版本,转到官网下载,下载前先注册一下,填个调查问卷,根据自己的环境和架构选择包,下载到本地
Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第8张图片
注意:具体的版本请参照官网,只需要与cuda的版本对应即可

切换到下载目录 cd Downloads ,然后按照以下操作进行,

解压: cuDNN Library for Linux
输入: tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz

将解压出来的文件复制到安装的CUDA环境中,输入:

sudo cp cuda/include/cudnn.h /usr/local/cuda/inlude
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64  

更改权限,输入:

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*  

注意:如果系统提示找不到cudnn.h,可复制cuda/include/cudnn.h/usr/local/cuda/include/目录下

安装PyTorch1.3

进入PyTorch官网安装合适的版本,官网 ,

输入: pip3 install torch torchvision ,等待安装结束(现在官网最新版本为1.5)
Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第9张图片
Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第10张图片
安装完成后,进入python3环境,验证是否成功,

输入: python3

再输入:

import torch
import torchvision

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第11张图片
没有报错,说明安装成功。

最后验证下GPU能否使用,输入: print(torch.cuda.is_available()) ,输出True,说明没问题。

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)_第12张图片


参考文章:https://www.cnblogs.com/booturbo/archive/2019/11/11/11834661.html

你可能感兴趣的:(Ubuntu18.04环境配置,cuda,ubuntu,linux)