Ubuntu20.04安装pytorch1.10,cuda11.3,cudnn

Ubuntu20.04安装pytorch,cuda

1. cuda安装

输入命令nvidia-smi查看自己电脑的版本型号和cuda版本
Ubuntu20.04安装pytorch1.10,cuda11.3,cudnn_第1张图片
在英伟达官网查看自己的显卡版本和cuda驱动版本https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
Ubuntu20.04安装pytorch1.10,cuda11.3,cudnn_第2张图片
选择对应版本进行下载,下载地址,我选择的是cuda11.3。
Ubuntu20.04安装pytorch1.10,cuda11.3,cudnn_第3张图片
随便进入个文件夹打开终端,然后按照图片中给的命令依次执行。
进入安装界面
EULA? 选择accept
Ubuntu20.04安装pytorch1.10,cuda11.3,cudnn_第4张图片
驱动这块不要选择(忽略图片里的版本,图片来源于链接),按回车取消选定,然后install。
安装好后终端输入sudo gedit ~/.bashrc修改系统变量
添加

export PATH=/usr/local/cuda-11.3/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH

保存后终端输入source ~/.bashrc使其生效,输入nvcc -V查看是否有输出,正确输出版本号则说明安装完成。

2.安装cudnn

在英伟达官网找到与安装的cuda版本相对应的cudnn进行安装,下载链接,安装完成后解压。
之后将lib和include里的文件复制到之前安装的cuda路径下

sudo cp cudnn/cuda/lib64/lib* /usr/local/cuda-11.3/lib64/
sudo cp cudnn/cuda/include/cudnn.h /usr/local/cuda-11.3/include/

安装完成

3.安装pytorch

首先确定cuda版本,CUDA有两种API,运行时API和驱动API,即所谓的Runtime API与Driver API。nvidia-smi的结果是CUDA Driver API的型号,而nvcc -V得结果对应CUDA Runtime API,安装pyto
rch时要依据nvcc -V的版本。
安装pytorch时orch,torchvision,torchaudio的版本都是对应的
conda install pytorch==1.10.0 torchvision==0.11.1 torchaudio==0.10.0 cudatoolkit=11.3 -c pytorch
若出现问题:Solving environment: failed with initial frozen solve. Retrying with flexible solve.且一直卡在这里,则先不安装torchvision(conda install pytorch==1.10.0 torchaudio==0.10.0 cudatoolkit=11.3 -c pytorch
在我的电脑上,conda默认安装的torchvision版本是0.4.0,pip默认安装的torchvision版本是0.7.0,都不满足要求。
若安装指定0.11.1版本的torchvision,conda会出现刚才的问题(ailed with initial frozen solve),pip安装的0.11.1版本的cuda是10.2同样是不满足要求的,我的解决方案是用从官网下载whl进行安装。下载链接https://download.pytorch.org/whl/cu113/torchvision/
可以更改域名里的cu113找到对应cuda版本的下载地址、
Ubuntu20.04安装pytorch1.10,cuda11.3,cudnn_第5张图片

我选的是torchvision-0.11.1+cu113-cp37-cp37m-linux_x86_64.whl
之后在下载目录里终端输入pip install torchvision-0.11.1+cu113-cp37-cp37m-linux_x86_64.whl安装完成。

注:

一定要注意版本相对应,cuda,torch,torchvision,torchaudio都是相对应的,否则就会出错。
问题1:No module named 'torchvision.ops' torchvision版本太低,安装高版本的pytorch
问题2:RuntimeError: Couldn’t load custom C++ ops. This can happen if your PyTorch and torchvision versions are incompatible, or if you had errors while compiling torchvision from source.,安装的torchvision版本不对,或者不是当前cuda对应的版本。

你可能感兴趣的:(ubuntu,pytorch,cuda)