ubuntu20.04安装cuda版本问题 + 系统cuda与conda虚拟cuda的差别

在ubuntu 20.04版本的服务器上,配置cuda与pytorch使用gpu版本加速

踩坑流程:
ubuntu20.04最低支持cuda11.0----降gcc版本安装cuda10.1----发现显卡RTX3090只支持cuda11.0以上----建conda虚拟环境装cuda11.1+pytorch1.8.0

ubuntu20.04版本支持11.0以上版本的cuda,官网也只有11.0以上版本的cuda有20.04的下载链接,附官网网址CUDA Toolkit | NVIDIA Developer

最开始想要使用cuda10.1版本,因为代码版本使用的是pytorch1.2.0版本,所以想使用低版本的cuda
然而ubuntu20.04默认9.3版本的gcc与g++,所以需要在20.04里面安装7版本的gcc与g++,并将优先级设置在9版本之前
gcc降级+设置优先级+查看(具体安装过程参考本文底部链接

在conda的base里安装虚拟环境,cuda10.1最低只能装pytorch1.7.1+cu101,但是报错

说明RTX3090不支持cuda10.1,查询得到3090至少要cuda11,11.0不稳定,就使用11.1
CUDA capability sm_86:算力8.6,翻译一下就是:RTX 3090的算力是8.6,但是当前的PyTorch依赖的CUDA版本支持的算力只有3.7、5.0、6.0、7.0

创建conda虚拟环境torch,安装cuda11.1与pytorch1.8.0

conda create -n torch python=3.7 
conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=11.1 -c pytorch -c conda-forge

直接一个语句就行,不需要安装cudnn,也不需要单独安装cuda



系统cuda与conda虚拟环境cuda的思考:

在ubuntu20.04下安装了cuda10.1后,在虚拟环境torch里安装cuda11.1,pytorch可以直接使用
说明conda虚拟环境与base系统互不相通
(其实是常识,但是以前配了无数次老服务器出了无数次问题,总觉得是系统的cuda没装好,这次新服务器让我体验深刻)
说不定可以直接不配base的cuda,在服务器上直接建虚拟环境然后安装cuda运行


参考博客:
ubuntu20.04安装11.0版本以下的cuda
ubuntu18.04安装cuda与cudnn

你可能感兴趣的:(pytorch,深度学习,人工智能)