Ubuntu下配置Cuda等深度学习环境

前言

记录服务器上深度学习项目环境的搭建。


一、查看显卡驱动信息

命令:nvidia-smi
效果:
Ubuntu下配置Cuda等深度学习环境_第1张图片
注意关注箭头部分所对应的驱动版本和推荐的Cuda版本。

二、安装Cuda

第一步:选择Cuda版本

情况1.直接根据所对应的推荐Cuda版本进行选择

通常我们会选择对照着显卡驱动所推荐的Cuda版本号,在官网进行选择安装
相对应的Cuda。
官网地址如下:https://developer.nvidia.com/cuda-toolkit-archive
Ubuntu下配置Cuda等深度学习环境_第2张图片
该图以上图驱动所推荐的11.4为例,进行选择
Ubuntu下配置Cuda等深度学习环境_第3张图片

情况2.根据驱动版本号对Cuda版本进行选择

有些情况下,一些深度学习框架没有与之对应的Cuda版本。如最新的Cuda11.7, Pytorch官网中则没有与之对应的框架下载。如下所示:
Ubuntu下配置Cuda等深度学习环境_第4张图片
在这种情况下,我们就可以利用驱动的版本号进行相应的Cuda版本的下载。
查阅驱动版本号和Cuda版本的兼容表:
查阅地址如下:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
Ubuntu下配置Cuda等深度学习环境_第5张图片
对驱动版本进行对比,发现驱动版本470.103.01满足Cuda 11.4及其以下版本的所有情况,不满足Cuda 11.5所需的>=495.29.05的要求。因此,我们可以下载满足情况的所有Cuda版本,再结合所用的Pytorch框架所支持版本的取交集得,我们可以下载:Cuda11.2 、 Cuda 11.3 、Cuda 11.4。

进行完相应版本的选择后,逐条复制下面的安装命令进行安装包的下载。

第二步:下载完安装包之后,执行安装命令

sudo sh cuda_***_linux.run(其中:***要修改为你安装包的版本)

第三步:安装包执行过程中,除了对driver驱动删除默认的勾选外,一路Accept和yes下去,随后完成Cuda的安装。

第四步:添加环境变量:

进入home目录下,用vim .bashrc对环境变量进行编辑,加入以下两行:

export PATH=/usr/local/cuda-**/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-**/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

注:其中**要修改为安装的Cuda版本

重新加载环境变量:source .bashrc

第五步:验证Cuda是否安装成功

命令:nvcc -V
若出现下图类似的版本信息(如果是安装的是11.4,则下图版本号应该出现11.4),则说明安装成功
在这里插入图片描述

三、安装对应的框架版本(以torch为例)

torch下载链接如下:
https://download.pytorch.org/whl/torch_stable.html
根据Python版本、cuda版本找到对应的torch文件进行下载安装
Ubuntu下配置Cuda等深度学习环境_第6张图片

第7步:测试深度学习环境是否搭建成功

执行:

torch.cuda.is_available()

若返回True,则说明搭建成功

你可能感兴趣的:(深度学习,python,深度学习)