DELL precision上安装nvidia A4000驱动 cuda cudnn

【环境】

Ubuntu22.04.2 LTS +A4000

一、安装驱动

参考这篇文章进行安装Ubuntu安装Nvidia显卡驱动_Kevin__47的博客-CSDN博客

【出现问题】

禁用nouveau后出现黑屏,有几行代码,断线一直在闪

【解决方法】

1、参考这篇文章Ubuntu20.04安装nvidia显卡驱动并解决重启后黑屏问题_ubuntu安装nvidia显卡驱动后黑屏-CSDN博客

在boot 设置中,将安全模式设为disable,保存退出(实际我看了安全模式本来就是disable的,但是充重启后就能进入ubuntu了)。

重新进入后,选择ubuntu系统,进入。

2、安装原教程中方法,验证nouveau是否禁用成功

命令:lsmod | grep nouveau

如果没有内容出现,则成功。

3、安装驱动

按照原教程,运行  NVIDIA-Linux-x86_64-535.104.05.run文件。

报错:

提示: 缺少cc和gcc模块

【解决】

命令:

sudo apt-get install gcc g++ make

再重新运行run文件,最后使用nvidia-smi命令,熟悉的界面又回来了!

DONE!

二、下载CUDA 和CUDNN。

1、版本对应

这里

NVIDIA驱动、CUDA、cuDNN、Torch、Tensorflow对应版本一文搞明白_nvidia驱动对应的cuda版本-CSDN博客

有介绍版本对应,但我是在这里Previous PyTorch Versions | PyTorch找到对应关系,我pytorch版本是2.0.1+cu117,NVIDIA驱动版本是535,选择了cuda11.7,cudnn根据cuda版本选择(需要登录,使用微信登录)

【下载链接】

cuda:Index of /compute/cuda/opensource/11.7.0

cudnn:cuDNN Archive | NVIDIA Developer

三、安装CUDA和CUDNN

1、下载可选多种文件:

1)、run文件是包含了显卡驱动的文件(选用这种方法安装)

2)deb文件(sudo dpkg -i xxxxxx.deb)

2、参考基于ubuntu安装cuda,cuDNN_ubuntu安装cuda和cudnn_xyzxyz576的博客-CSDN博客

1)安装CUDA

 参考ubuntu安装显卡驱动和cuda教程(安装显卡驱动)  进行安装

 安装时报错,发现没有添加环境变量。添加环境变量

2)安装CUDNN

 直接使用命令安装:sudo dpkg -i cudnn-local-repo-ubuntu2204-8.9.3.28_1.0-1_amd64.deb

使用Ubuntu 安装 GPU 驱动、CUDA、cuDNN,以及是否安装成功的检测 - 知乎 的方法测试cuda和cudnn已经成功

四、跑代码

将参数device设置为0(YOLOV5代码),即可使用GPU

【总结】

1、先找到显卡驱动、torch、cuda的对应版本,再找cudnn的对应版本,不然后面会出现一系列问题。

2、安装完驱动要重启。

3、安装cc、gcc

4、关于下载。本案例中cuda使用run文件,cudnn使用deb文件

5、安装cuda后要添加环境变量

6、安装完cudnn后,可直接去python中测试是否安装成功

你可能感兴趣的:(人工智能,linux)