【环境】
Ubuntu22.04.2 LTS +A4000
一、安装驱动
参考这篇文章进行安装Ubuntu安装Nvidia显卡驱动_Kevin__47的博客-CSDN博客
【出现问题】
禁用nouveau后出现黑屏,有几行代码,断线一直在闪
【解决方法】
1、参考这篇文章Ubuntu20.04安装nvidia显卡驱动并解决重启后黑屏问题_ubuntu安装nvidia显卡驱动后黑屏-CSDN博客
在boot 设置中,将安全模式设为disable,保存退出(实际我看了安全模式本来就是disable的,但是充重启后就能进入ubuntu了)。
重新进入后,选择ubuntu系统,进入。
2、安装原教程中方法,验证nouveau是否禁用成功
命令:lsmod | grep nouveau
如果没有内容出现,则成功。
3、安装驱动
按照原教程,运行 NVIDIA-Linux-x86_64-535.104.05.run文件。
报错:
提示: 缺少cc和gcc模块
【解决】
命令:
sudo apt-get install gcc g++ make
再重新运行run文件,最后使用nvidia-smi命令,熟悉的界面又回来了!
DONE!
二、下载CUDA 和CUDNN。
1、版本对应
这里
NVIDIA驱动、CUDA、cuDNN、Torch、Tensorflow对应版本一文搞明白_nvidia驱动对应的cuda版本-CSDN博客
有介绍版本对应,但我是在这里Previous PyTorch Versions | PyTorch找到对应关系,我pytorch版本是2.0.1+cu117,NVIDIA驱动版本是535,选择了cuda11.7,cudnn根据cuda版本选择(需要登录,使用微信登录)
【下载链接】
cuda:Index of /compute/cuda/opensource/11.7.0
cudnn:cuDNN Archive | NVIDIA Developer
三、安装CUDA和CUDNN
1、下载可选多种文件:
1)、run文件是包含了显卡驱动的文件(选用这种方法安装)
2)deb文件(sudo dpkg -i xxxxxx.deb)
2、参考基于ubuntu安装cuda,cuDNN_ubuntu安装cuda和cudnn_xyzxyz576的博客-CSDN博客
1)安装CUDA
参考ubuntu安装显卡驱动和cuda教程(安装显卡驱动) 进行安装
安装时报错,发现没有添加环境变量。添加环境变量
2)安装CUDNN
直接使用命令安装:sudo dpkg -i cudnn-local-repo-ubuntu2204-8.9.3.28_1.0-1_amd64.deb
使用Ubuntu 安装 GPU 驱动、CUDA、cuDNN,以及是否安装成功的检测 - 知乎 的方法测试cuda和cudnn已经成功
四、跑代码
将参数device设置为0(YOLOV5代码),即可使用GPU
【总结】
1、先找到显卡驱动、torch、cuda的对应版本,再找cudnn的对应版本,不然后面会出现一系列问题。
2、安装完驱动要重启。
3、安装cc、gcc
4、关于下载。本案例中cuda使用run文件,cudnn使用deb文件
5、安装cuda后要添加环境变量
6、安装完cudnn后,可直接去python中测试是否安装成功