Nvidia驱动更新和CUDA更新

最近在训练深度学习模型的时候突然发现GPU不能用了,查找了问题之后发现是Nvidia显卡驱动过期了,并且CUDA toolkit也太老了,需要进行更新,因此我花了一些精力更新一下,把遇到的问题和更新流程记录一下。首先,在Ubuntu 16下如果要更新Nvidia驱动和CUDA,先要关闭Nouveau

cd /etc/modprobe.d
vim blacklist.conf
## 添加以下内容
blacklist nouveau
options nouveau modeset=0
# 更新
sudo update-initramfs -u
## 重新启动
reboot

然后在nvidia官网下载CUDA toolkit。
CUDA Toolkit Archive | NVIDIA Developer

CUDA toolkit列表

我下载了11.2.0,下载下来的是run,是一种可执行包,直接su root,然后执行sudo sh 可执行CUDA包,即可。

安装完CUDA后还要配置环境变量:
装完后会自动提示
Please make sure that
PATH includes /usr/local/cuda-11.2/bin
LD_LIBRARY_PATH includes /usr/local/cuda-11.2/lib64, or, add /usr/local/cuda-11.2/lib64 to /etc/ld.so.conf and run ldconfig as root

vim ~/.bashrc
export PATH=$PATH:/usr/local/cuda-11.2/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.2/lib64:/usr/lib/x86_64-linux-gnu
配置好了以后更新一下环境变量
source ~/.bashrc

最后,输入nvcc -V看到版本已经更新就代表CUDA安装成功了。


(base) gpu@gpu:/home/storage/zj/deeplearning/code2022$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Nov_30_19:08:53_PST_2020
Cuda compilation tools, release 11.2, V11.2.67
Build cuda_11.2.r11.2/compiler.29373293_0

接下来更新nvidia驱动
访问:Official Drivers | NVIDIA
来寻找合适的驱动,输入自己的显卡型号,查找适合的驱动



这里下载下来的也是run包,可以直接执行,但是在安装过程中可能会报错,如果提示:

只要在安装命令后面加上 --no-x-check即可。

sudo ./NVIDIAxxxx.run --no-x-check

完成后,输入nvidia-smi即可查看安装结果。
这是更新之前:



这是更新之后:


你可能感兴趣的:(Nvidia驱动更新和CUDA更新)