【详细】Ubuntu18.04更新CUDA版本(以安装CUDA11.4为例)

CUDA安装官方教程:官方教程
cuDNN安装官方教程:官方教程

在配置Pytorch环境的时候,想着尝试一下新版本的pytorch版本Stable(1.10.1)时,发现这个pytorch版本仅支持CUDA10.2和CUDA11.3,故我就得更新以下当前的CUDA版本,也就有了下面这篇文档教程,注:虚拟机无法安装CUDA
查看CUDA版本以及GPU驱动对应关系:NVIDIA
通过查上面的表可以知道,如果要使用CUDA11.3,需要将显卡驱动更新到>=465.19.01(Linux x86_64环境)
首先打开终端查看当前CUDA版本和GPU驱动版本输入如下命令

nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.94       Driver Version: 470.94       CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0  On |                  N/A |
| N/A   30C    P8     6W /  N/A |    629MiB /  3911MiB |     30%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1549      G   /usr/lib/xorg/Xorg                244MiB |
|    0   N/A  N/A      1722      G   /usr/bin/gnome-shell               52MiB |
|    0   N/A  N/A      2329      G   /usr/lib/firefox/firefox          324MiB |
|    0   N/A  N/A      2467      G   /usr/lib/firefox/firefox            1MiB |
|    0   N/A  N/A      2862      G   /usr/lib/firefox/firefox            1MiB |
+-----------------------------------------------------------------------------+
Driver Version: 470.94  # 这个是显卡CPU驱动版本
CUDA Version: 11.4    # 这个是CUDA版本

这里是我已经更新好的界面,下面讲解具体的操作。

1. 下载驱动

下载驱动官方地址:NVIDIA官方驱动下载地址

我的显卡环境是:笔记本的GTX1650,我的选择如下:
产品类型:GeForce
产品系列:GeForce GTX 16 Series(Notebooks)     #这里notebooks就是笔记本的意思
产品家族:GeForce GTX 1650
操作系统:Linux 64-bit
下载类型:生产分支生     #这里建议跟我一样,是长期稳定的,另一个则不是,详细点击后面的?查看
语言:English(US)

点击搜索可以看到

Version: 	470.94
Release Date: 	2021.12.13
Operating System: 	Linux 64-bit
Language: 	English (US)
File Size: 	259.65 MB 

点击DOWNLOAD下载,默认是下载到你的【下载/Downloads】文件夹里,如果你ubuntu系统的语言是中文这里建议你将下载下来的.run文件copy到hone目录下,因为后面安装的时候为imen就会关掉显示界面,到字符界面里,只能显示英文,中文会乱码,无法进入
现在我们已经下载好驱动,现在开始安装驱动

2.安装驱动

先安装NVIDIA显卡依赖,在终端依次执行如下命令:

sudo dpkg --add-architecture i386
sudo apt update
sudo apt install build-essential libc6:i386

Ubuntu 系统默认安装好是使用的一个开源的驱动:nouveau,我们要安装官方的驱动需要先禁用这个开源驱动,方法如下,依次执行:

sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

执行完上面两条指令后,我们使用如下命令看看是否成功禁用了开源驱动:

cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf

如果和下面一样,表示成功了

blacklist nouveau
options nouveau modeset=0

这个时候我们需要先重启一下系统,重启吧(建议先收藏本文,重启后可较容易找回,或者在其他设备上查看,比如手机)
重启成功后打开终端,输入如下命令:sudo telinit 3(sudo telinit 5返回到图形界面)。然后按快捷键:CTRL+ALT+F1 进入字符界面,输入用户名和密码,然后登录系统,进入我们保存下载 NVIDIA 驱动的目录,默认是:Downloads/ 目录,cd Downloads/,当然如果系统语言是中文,你输入ls你会发现,中文无法显示并且无法进入,前面下载驱动时建议将.run放在home目录下
执行下面命令赋予执行权限和运行

sudo chmod +x NVIDIA-Linux-x86_64-470.57.02.run
sudo ./NVIDIA-Linux-x86_64-470.57.02.run

安装过程
下面通过左右键选择Yes或者No

The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。

Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择 No 继续。

问题大概是:Nvidia’s 32-bit compatibility libraries? 选择 No 继续。

Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes 继续

如果安装失败了once again就好了。

reboot重启输入密码后,笔记本电脑自带屏幕无法动弹,鼠标不能动,外界显示器能显示或者按 Ctrl+Alt+F1能进入命令界面
这是因为显卡驱动兼容性不够好导致的
解决方法

sudo rm /etc/X11/xorg.conf

重启即可进入图形界面,重新输入nvidia-smi查看GPU驱动和CUDA是否更新。

你可能感兴趣的:(Ubuntu,Pytorch,pytorch,深度学习,人工智能)