NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

前言: 以下方法,不需要重装驱动,简单快捷。适用于 Ubuntu 系统下,之前已经安装过驱动,但驱动失效的问题。
如果此方法仍然无法解决问题,可参考 Ubuntu 下安装 nvidia 显卡驱动,重装驱动。

前段时间刚装了驱动:Ubuntu 下安装 nvidia 显卡驱动

但是最近准备用 GPU 跑模型时,提示 cuda 不存在。前段时间刚装的驱动,怎么会不存在呢?

  • 第一步,打开终端,先用 nvidia-smi 查看一下,发现如下报错:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.

  • 第二步,使用 nvcc -V 检查驱动和 cuda。
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Aug_15_21:14:11_PDT_2021
Cuda compilation tools, release 11.4, V11.4.120
Build cuda_11.4.r11.4/compiler.30300941_0


发现驱动是存在的,于是进行下一步

  • 第三步,查看已安装驱动的版本信息
ls /usr/src | grep nvidia

比如我的驱动版本是:nvidia-47.074

  • 第四步,依次输入以下命令
sudo apt-get install dkms

sudo dkms install -m nvidia -v 470.74

等待安装完成后,再次输入 nvidia-smi,查看 GPU 使用状态:

最后,我们熟悉的页面又回来了!问题得以解决!

reference:

  • https://blog.csdn.net/u012114438/article/details/104425573
  • https://blog.csdn.net/qq_38327353/article/details/108219702
  • https://www.jianshu.com/p/3931ca0d8275

你可能感兴趣的:(#,tensorflow安装,调试bug,语法出错等问题,数据库,驱动失效,NVIDIA)