nvidia-smi报错 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver.

1、报错:nvidia-smi报错

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest nvidia driver is installed and running.

2、出现此错误的状况是:

  • 曾经安装成功过显卡驱动或ubuntu20系统(可能还不太稳定),装系统时自带显卡驱动。由于重启等原因导致显卡驱动掉了,需要重装显卡。

3、解决:

3.1、使用命令:sudo ubuntu-drivers autoinstall安装显卡如果正常安装成功即可。但是大概率可能因为ubuntu源的问题,导致安装失败,因此需要重新设置源并进行更新。

3.2、更新源

  • sudo apt-get update
    从服务器获取全部可用的、最新的软件包列表,并缓存到本地电脑。
  • sudo apt-get upgrade
    这个命令,会把本地已安装的软件,与刚下载的软件列表里对应软件进行对比,如果发现已安装的软件版本太低,就会提示你更新。upgrade 不会删除在列表中已经没有的软件包,也不会安装有依赖需求但尚未安装的软件包。
  • 此处要检查是否所有的包都更新完毕,如果上面命令执行完后显示:21 upgraded, 3 newly installed, 1 to remove and 0 not upgraded.不是全0,会导致显卡安装失败,原因可能是仍有一些依赖包没有更新,因此需要先执行 sudo apt-get dist-upgrade
  • 更新之后再自动安装显卡,如果还报以下错误:
    The following packages have unmet dependencies:
    nvidia-driver-455 : Depends: libnvidia-gl-455 (= 455.38-0ubuntu0.20.04.1) but it is not going to be installed
    Depends: libnvidia-extra-455 (= 455.38-0ubuntu0.20.04.1) but it is not going to be installed
    。。。。。。。
    Depends: libnvidia-fbc1-455 (= 455.38-0ubuntu0.20.04.1) but it is not going to be installed
    Recommends: libnvidia-compute-455:i386 (= 455.38-0ubuntu0.20.04.1)
    Recommends: libnvidia-decode-455:i386 (= 455.38-0ubuntu0.20.04.1)
    Recommends: libnvidia-gl-455:i386 (= 455.38-0ubuntu0.20.04.1)
    E: Unable to correct problems, you have held broken packages.
    可能是包冲突进入下面的操作。

3.3、解决包冲突问题:

  • sudo apt-get dist-upgrade
    可能会为了解决软件包冲突而删除一些已安装的软件包,也可能会为了解决软件包依赖问题安装新的软件包。
  • 再安装显卡即可成功。

3.4、上面如果在使用安装显卡的命令后没有报相关错误就可以重启机器,再次使用nvidia-smi就可成功。

注:1. 有时还会遇到提示说要执行此命令sudo apt autoremove,这条命令会卸载所有自动安装且不再使用的软件包,所以确定需要使用此命令再使用,否则可能删除掉其他的软件(经测试基本不会误删)。
2. 如果发现以上安装仍然失败可以参考这个链接,不必禁用nouveau,可以直接从第2步,安装显卡开始。

你可能感兴趣的:(解决问题,深度学习,nvidia)