【error】nvidia-smi无效的解决策略

一、问题描述

更新软件之后,再调用nvidia-smi出现下面的问题

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

二、问题分析

可能是因为更新了部分内核,导致不匹配或者驱动掉了。

三、解决方案

3.1 方案一:重新安装驱动

  • 1、卸载
sudo apt-get --purge remove nvidia*
sudo apt autoremove
  • 2、安装
    1)自动安装
sudo ubuntu-drivers autoinstall      

2)手动安装

ubuntu-drivers devices
sudo apt install nvidia-driver-535

经过本人实测,该问题还是会出现

3.2 方案二:

sudo apt-get install dkms
sudo dkms install -m nvidia -v 535.80

# 版本号 可以通过下面的命令查到
# ls /usr/src | grep nvidia

经过本人实测,该问题还是会出现

3.3 方案三 加载驱动模块

sudo modprobe nvidia
  • 可能会出现下面的问题:
    modprobe error: could not insert ‘nvidia’: Operation not permitted
  • 解决方案:
    我们进入BIOS 把 secure boot 选项关掉即可。
    secure boot 大概的作用时为了保护内核的启动安全;
    linux secure boot 状态查询:mokutil --sb-state

你可能感兴趣的:(nvidia-smi,error)