failed to initialize nvml driver/library version mismatch ubuntu

failed to initialize nvml driver/library version mismatch ubuntu_第1张图片

英伟达驱动版本是384.130


显示的NVRM version: NVIDIA UNIX x86_64 Kernel Module是:384.130。 若是旧的版本就会出现如下问题。

这个问题出现的原因是kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法reload kernel mod。

方法如下:

就两步

  1. unload nvidia kernel mod
  2. reload nvidia kernel mod
执行
sudo rmmod nvidia
sudo nvidia-smi

若出现问题

$ sudo rmmod nvidia
rmmod: ERROR: Module nvidia is in use by: nvidia_modeset nvidia_uvm

这时,就要一点一点的卸载整个驱动了,首先要知道现在kernel mod 的依赖情况,首先我们从错误信息中知道,nvidia_modeset nvidia_uvm 这两个 mod 依赖于 nvidia, 所以要先卸载他们

failed to initialize nvml driver/library version mismatch ubuntu_第2张图片


先查看下有哪些进程使用了 nvidia*

```

sudo fuser -v /dev/nvidia* #查找占用GPU资源的PID

sudo lsof -n -w /dev/nvidia* #查找占用GPU资源的PID

```

failed to initialize nvml driver/library version mismatch ubuntu_第3张图片

这些进程有个了解,如果一会卸载失败,记得关闭相关进程。

卸载

sudo rmmod nvidia_uvm
sudo rmmod nvidia_modeset



#参考文献

解决Driver/library version mismatch

NVIDIA驱动问题解决方案:Failed to initialize NVML: driver/library version mismatch


你可能感兴趣的:(Linux)