nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及避坑解决方案

nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及解决方案

过了一段时间重新登录linux系统,发现nvidia用不了了,发现是由于重启服务器,linux内核升级导致的。

解决方案:
1.打开终端,输入nvcc -V 检查驱动和cuda,发现是都有的

2.查看已安装的驱动版本信息

ls /usr/src | grep nvidia

可以查到我的驱动版本是nvidia-470.74

3.安装dkms

sudo apt-get install dkms

如果此时权限不够,切换到root用户。切换方法:
(1)输入sudo passwd root
(2)输入新密码,回车后会提醒确认新密码,再次输入后回车
(3)输入su,按照提示输出刚设置的密码,就进入到了root状态

4.重新安装驱动

sudo dkms install -m nvidia -v 470.103.01

输入nvidia-smi,没有报错。成功安装,可以正常使用

参考链接:
https://blog.csdn.net/nizhenshishuai/article/details/123873453
https://blog.csdn.net/m0_58691386/article/details/126670898

你可能感兴趣的:(linux,服务器,python)