Ubuntu服务器有一张显卡nvidia-smi指令不能显示问题(未解决)

问题描述:

服务器重装Ubuntu 22.04系统,具备10张显卡,使用nvidia-smi显示只有9张显卡,有一张显卡消失了,重装驱动也不能解决问题。参考博客:(600条消息) ubuntu 18.04 两张GPU显卡,nvidia-smi只显示一张_nvidia-smi只显示一张显卡_Jason.su.ai的博客-CSDN博客

Ubuntu服务器有一张显卡nvidia-smi指令不能显示问题(未解决)_第1张图片

 1、使用lspci |grep NVIDIA指令看看显卡物理连接是否出现问题

Ubuntu服务器有一张显卡nvidia-smi指令不能显示问题(未解决)_第2张图片

 可以看到10块显卡都能显示,说明连接没有问题。

2、使用指令ls -l /dev/nvidia*查看nvidia驱动是否正常

Ubuntu服务器有一张显卡nvidia-smi指令不能显示问题(未解决)_第3张图片

可以看到10块显卡的驱动都正常。

3、使用echo "hello" > /dev/nvidia0 查看通信是否正常

Ubuntu服务器有一张显卡nvidia-smi指令不能显示问题(未解决)_第4张图片

可以看到第6块显卡读写出现错误,出现这种情况应该就是该块显卡坏掉了,少一块就少一块吧。没有解决问题,解决后再来更新!

你可能感兴趣的:(ubuntu,linux)