服务器的GPU使用率显示100%怎么办?

当我们使用nvidia-smi 查看 GPU 状态时,显示GPU使用率100%

服务器的GPU使用率显示100%怎么办?_第1张图片

那么该如何解决呢?

分析后,可能的原因是加载 NVIDIA 驱动时,ECC Memory Scrubbing 机制造成的。

解决办法:

执行 nvidia-smi -pm 1 命令,让 GPU Driver 进入 Persistence 模式。

首先登陆我们的GPU云服务器,输入下面的命令:

nvidia-smi -pm 1

在这里插入图片描述

然后再来查看一下GPU 使用率

nvidia-smi

服务器的GPU使用率显示100%怎么办?_第2张图片

可以看到已经显示正常了。

原文地址:https://leffz.com/1601.html

你可能感兴趣的:(Linux,GPU,GPU服务器)