【windows下监控GPU状态】利用nvidia-smi模块监测GPU的实时状态

在用GPU跑并行运算的时候,我们经常会需要查看GPU的利用率,温度和显存占用率。但对于windows系统而言,在任务管理器内只能看到CPU的利用率和内存占有率等信息,根本没有GPU的相关信息。LInux系统下的GPU查看请另跳转。

如何查看GPU运行状态

Win+R输入cmd进入cmd.exe界面,输入:

cd C:\Program Files\NVIDIA Corporation\NVSMI	# 进入NVSMI文件夹
nvidia-msi	# 启动监测程序

GPU运行界面解析

在这里可以看到GPU的名称、温度、利用情况和GPU利用率,还有正在工作的GPU进程。这些信息已经足够我们对GPU的状态进行监控:
【windows下监控GPU状态】利用nvidia-smi模块监测GPU的实时状态_第1张图片

参数注释

  • 第一栏GPU Fan:N/A是风扇转速,从0到100%之间变动,我们的风扇转速为55%。
  • 第二栏的Temp:是温度,单位摄氏度。当前82摄氏度。
  • 第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
  • 第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
  • 第五栏的Bus-Id是涉及GPU总线的东西,domain?device.function
  • 第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。
  • 第五第六栏下方的Memory Usage是显存使用率。 我们8G的显存使用了5G左右。
  • 第七栏是浮动的GPU利用率,我们的利用率是95%
  • 第八栏上方是关于ECC的东西。
  • 第八栏下方Compute M是计算模式。

你可能感兴趣的:(TensorFlow)