nvidia-smi &nvidia-docker

nvidia-smi

nvidia-smi是nvidia 的系统管理界面 ,其中smi是System management interface的缩写,它可以收集各种级别的信息,查看显存使用情况。此外, 可以启用和禁用 GPU 配置选项 (如 ECC 内存功能)。
直接运行这个命令会得到下图输出
nvidia-smi &nvidia-docker_第1张图片

  • Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温(比如我们实验室的服务器是常年放在空调房间里的)。
  • Temp:是温度,单位摄氏度。
  • Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
  • Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
  • Bus-Id是涉及GPU总线的东西,domaindevice.function
  • Disp.A是Display Active,表示GPU的显示是否初始化。
  • Memory Usage是显存使用率。
    第七栏是浮动的GPU利用率。
    第八栏上方是关于ECC的东西。
    第八栏下方Compute M是计算模式。

nvidia-docker

nvidia-docker是对docker进行的二次封装,docker引擎启动的时候并不能直接支持Nvidia的GPU,只能是每次都进入docker容器,重新安装nvidia 驱动,然后设置相应的参数来启动容器,而且这种方式还要求docker容器的驱动版本和宿主机的驱动版本完全一直,否则docker镜像无法共享。为了解决这个问题,nvidia开发了nvidia-docker工具,使用它创建新的docker镜像,启动容器时必要的设备和驱动会自动挂载。
nvidia-smi &nvidia-docker_第2张图片

官方参考

https://github.com/NVIDIA/nvidia-docker/wiki

参考

https://www.cnblogs.com/navysummer/p/11224057.html
https://blog.csdn.net/apacat/article/details/100144302

你可能感兴趣的:(linux)