01.监控深度学习平台的运行情况

1.需求

监控深度学习平台的运行情况

2.方法

watch -n 1 nvidia-smi

01.监控深度学习平台的运行情况_第1张图片

3.影响因素

  • Volatile GPU util
    调节batchsize和num_workers,使得该数值尽量达到100%
  • Memory-Usage
    使得GPU内存尽量占满

你可能感兴趣的:(深度学习平台,深度学习,pytorch,tensorflow)