【tensorflow】GPU的使用命令

 在使用GPU进行深度学习实验,了解GPU的状态非常重要

1、nvidia-smi

显示GPU当前的状态和属性

【tensorflow】GPU的使用命令_第1张图片

GPU                  :GPU 编号; 
Name                :GPU 型号; 
Persistence-M  :持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态; 
Fan                   :风扇转速,从0到100%之间变动,N/A表示没有风扇; 
Temp                :温度,单位是摄氏度; 
Perf                  :性能状态,从P0到P12,P0表示最大性能,P12表示最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。 
Pwr:Usage/Cap:能耗; 
Memory Usage :显存使用率; 
Bus-Id               :涉及GPU总线的东西,domain:bus:device.function; 
Disp.A               :Display Active,表示GPU的显示是否初始化; 
Volatile GPU-Util:浮动的GPU利用率; 
Uncorr. ECC     :Error Correcting Code,错误检查与纠正; 
Compute M      :compute mode,计算模式。

下面的Processes是正在运行的程序进程情况

  • watch -n 1 -d nvidia-smi           #每隔1秒刷新一次 
  • nvidia-smi –i xxx                       #指定某个GPU
  • nvidia-smi –f xxx                       #将查询的信息输出到具体的文件中,不在终端显示
  • nvidia-smi –l xxx                       #动态刷新信息(默认5s刷新一次),按Ctrl+C停止,可指定刷新频率,以秒为单位

2、指定GPU运行程序

CUDA_VISIBLE_DEVICES=设备编号 python main.py

在某个指定设备编号下运行程序,或者直接写到程序中

os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID" #按照PCI_BUS_ID顺序从0开始排列GPU设备
os.environ["CUDA_VISIBLE_DEVICES"]="0" #设置当前使用的GPU设备仅为0号设备 设备名称为 ‘/gpu:0’

这样的表达更为灵活

参考:

1、https://blog.csdn.net/handsome_bear/article/details/80903477

你可能感兴趣的:(TensorFlow)