Linux系统下GPU状态监测命令

目录

1.gpu监测命令

 2.screen创建会话

3.查询会话

4.恢复会话

5.杀死会话

6.命令指定GPU

7.py文件中指定GPU


用VScode登录服务器进行代码的Debug,下载扩展包 Remote-SSH

VSCode使用ssh密钥免密远程登录服务器&配置解释器_池塘怪谈的博客-CSDN博客_vscode配置ssh密钥

1.gpu监测命令

nvidia-smi

watch -n 1 -d nvidia-smi # 每隔一秒刷新一次

Linux系统下GPU状态监测命令_第1张图片

 2.screen创建会话

# screen_name是用户自己取的名字
screen -S screen_name

3.查询会话

screen -r

4.恢复会话

screen -r 会话号

##若是attached正连接的需要先断开再恢复
screen -d 会话号
screen -r 会话号

5.杀死会话

screen -X -S 会话号 quit

6.命令指定GPU

单GPU

CUDA_VISIBLE_DEVICES=2 python train.py

多GPU

CUDA_VISIBLE_DEVICES=2,3,4 python train.py

7.py文件中指定GPU

import os 
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"  #(保证程序cuda序号与实际cuda序号对应)
os.environ['CUDA_VISIBLE_DEVICES'] = "0,1"  #(代表仅使用第0,1号GPU)

#单GPU
os.environ["CUDA_VISIBLE_DEVICES"] = "2"  #代表只使用第3个gpu

你可能感兴趣的:(python,开发语言)