目的:管理相应显卡环境,汇总指令方便运用与查阅。
相关文档:常用Linux指令汇总(显卡|读写|编译|进程|用户|挂载)
目录
一、显卡相关
1.1 nvidia-smi
动态显示显卡占用
1.2 运行程序时指定显卡
1.3 端口号与PID号查询
二. 用户与进程相关
2.1 端口号与PID号查询
2.2 通过PID查询用户名
2.3 查询PID的命令行
2.4 查询当前用户所有进程
2.5 查看相关命令行
三、清空显存
四、用户及权限管理
4.1 查看已有用户
4.2 加入新用户
http://hui.sohu.com/infonews/article/6337322514200395777
指令中间连着的不加空格。
第一栏的Fan:风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速不是实际转速。有的设备不会返回转速,因为它不依赖风扇冷却。
第二栏的Temp:是温度。
第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
第五栏的Bus-Id是涉及GPU总线的东西,domain:bus:device.function
第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。
第五第六栏下方的Memory Usage是显存使用率。
第七栏是浮动的GPU利用率。
第八栏上方是关于ECC的东西。
第八栏下方Compute M是计算模式。
watch -n 3 nvidia-smi
这个指令为动态显示显卡占用,-n后跟的参数为秒,即三秒更新一次。
https://www.cnblogs.com/darkknightzh/p/6591923.html
CUDA_VISIBLE_DEVICES=1 python my_script.py
https://www.cnblogs.com/understander/p/5546458.html
由端口号查PID号 sudo netstat -antup
由PID号查端口号 sudo netstat -antup|grep PID
由进程名查询PID号 sudo ps -ef|grep 进程名
https://www.cnblogs.com/understander/p/5546458.html
由端口号查PID号 sudo netstat -antup
由PID号查端口号 sudo netstat -antup|grep PID
由进程名查询PID号 sudo ps -ef|grep 进程名
netstat -an | grep 3306 //查看所有3306端口使用情况
lsof -p [PID]
例如:
lsof -p 15223
lsof: WARNING: can't stat() tracefs file system /sys/kernel/debug/tracing
Output information may be incomplete.
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
darknet 15223 chengx cwd unknown /proc/15223/cwd (readlink: Permission denied)
darknet 15223 chengx rtd unknown /proc/15223/root (readlink: Permission denied)
darknet 15223 chengx txt unknown /proc/15223/exe (readlink: Permission denied)
darknet 15223 chengx NOFD /proc/15223/fd (opendir: Permission denied)
ps [PID]
$ps 54083
PID TTY STAT TIME COMMAND
54083 pts/12 Rl+ 449:08 python train-new.py
ps -u
ps -u
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
xxr 37561 0.1 0.0 25304 6192 pts/0 Ss 21:32 0:00 -bash
xxr 39243 0.0 0.0 39100 3352 pts/0 R+ 21:33 0:00 ps -u
(torch31py36) yxxxxxxxxx@yxxxxxxxxxxx:~/share$ ps aux|grep python
xx+ 755 26.6 3.4 92192108 9059784 ? Rl 16:39 0:14 python -u train.py
xx+ 756 25.8 3.4 92185052 9052848 ? Sl 16:39 0:14 python -u train.py
xx+ 757 26.0 3.4 92187404 9055216 ? Sl 16:39 0:14 python -u train.py
xx+ 758 25.9 3.4 92180348 9048160 ? Sl 16:39 0:14 python -u train.py
xx+ 1741 0.0 0.0 15956 1020 pts/8 S+ 16:40 0:00 grep --color=auto python
xx+ 6948 184 3.9 92336040 10445620 ? Rl 5月24 8035:59 python -u train.py
xxx+ 11400 0.0 0.0 27912 9116 pts/9 S+ 1月18 0:00 python
kill掉程序之后仍然占用着显存,需要手动清理显存。输入下面命令行
sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh
sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh
https://www.cnblogs.com/SH-xuliang/p/8422753.html
然后输入命令行cat /etc/passwd,直接按下回车键即可
adduser \your_user_name
后面根据操作提示输入密码等即可
https://www.cnblogs.com/jiqing9006/p/9270504.html
VIRT: 虚拟内存,RES:常驻内存resident memory usage,SHR:共享内存
输入top后,输入相应指令进行排序。
按CPU占用率排序:输入大写P
按常驻内存占用率排序:输入大写M
显示完整命令行:c
更改刷新频率,d+数字+enter
q