Linux中显卡用户管理相关应用及命令行

目的:管理相应显卡环境,汇总指令方便运用与查阅。

相关文档:常用Linux指令汇总(显卡|读写|编译|进程|用户|挂载)

目录

一、显卡相关

1.1  nvidia-smi

动态显示显卡占用

1.2 运行程序时指定显卡

1.3 端口号与PID号查询

二. 用户与进程相关

2.1 端口号与PID号查询

2.2 通过PID查询用户名

 2.3 查询PID的命令行

2.4 查询当前用户所有进程

2.5 查看相关命令行

三、清空显存

四、用户及权限管理

4.1 查看已有用户

4.2 加入新用户


一、显卡相关

1.1  nvidia-smi

http://hui.sohu.com/infonews/article/6337322514200395777

指令中间连着的不加空格。

第一栏的Fan:风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速不是实际转速。有的设备不会返回转速,因为它不依赖风扇冷却。

第二栏的Temp:是温度。
第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
第五栏的Bus-Id是涉及GPU总线的东西,domain:bus:device.function
第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。
第五第六栏下方的Memory Usage是显存使用率。
第七栏是浮动的GPU利用率。
第八栏上方是关于ECC的东西。
第八栏下方Compute M是计算模式。

动态显示显卡占用

watch -n 3 nvidia-smi

这个指令为动态显示显卡占用,-n后跟的参数为秒,即三秒更新一次。

1.2 运行程序时指定显卡

https://www.cnblogs.com/darkknightzh/p/6591923.html

CUDA_VISIBLE_DEVICES=1 python my_script.py

1.3 端口号与PID号查询

https://www.cnblogs.com/understander/p/5546458.html

由端口号查PID号  sudo netstat -antup 

由PID号查端口号 sudo netstat -antup|grep PID

由进程名查询PID号 sudo ps -ef|grep 进程名

二. 用户与进程相关

2.1 端口号与PID号查询

https://www.cnblogs.com/understander/p/5546458.html

由端口号查PID号  sudo netstat -antup 

由PID号查端口号 sudo netstat -antup|grep PID

由进程名查询PID号 sudo ps -ef|grep 进程名

netstat -an | grep 3306   //查看所有3306端口使用情况

2.2 通过PID查询用户名

lsof -p [PID]

例如:

lsof -p 15223
lsof: WARNING: can't stat() tracefs file system /sys/kernel/debug/tracing
      Output information may be incomplete.
COMMAND   PID   USER   FD      TYPE DEVICE SIZE/OFF NODE NAME
darknet 15223 chengx  cwd   unknown                      /proc/15223/cwd (readlink: Permission denied)
darknet 15223 chengx  rtd   unknown                      /proc/15223/root (readlink: Permission denied)
darknet 15223 chengx  txt   unknown                      /proc/15223/exe (readlink: Permission denied)
darknet 15223 chengx NOFD                                /proc/15223/fd (opendir: Permission denied)

 2.3 查询PID的命令行

ps [PID]

$ps 54083
  PID TTY      STAT   TIME COMMAND
54083 pts/12   Rl+  449:08 python train-new.py

2.4 查询当前用户所有进程

ps -u

ps -u
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
xxr      37561  0.1  0.0  25304  6192 pts/0    Ss   21:32   0:00 -bash
xxr      39243  0.0  0.0  39100  3352 pts/0    R+   21:33   0:00 ps -u

2.5 查看相关命令行

(torch31py36) yxxxxxxxxx@yxxxxxxxxxxx:~/share$ ps aux|grep python
xx+   755 26.6  3.4 92192108 9059784 ?    Rl   16:39   0:14 python -u train.py
xx+   756 25.8  3.4 92185052 9052848 ?    Sl   16:39   0:14 python -u train.py
xx+   757 26.0  3.4 92187404 9055216 ?    Sl   16:39   0:14 python -u train.py
xx+   758 25.9  3.4 92180348 9048160 ?    Sl   16:39   0:14 python -u train.py
xx+  1741  0.0  0.0  15956  1020 pts/8    S+   16:40   0:00 grep --color=auto python
xx+  6948  184  3.9 92336040 10445620 ?   Rl   5月24 8035:59 python -u train.py
xxx+ 11400  0.0  0.0  27912  9116 pts/9    S+   1月18   0:00 python

 

三、清空显存

kill掉程序之后仍然占用着显存,需要手动清理显存。输入下面命令行

sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

 

四、用户及权限管理

https://www.cnblogs.com/SH-xuliang/p/8422753.html

4.1 查看已有用户

然后输入命令行cat /etc/passwd,直接按下回车键即可

4.2 加入新用户

adduser \your_user_name

后面根据操作提示输入密码等即可

五、top查看CPU情况

https://www.cnblogs.com/jiqing9006/p/9270504.html

VIRT: 虚拟内存,RES:常驻内存resident memory usage,SHR:共享内存

5.1 按占用排序

输入top后,输入相应指令进行排序。

按CPU占用率排序:输入大写P

按常驻内存占用率排序:输入大写M

5.2 显示细节

显示完整命令行:c

更改刷新频率,d+数字+enter

5.3 退出

q

你可能感兴趣的:(linux)