深度学习实验基础02:实验室服务器使用

服务器内存

1. 查看GPU是否空闲:

nvidia-smi

深度学习实验基础02:实验室服务器使用_第1张图片

表头释义:Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A;
Temp:显卡内部的温度,单位是摄氏度;
Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;
Pwr:能耗表示;
Bus-Id:涉及GPU总线的相关信息;
Disp.A:是Display Active的意思,表示GPU的显示是否初始化;
Memory Usage:显存的使用率; 主要看这个
Volatile GPU-Util:浮动的GPU利用率;
Compute M:计算模式;
下边的Processes显示每块GPU上每个进程所使用的显存情况。

2.查看进程的具体信息:

ps aux|grep pid

查看pid号进程的具体信息,可以看到是哪个用户运行哪个程序
判断进程是不是死在里面了或者可以询问实验室的同学什么时候能跑完实验

3.杀进程:

kill -9 pid

上传文件到服务器

1.改变权限

sudo chomd 777 
sudo chmod 777 -R ./Zero-DCE/

服务器联网

1.连接网络

cd /home/china sudo su  
nano rj.sh  #.rj.sh为锐捷的上网文件,里面放的是校园网的用户和密码
sudo su
./connect .sh

深度学习实验基础02:实验室服务器使用_第2张图片
一般都单开一个session,还有一种连接方法如下

sudo su
nano rj.sh
bash rj.sh

2.如果服务器上不了网:
1)重置:
dhclient enp2s0

2)查看IP地址:
网络变了ip地址会变:ifconfig


github下载文件

1.直接从git上copy到服务器就不用下载再上传,省了不少步骤
但是由于我们实验室处于长期无网的状态,所以这个只能本地下载,然后再映射上传,关于映射,之后可以出一篇,因为这样上传真的超快

git clone https://github.com/JDAI-CV/fast-reid 

2.github下载加速

git clone  https://github.com.cnpmjs.org /JDAI-CV/fast-reid 

把ip地址从英文变成数字

dhclient

定位文件

locate rj.sh(文件名称)

把之前的使用整理了一下,瞬间清晰许多,开心!

你可能感兴趣的:(实验室服务器使用指南,linux,python,深度学习)