ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练

最近深度学习项目,经常ssh远程链接服务器,模型一跑就是几十个小时,有时候需要查看状态。

不能因为意外断网,而中断模型的训练。这里介绍个简单的方法,不怕意外断网。

1.如下图,sudo ssh -l user 192.168.1.245    链接服务器

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第1张图片

2.利用screen 命令 ,重起一个screen。这个就相当于远程服务器自己启动一个命令行接口。

     screen -S david    这里稍微解释一下, david是你起的名字,用于后面查找这个screen,需要记牢!

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第2张图片

发现服务器自己起了一个新的sreen

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第3张图片

3. 这时候我们可以模拟一个任务,比如笔者写了一个python循环输出log,比较简单的。

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第4张图片

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第5张图片

如下图,执行它一下。

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第6张图片

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第7张图片

4.我们按下这个terminal的右上角的×,断开他。

5.启动一个新的terminal , 输入 ssh 重新链接远程服务器  sudo ssh -l user 192.168.1.245, 并输入命令

screen -ls  查看远程服务器存在的screen。

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第8张图片

6.如下图,我们试试 30362是不是我们之前的 python 循环任务呢?

screen -r  30362

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第9张图片

如下图,果然是我们之前的screen

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第10张图片

7.至此我们重新接管了 之前的命令行窗口。不用担心中途意外情况了。

如下图,中断一下这个python循环程序。

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第11张图片

8.对了,怎么断开当前的screen呢。用快捷键, 先按下  Ctrl + A, 再输入 K 键

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第12张图片

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第13张图片

如下图, 我们再次输入 screen -ls ,恩, 30362 没有了。

ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练_第14张图片

你可能感兴趣的:(ssh远程链接服务器,利用screen命令,避免因为断网而中断模型训练)