【随笔】vscode ssh连接GPU服务器的经历

2021-1-5
慢慢开始接触远程“炼丹”,今天做一个初步的尝试。
参考了:《如何用本地的VSCode连接极链AI的GPU服务器》

基本上还算是顺利吧。
下载好remote ssh插件之后,注册了一下极链AI,获得了新手¥50的礼包,用3.5¥/h的2080Ti机器做了一下最基本的测试。
ssh连接基本是一本道,先自动配置好config文件,然后点“+”号打开服务器上的文件或目录,会弹出一个新的vscode连接窗口,这里面才是真正的连接到服务器的部分。第一次打开的时候需要输入密码,之后再打开其他目录就不需要了。

根据极链AI的目录结构,对于代码运行做出了尝试。最开始没注意到速度问题,在/data-user上运行,贼慢,后来就在/data-input上运行的,速度快了很多。/data-user上存储的文件不会丢失,/data-input上的是和实例相关的(长时间不用需要创建镜像来存储)。

https://cloud.videojj.com/help/docs/data_manage.html
【随笔】vscode ssh连接GPU服务器的经历_第1张图片
【随笔】vscode ssh连接GPU服务器的经历_第2张图片
然后好长一段时间我都在研究如何从本地向vscode复制文件或文件夹,未果。
然后偶然发现可以直接拖拽。。。普通小文件拖拽的上传速度还行,大一点的文件夹要上传好久。
之后又看了一下官方文档对于数据集的解决方法。

后面有时间试试:先把.zip压缩文件通过控制台上传到/data-user目录中,然后开启服务器,使用cp命令复制到/data-input或/data-tmp目录下,unzip解压之后再运行。 这样应该会快一些。

我直接把之前根据LeNet写的手写数字识别的代码拖到/data-input上了,python xxxx.py执行了一下,下载数据集贼快,很快就训练完了20个epoch,准确率达到了99%,也算是比较成功的一次尝试吧。关于终端的调用,快捷键是ctrl+·(就是左上角esc下面的那个),并且我试了一下单纯叉掉终端并不会影响服务器的执行(这和官方文档不太一样),但是千万不能关掉vscode窗口,关了就等于放弃连接了。
关机之前使用cp把程序复制到了/data-user目录下面,关机之后创建了mnist_test的实例镜像。在控制台上能够看到/data-user中有这个程序。

关于jupyter的使用问题(打开ipython文件乱码)和pytorch讨厌的“红线”问题(这个并不是程序有问题,但是能治好强迫症)还没有解决。

一个下午的探索就这样告一段落了,还算是比较顺利吧,下面的计划是去跑一跑GraphSAGE的程序看看能不能跑的通,阅读代码什么的。

最后,特此鸣谢h大佬的指点,tql!

你可能感兴趣的:(日常随笔,ssh,vscode,GPU服务器)