关于使用服务器运行代码的那些事儿

        博主虽然学计算机但仍是一个小白,所以这篇文章是一篇服务器启蒙教程。操作系统为Linux CentOS,记录了学校服务器的正确打开方式(也许),但至少是我实践出来的正确的道路。博主本科时候没有使用过这种以提交作业为使用方式的服务器,硕士刚开学就疯狂摸索,疯狂出错,终于杀出一条血路,希望给后来的学弟学妹们提供一些参考,这里也会放一些常用的服务器命令,方便我找(bushi)。

1.第一次使用服务器一定要建一个属于自己的虚拟环境

        我刚上手就没建自己的虚拟环境,刚巧我运行的程序需要的python版本更高,需要我安装更高版本的python,而我不想把旧环境覆盖掉,因此需要把旧环境换个名字,而我没有权限,在反复试错之后,我询问了师兄,师兄告诉我要建一个自己的虚拟环境,用这个虚拟环境去装包。。。建议一个程序匹配一个虚拟环境,不然装包装库很麻烦。

$ module load anaconda3
$ conda create --name 你的环境名 python=3.7.9 #这样就建好了一个装有python3.7.9版本的虚拟环境,当然也可以不写最后一句,等环境建好之后再装

 2.建完要看程序里还有哪些包需要装

        可以用

$ pip list

命令列出当前python环境里已经装了哪些包。直接用pip install命令就可以安装想要的包和版本号。注意一定要装完整,不然会报错,使用作业提交系统运行程序,程序报错之后不能直观地反映出来,因此装包这一步还是要仔细检查不要有遗漏。

3.使用bsub等一系列命令提交脚本去运行

        我运行的是.sh文件,使用GPU,需要在文件中加入让服务器看得懂的命令,包括选择哪个队列。要在.sh文件中开头输入这些命令。

#!/usr/bin/env bash

#BSUB -J 当前文件名(后缀是.sh)

#BSUB -q 队列名

#BSUB -o %J.out

#BSUB -e %J.err

#BSUB -gpu "num=1:mode=exclusive_process:aff=yes"
module load anaconda3


python 你要执行的文件

        就这样我成功开启了第一步。后续运行代码遇到的问题我同样会整理到CSDN中,如果有不规范的欢迎指出,希望能和大家一起进步!

你可能感兴趣的:(机器学习,服务器,运维)