超算上传作业步骤

一、加载环境

查看已有的环境

module avail 

超算上传作业步骤_第1张图片

加载anaconda/2020.11

module load anaconda/2020.11

查看已创建过的conda 环境

conda env list

超算上传作业步骤_第2张图片加载cuda11.4环境 

 module load cuda/11.4

加载cudnn 环境

module load cudnn/8.2.4_cuda11.4

查看已加载的环境

module list

 激活anaconda环境

source activate py37

二、文件上传

超算上传作业步骤_第3张图片

 三、作业提交

run.sh脚本编写

超算上传作业步骤_第4张图片

 作业提交命令

sbatch --gpus=1 ./run.sh

执行此命令后即申请到1GPU 卡、6CPU 核、60GB内存资源。作业显示为
R(Runing)状态(parajobs 命令查看作业状态)后即开始执行run.sh脚本中的
内容。

 sbatch 提交一个批处理作业脚本到Slurm。批处理脚本名可以在命令行上传
递给sbatch,如没有指定文件名,则sbatch 从标准输入中获取脚本内容。
脚本文件基本格式:
• 第一行以#!/bin/bash 等指定该脚本的解释程序,/bin/bash 可以变为/bin/sh、
/bin/csh 等。

• 在可执行命令之前的每行“#SBATCH”前缀后跟的参数作为作业调度系统参
数。
默认,标准输出和标准出错都定向到同一个文件slurm-%j.out,“%j”将被作
业号 代替。

parajjobs

查看运行情况

超算上传作业步骤_第5张图片

**************************************************************************************************************

目前暂不知晓如何在程序运行终止的时候输入scancel ID号 取消作业

你可能感兴趣的:(深度学习,人工智能)