slurm安装配置_Slurm任务调度系统部署和测试(源码)(1)

1. 概述

slurm任务调度系统,主要应用在HPC集群资源管理和任务调度。具体信息参见slurm官方网站:https://slurm.schedmd.com/

部署Slurm任务调度系统,需要部署NTP内网时间同步服务器,LDAP全局认证服务器,Mysql数据库服务器

本篇博客主要记录如何部署和使用slurm任务调度系统。

1.1 节点信息

节点主机名

操作系统

主机地址

主机角色

node11

centos6.5_x86_64

192.168.10.11

主控制器

node12

centos6.5_x86_64

192.168.10.12

备控制器

node13

centos6.5_x86_64

192.168.10.13

数据存储主控制器

node14

centos6.5_x86_64

192.168.10.14

数据存储备控制器

node15

centos6.5_x86_64

192.168.10.15

MySQL数据库服务器

2. 节点准备

本篇博客的节点,均有已经部署好NTP和LDAP服务客户端的node11克隆,减少部署过程的繁琐。

KVM克隆虚拟机,参见博客《KVM虚拟机管理——虚拟机克隆.md》

博客园地址:https://www.cnblogs.com/liwanliangblog/p/9193910.html

根据博客内容指导,很容易克隆出其他几台虚拟机,提供slurm任务调度环境部署和测试。

3. 部署NTP服务器

4. 部署LDAP服务器

5. 部署Munge认证服务

6. 部署Mysql数据库服务

7. 部署slurm

7.1 创建slurm用户

需要创建slurmadmin全局用户,用于运行slucrmctld和slurmdbd;

slurmd因为负责节点的状态,因此需要root权限,不需要创建;

同样在LDAP中创建slurmadmin用户

参见博客:《LDAP-openldap服务部署和测试(YUM安装).md》

博客园地址:https://www.cnblogs.com/liwanliangblog/p/9193916.html

7.2 挂载全局文件系统

在前面的博客中提到,把虚拟机console的/usr/local,作为全局共享目录,通过NFS文件系统实现共享。

你可能感兴趣的:(slurm安装配置)