作为测试,在 VMware 上安装 centos7,然后在 centos7 上安装 lsf 10.2 社区版 (其实是 10.1 版本),社区版和正式版的安装基本一致,不过不需要 license。
redhat 上安装步骤基本相同。
下面是具体的安装步骤:
通过修改 /etc/hostname 设置机器名,机器名不要太长,也不要带特殊字符。
通过 ifconfig 指令获取机器的 IP 地址。注意如果是通过 VMware 安装的虚拟机,每次重启后 ip 地址都会变,所以最好将其 IP 设置为静态地址。
通过修改 /etc/hosts 来标明 hostname 和 IP 的对应关系。
重启机器使之生效。
确认 sshd 服务已开启,如未开启,用 root 账号执行 service sshd start 开启。
配置 ssh 免密登陆。
用 ssh-keygen 命令产生公钥和私钥。
把本机上的公钥写入本机,所以本机登陆本机不需要密码。
如果有多个机器节点,需要依次复制。(如下为示意)
scp ~/.ssh/authorized_keys root@node01:~/.ssh/
scp ~/.ssh/authorized_keys root@node02:~/.ssh/
如果有多台机器,需要在所有机器上启动 NFS 服务,设置好共享目录,lsf 需要安装在共享目录,以保证所有的机器都能够读取同一份设置。
采用命令 systemctl status firewalld 获取防火墙状态。如下绿色部分字体可知,防火墙仍然处于 running 状态。
采用 systemctl stop firewalld 命令可以临时关闭防火墙,我们看到其状态变为 dead。
采用 systemctl disable firewalld 命令则可以彻底关闭防火墙,机器重启后也不会再自动开启。
从如下地址可以下载到 10.2 版本的 lsfsce 安装包。
https://www-01.ibm.com/marketing/iwm/mrs/DownloadList?source=swerpzsw-lsf-3&lang=en_US#dh
下载 “IBM Spectrum LSF Suite for Community 10.2.0.6 Installation Package for Linux x86-64” 备用。
拷贝到 linux 中的工具路径下,解压缩。(如下操作,如无说明均采用 root 账号)
进入解压路径下,lsf 为 lsf sce 版的安装文件目录。
进入 lsf 目录下,继续解压缩文件 lsf10.1_lsfinstall_linux_x86_64.tar.Z。(glibc 文件无需处理)
进入解压后的安装包路径下。
其中 install.config 为安装配置文件,我们将其备份一下(到 install.config.orig),然后更新其中的设置。
我们的配置如下。
LSF_TOP : 设置安装路径。
LSF_ADMINS : 设置管理员账号,当前设置为我自己的账号,但是企业中建议创建一个公用的管理员账号 lsfadmin。
LSF_CLUSTER_NAME : 集群名称。
LSF_MASTER_LIST :master 机器列表,如果有多台机器,建议至少设置两台 master,作为冗余备份。
LSF_TARDIR : 安装文件解压缩路径。
CONFIGURATION_TEMPLATE :配置模式,如果是 IC 应用场景,建议设置为 HIGH_THROUGHPUT 高性能模式。
LSF_ADD_SERVERS :添加计算机节点机器,也可以安装后配置。
LSF_ADD_CLIENTS :添加客户机(投递机)节点,也可以安装后配置。
执行./lsfinstall -f install.config 来安装 lsf。
此处选 1,继续。
此处也选 1 ,继续,会自动安装完成。
到安装目录的 conf 路径下,将如下信息插入到 lsf.conf 文件中。
LSF_RSH=“ssh”
将 conf 路径下的 cshrc.lsf 和 profile.lsf 两个文件拷贝到 /etc/profile.d/ 下面。(可以开机自动加载 lsf 环境)
手工载入环境。如果是 csh/tcsh 则 source cshrc.lsf,否则 source profile.lsf。
在所有机器上,用 root 账号执行如下命令以启动守护进程。
登陆 master 节点,用 root 账号执行 lsfstartup 以启动 lsf 集群。(请注意,lsf 社区版不允许机器 cpu 核数超过两个核,否则 lsfstartup 无法启动)
执行 lsid 确定 lsf 服务启动无误。
切换到普通账号测试一下。
1 号任务,睡一会。
从 queue 和 hosts 上可以看到这两个 slots 占用,也可以查看机器的静态资源及动态负载状况。
lsf 安装配置成功。