lsf_10.1 安装教程

作为测试,在 VMware 上安装 centos7,然后在 centos7 上安装 lsf 10.2 社区版 (其实是 10.1 版本),社区版和正式版的安装基本一致,不过不需要 license。

redhat 上安装步骤基本相同。

下面是具体的安装步骤:

  1. 机器设置

1.1 设置 hostname 及 IP

通过修改 /etc/hostname 设置机器名,机器名不要太长,也不要带特殊字符。

通过 ifconfig 指令获取机器的 IP 地址。注意如果是通过 VMware 安装的虚拟机,每次重启后 ip 地址都会变,所以最好将其 IP 设置为静态地址。

lsf_10.1 安装教程_第1张图片

通过修改 /etc/hosts 来标明 hostname 和 IP 的对应关系。

lsf_10.1 安装教程_第2张图片

重启机器使之生效。

1.2 设置 ssh

确认 sshd 服务已开启,如未开启,用 root 账号执行 service sshd start 开启。

  配置 ssh 免密登陆。

  用 ssh-keygen 命令产生公钥和私钥。

lsf_10.1 安装教程_第3张图片

  把本机上的公钥写入本机,所以本机登陆本机不需要密码。

如果有多个机器节点,需要依次复制。(如下为示意)

scp ~/.ssh/authorized_keys root@node01:~/.ssh/
scp ~/.ssh/authorized_keys root@node02:~/.ssh/

1.3 设置共享存储

如果有多台机器,需要在所有机器上启动 NFS 服务,设置好共享目录,lsf 需要安装在共享目录,以保证所有的机器都能够读取同一份设置。

1.4 关闭防火墙

    采用命令 systemctl status firewalld 获取防火墙状态。如下绿色部分字体可知,防火墙仍然处于 running 状态。

lsf_10.1 安装教程_第4张图片

    采用 systemctl stop firewalld 命令可以临时关闭防火墙,我们看到其状态变为 dead。

lsf_10.1 安装教程_第5张图片

    采用 systemctl disable firewalld 命令则可以彻底关闭防火墙,机器重启后也不会再自动开启。

2. 安装

2.1 安装包下载

从如下地址可以下载到 10.2 版本的 lsfsce 安装包。

https://www-01.ibm.com/marketing/iwm/mrs/DownloadList?source=swerpzsw-lsf-3&lang=en_US#dh

lsf_10.1 安装教程_第6张图片

下载 “IBM Spectrum LSF Suite for Community 10.2.0.6 Installation Package for Linux x86-64” 备用。

2.2 安装包解压

拷贝到 linux 中的工具路径下,解压缩。(如下操作,如无说明均采用 root 账号)

lsf_10.1 安装教程_第7张图片

  进入解压路径下,lsf 为 lsf sce 版的安装文件目录。

   进入 lsf 目录下,继续解压缩文件 lsf10.1_lsfinstall_linux_x86_64.tar.Z。(glibc 文件无需处理)

lsf_10.1 安装教程_第8张图片

  进入解压后的安装包路径下。

2.3 安装

    其中 install.config 为安装配置文件,我们将其备份一下(到 install.config.orig),然后更新其中的设置。

我们的配置如下。

lsf_10.1 安装教程_第9张图片

LSF_TOP : 设置安装路径。

LSF_ADMINS : 设置管理员账号,当前设置为我自己的账号,但是企业中建议创建一个公用的管理员账号 lsfadmin。

LSF_CLUSTER_NAME : 集群名称。

LSF_MASTER_LIST :master 机器列表,如果有多台机器,建议至少设置两台 master,作为冗余备份。

LSF_TARDIR : 安装文件解压缩路径。

CONFIGURATION_TEMPLATE :配置模式,如果是 IC 应用场景,建议设置为 HIGH_THROUGHPUT 高性能模式。

LSF_ADD_SERVERS :添加计算机节点机器,也可以安装后配置。

LSF_ADD_CLIENTS :添加客户机(投递机)节点,也可以安装后配置。

执行./lsfinstall -f install.config 来安装 lsf。

lsf_10.1 安装教程_第10张图片

此处选 1,继续。

lsf_10.1 安装教程_第11张图片

此处也选 1 ,继续,会自动安装完成。

2.4 配置

    到安装目录的 conf 路径下,将如下信息插入到 lsf.conf 文件中。

LSF_RSH=“ssh”

将 conf 路径下的 cshrc.lsf 和 profile.lsf 两个文件拷贝到 /etc/profile.d/ 下面。(可以开机自动加载 lsf 环境)

手工载入环境。如果是 csh/tcsh 则 source cshrc.lsf,否则 source profile.lsf。

lsf_10.1 安装教程_第12张图片

    在所有机器上,用 root 账号执行如下命令以启动守护进程。

lsf_10.1 安装教程_第13张图片

    登陆 master 节点,用 root 账号执行 lsfstartup 以启动 lsf 集群。(请注意,lsf 社区版不允许机器 cpu 核数超过两个核,否则 lsfstartup 无法启动)

lsf_10.1 安装教程_第14张图片

执行 lsid 确定 lsf 服务启动无误。

lsf_10.1 安装教程_第15张图片

2.5 测试

    切换到普通账号测试一下。

1 号任务,睡一会。

    从 queue 和 hosts 上可以看到这两个 slots 占用,也可以查看机器的静态资源及动态负载状况。

lsf_10.1 安装教程_第16张图片

lsf 安装配置成功。

你可能感兴趣的:(工具安装配置,linux,ssh,运维)