xcat快速入门&工作流程指南


目录

  • 一、快速入门指南
    • 一、先决条件
    • 二、准备管理节点xcatmn.mydomain.com
    • 三、第1阶段:添加你的第一个节点并且用带外BMC接口控制它
    • 四、第 2 阶段 预配节点并使用并行 shell 对其进行管理
  • 二:工作流程指南
    • 1. 查找 xCAT 管理节点的服务器
    • 2. 在所选服务器上安装 xCAT
    • 3. 发现聚类中的目标计算节点
    • 4. 对目标计算节点执行硬件控制操作
    • 5. 在目标节点上部署操作系统
    • 6. 部署后更新操作系统
    • 7. 运行并行命令
    • 8. 为 xCAT 做出贡献(可选)


一、快速入门指南

xCAT 可以是一个全面的系统,用于管理数据中心、裸机服务器、交换机、PDU 和操作系统发行版中的基础架构元素。本快速入门指南将指导您在 15 分钟内设置 xCAT 系统并管理具有基于红帽的分发的 IPMI 托管裸机服务器。

下面的步骤将集中在RHEL7上,但是它们应该适用于其他发行版,例如CentOS,SLES等,详细信息操作系统和硬件支持矩阵

一、先决条件

假设有两台名为xcatmn.mydomain.com
cn1.mydomain.com 的服务器。

1.它们位于同一子网192.168.0.0中
2.cn1.mydomain.com具有可以访问自己的 BMC:xcatmn.mydomain.com

基板管理控制器(Baseboard Manager Controller,简称BMC)。

3.xcatmn.mydomain.com安装了红帽操作系统,并使用了 IP 192.168.0.2
4.xcatmn.mydomain.com可以访问互联网。
5.cn1.mydomain.com的BMC IP 地址是10.4.40.254
6.准备一张完整的 DVD 用于操作系统配置,而不是 LiveCD ISO,对于此示例,将使用RHEL-7.6-20181010.0-Server-x86_64-dvd1.iso,您可以从红帽网站下载它。

LiveCD 能够使你在不安装到硬盘的前提下,体验操作系统。大多数 Linux 桌面发行版都提供 LiveCD,这是宣传自己的一种很有效的方式。

以下所有步骤都要在xcatmn.mydomain.com中执行

二、准备管理节点xcatmn.mydomain.com

1.禁用 SELinux:

echo 0 > /selinux/enforce
sed -i 's/^SELINUX=.*$/SELINUX=disabled/' /etc/selinux/config

2.将主机名设置为:xcatmn.mydomain.com

hostname xcatmn.mydomain.com

3.在文件/etc/sysconfig/network-scripts/ifcfg-中将 IP 设置为静态
4.更新/etc/resolv.conf中的DNS设置,确保节点可以访问github和xcat官网
5.将任何域搜索字符串和名称服务器配置到文件/etc/resolv.conf
6.在/etc/hosts里面加入xcatmn

192.168.0.2 xcatmn xcatmn.mydomain.com

7.安装xcat

wget https://raw.githubusercontent.com/xcat2/xcat-core/master/xCAT-server/share/xcat/tools/go-xcat -O - >/tmp/go-xcat
chmod +x /tmp/go-xcat
/tmp/go-xcat --yes install
source /etc/profile.d/xcat.sh

8.设置计算节点root系统密码

chtab key=system passwd.username=root passwd.password=abc123

三、第1阶段:添加你的第一个节点并且用带外BMC接口控制它

1.定义计算节点:cn1:

mkdef -t node cn1 --template x86_64-template ip=192.168.0.3 mac=42:3d:0a:05:27:0c bmc=10.4.40.254 bmcusername=USERID bmcpassword=PASSW0RD

2.配置DNS:

makehosts cn1
makedns -n

3.检查 cn1硬件控制:

cn1 电源管理:

rpower cn1 on
rpower cn1 state
cn1: on

cn1 固件信息:

rinv cn1 firm
cn1: UEFI Version: 1.31 (TDE134EUS  2013/08/27)
cn1: Backup UEFI Version: 1.00 (TDE112DUS )
cn1: Backup IMM Version: 1.25 (1AOO26K 2012/02/23)
cn1: BMC Firmware: 3.10 (1AOO48H 2013/08/22 18:49:44)

四、第 2 阶段 预配节点并使用并行 shell 对其进行管理

1.为了进行 PXE 引导,您需要一个 DHCP 服务器来分发地址并将引导系统定向到 TFTP 服务器,在那里它可以下载网络引导文件。配置 DHCP:

makedhcp -n

2.将分发 ISO 的所有内容复制到目录/install中,创建操作系统存储库和操作系统映像以进行操作系统配置:

copycds RHEL-7.6-20181010.0-Server-x86_64-dvd1.iso

copycds之后,将自动生成相应的基本osimage。稍后,可以自定义目标计算节点的包列表或后记。列出生成的图像:

lsdef -t osimage

3.用xcatprobe预检查 xCAT 管理节点是否已准备好进行操作系统预配:

xcatprobe xcatmn
[mn]: Checking all xCAT daemons are running...                                      [ OK ]
[mn]: Checking xcatd can receive command request...                                 [ OK ]
[mn]: Checking 'site' table is configured...                                        [ OK ]
[mn]: Checking provision network is configured...                                   [ OK ]
[mn]: Checking 'passwd' table is configured...                                      [ OK ]
[mn]: Checking important directories(installdir,tftpdir) are configured...          [ OK ]
[mn]: Checking SELinux is disabled...                                               [ OK ]
[mn]: Checking HTTP service is configured...                                        [ OK ]
[mn]: Checking TFTP service is configured...                                        [ OK ]
[mn]: Checking DNS service is configured...                                         [ OK ]
[mn]: Checking DHCP service is configured...                                        [ OK ]
... ...
[mn]: Checking dhcpd.leases file is less than 100M...                               [ OK ]
=================================== SUMMARY ====================================
[MN]: Checking on MN...                                                             [ OK ]

4.启动磁盘操作系统部署:

rinstall cn1 osimage=rhels7.6-x86_64-install-compute

5.监控安装过程

makegocons cn1
rcons cn1

注意:Ctrl+e/c会断开操作台链接.

5-10 分钟后,验证预配状态是否为:booted:
lsdef cn1 -i status
Object name: cn1
status=booted

用xdsh检查 cn1操作系统版本,操作系统预配是否成功:


xdsh cn1 more /etc/*release
cn1: ::::::::::::::
cn1: /etc/os-release
cn1: ::::::::::::::
cn1: NAME="Red Hat Enterprise Linux Server"
cn1: VERSION="7.6 (Maipo)"
... ...

二:工作流程指南

如果 xCAT 看起来适合您的要求,建议按照以下步骤设置 xCAT 群集。

1. 查找 xCAT 管理节点的服务器

  • 服务器可以是裸机服务器或虚拟机。选择服务器的主要因素是群集中的计算机数量。集群越大,服务器的性能需要更好。

  • 建议 xCAT 管理节点的架构与集群中的目标计算节点相同。

2. 在所选服务器上安装 xCAT

  • 安装 xCAT 的服务器将是xCAT 管理节点。

  • 请参阅 doc:xcat安装指南,了解如何在服务器上安装 xCAT。

  • 请参阅 doc:xCAT 管理员指南以了解如何管理 xCAT管理服务器。

3. 发现聚类中的目标计算节点

在管理目标节点之前,在 xCAT 数据库中定义目标节点。

  • 对于小型簇(小于 5 个),您可以逐个收集目标节点的信息,然后通过命令mkdef 手动定义。
  • 对于较大的簇,可以使用自动方法来发现目标节点。发现的节点将定义为 xCAT 数据库。您可以使用lsdef来显示它们。
  • 请参阅 doc:xCAT 发现指南,了解如何发现和定义计算节点。

4. 对目标计算节点执行硬件控制操作

  • 验证已定义节点的硬件控制。
    .e.g.
rpower <node> stat.
  • 请参阅文档:硬件管理以了解如何执行远程硬件控制。

5. 在目标节点上部署操作系统

  • 准备操作系统映像
  • 自定义操作系统映像(可选)
  • 执行操作系统部署
    请参阅文档:磁盘安装,无磁盘安装,了解如何为目标节点部署操作系统。

6. 部署后更新操作系统

  • 您可能需要在操作系统部署后更新某些目标节点的操作系统,请尝试updatenode命令.updatenode命令可以为目标节点执行以下任务:

    • 为目标节点安装其他软件/应用程序
    • 将一些文件同步到目标节点
    • 为目标节点运行一些后记
  • 请参考 doc:Updatenode了解如何使用命令。

7. 运行并行命令

  • 管理具有数百或数千个节点的集群时,可能需要在多个节点上并行操作。xCAT 为此提供了一些并行命令。
    • 并行shell
    • 并行copy
    • 并行ping
  • 请参阅并行命令以了解如何使用并行命令。

8. 为 xCAT 做出贡献(可选)

  • 在使用 xCAT 时,如果您发现可以改进的内容(代码、文档等),并且您想将其贡献给 xCAT,请这样做是为了您和其他 xCAT 用户的利益。欢迎来到xCAT社区!

  • 请参阅开发人员,了解如何为 xCAT 社区做出贡献。

你可能感兴趣的:(运维工程师,进厂日记,linux,服务器,运维)