PXE批量安装Debian操作系统并自动配置网络环境、软件源

本文写于2022年05月01日,阅读时请注意时效。落笔时syslinux最新版本为6.03,Debian的最新版本为11.3,本文采用了这两个版本。

本文的实验材料较多,建议下载 pxe-debian - github 仓库到本地,其中包含了本文实验所需的所有代码文件。

前置知识

  • Debian的手动安装流程

  • 网络配置的基础知识

  • 大致读一下SYSLINUX 网站中各个链接的所有文档,内容不多,达到能当字典查的程度就行

本文属于GPU集群管理、使用指南中的一篇,前置知识可以参考相应内容

实验准备

  • 一台装好Debian 11的虚拟机(hostname: node18),不需要提前配置虚拟机,方法参照前置知识中的链接

  • python或者其他http服务器软件

  • 提前准备好pxe-debian文件夹,文件目录如下,在pxe-debian中执行python -m http.server 8000开启一个http服务器

pxe-debian/
├── initpxe.sh
├── init.sh
├── interfaces
├── pxefiles
│   ├── default
│   ├── dhcpd.conf
│   ├── hosts
│   ├── interfaces
│   ├── preseed-vm-20220501.cfg
│   └── uuids
├── README.md
├── resolv.conf
└── sources.list
  • 一台以上空白的虚拟机作为安装操作系统的对象,需要提前开启系统→主板→启动顺序中的网络启动并记录他们的system-uuid,这一步是为了后续自动为机器配置网络。在真实环境下一般使用机器的system-serial-number也就是序列号即可,一般服务器序列号都会贴在机器表面比较易得。virtualbox序列号均为0无法起到区分机器的作用所以使用system-uuid。获取方法:将Debian安装镜像放入虚拟机光驱,选择Install进入安装流程,在选择键盘后面的读条结束后,停在Configure the network也就是选择网卡的界面的时候,按alt + f2切换到tty2,输入命令dmidecode -s system-uuid即可得到虚拟机的uuid。
读条
  • 之后修改pxe-debian/pxefiles/uuids与实际匹配即可,本文使用了node08 node10 node20作为待安装操作系统的节点

初始化PXE服务器节点环境

在刚安装好操作系统的node18,执行wget http://192.168.56.1:8000/init.sh下载配置网络环境和软件源的脚本,这个脚本是GPU集群管理、使用指南中配置网络环境、软件源步骤的自动化,其内容如下:

#!/bin/bash
fileserver='http://192.168.56.1:8000'
stamp=$(date +%Y%m%d%H%M%S).$(whoami)
sed -i '/#PermitRootLogin/i PermitRootLogin yes' /etc/ssh/sshd_config
systemctl restart sshd
mv /etc/network/interfaces /etc/network/interfaces.${stamp}
wget -P /etc/network/ ${fileserver}/interfaces
mv /etc/resolv.conf /etc/resolv.conf.${stamp}
wget -P /etc/ ${fileserver}/resolv.conf
ifdown --all
ifup --all
mv /etc/apt/sources.list /etc/apt/sources.list.${stamp}
wget -P /etc/apt/ ${fileserver}/sources.list
apt update

下载完成后,执行bash -x init.sh运行脚本,-x参数可以显示即将执行的命令。

搭建PXE服务器

注意:本文选择了Debian Installation Guide中推荐的isc-dhcp-server和tftpd-hpa提供dhcp和tftp服务。我还尝试过dnsmasq但是在机房环境会出问题所以放弃了,如果有读者成功可以交流一下经验。

接着上面的脚本之后执行wget http://192.168.56.1:8000/initpxe.sh下载配置PXE服务器的脚本,其内容如下:

#!/bin/bash
apt install -y isc-dhcp-server tftpd-hpa
fileserver='http://192.168.56.1:8000/pxefiles'
mkdir pxe/
cd pxe/
wget --no-check-certificate https://mirrors.edge.kernel.org/pub/linux/utils/boot/syslinux/syslinux-6.03.tar.gz
tar -zxf syslinux-6.03.tar.gz
wget https://mirrors.ustc.edu.cn/debian/dists/bullseye/main/installer-amd64/current/images/netboot/netboot.tar.gz
mkdir netboot
tar -zxf netboot.tar.gz -C netboot/
mkdir -p /srv/tftp/lib/
mkdir -p /srv/tftp/pxelinux.cfg/
mkdir -p /srv/www/debian11/
cp syslinux-6.03/bios/com32/elflink/ldlinux/ldlinux.c32 /srv/tftp/
cp syslinux-6.03/bios/com32/libutil/libutil.c32 /srv/tftp/lib/
cp syslinux-6.03/bios/com32/menu/menu.c32 /srv/tftp/lib/
cp syslinux-6.03/bios/core/lpxelinux.0 /srv/tftp/
cp netboot/version.info /srv/www/debian11/
cp netboot/debian-installer/amd64/initrd.gz /srv/www/debian11/
cp netboot/debian-installer/amd64/linux /srv/www/debian11/
wget -P /srv/tftp/pxelinux.cfg/ ${fileserver}/default
wget -P /srv/www/ ${fileserver}/hosts
wget -P /srv/www/ ${fileserver}/interfaces
wget -P /srv/www/ ${fileserver}/preseed-vm-20220501.cfg
wget -P /srv/www/ ${fileserver}/uuids
sed -i 's/INTERFACESv4=""/INTERFACESv4="enp0s3"/' /etc/default/isc-dhcp-server
mv /etc/dhcp/dhcpd.conf /etc/dhcp/dhcpd.conf.$(date +%Y%m%d%H%M%S).$(whoami)
wget -P /etc/dhcp/ ${fileserver}/dhcpd.conf
systemctl restart isc-dhcp-server tftpd-hpa

可以看到内容大部分是在复制文件,脚本执行完成后,使用tree /srv/查看文件结构如下,没有tree可以用apt装一个

root@node18:~# tree /srv/
/srv/
├── tftp
│   ├── ldlinux.c32
│   ├── lib
│   │   ├── libutil.c32
│   │   └── menu.c32
│   ├── lpxelinux.0
│   └── pxelinux.cfg
│       └── default
└── www
    ├── debian11
    │   ├── initrd.gz
    │   ├── linux
    │   └── version.info
    ├── hosts
    ├── interfaces
    ├── preseed-vm-20220501.cfg
    └── uuids

5 directories, 12 files

各文件的用途

这一部分简单介绍/srv/目录中文件的用途,建议通读PXELINUX网站中的所有内容以获得syslinux、pxelinux的全面了解。本文还参考了Debian Installation Guide的相关章节(4.5、5.3、附录B)。

其中/srv/tftp/目录中除/pxelinux.cfg/default意外其他都是syslinux的文件,不需要修改,default文件是pxelinux的boot界面文件,截图如下,下一节将介绍如何使用。/pxelinux.cfg/default/文件中的语句也比较好理解,这里不做过多说明,有需求的用户可以自行修改。

bootmenu

/www/debian11/中的文件是linux内核和initial ram disk和一个用来标识版本的文本文件。

/www/hosts /www/interfaces是每个服务器相同的网络配置文件,当集群中具有不同结构的网卡时,interfaces文件可以适当冗余,比如我在机房环境中使用的interfaces如下:

# This file describes the network interfaces available on your system
# and how to activate them. For more information, see interfaces(5).

source /etc/network/interfaces.d/*

# The loopback network interface
auto lo
iface lo inet loopback

# The primary network interface
auto eno1
iface eno1 inet static
    address 172.20.137.1fakenodeid/24
    gateway 172.20.137.1
    dns-servers 8.8.8.8 114.114.114.114

auto ens10f0
iface ens10f0 inet static
    address 12.12.12.1fakenodeid/24

auto ens10f1
iface ens10f1 inet static
    address 13.13.13.1fakenodeid/24

auto enp6s0f0
iface enp6s0f0 inet static
    address 12.12.12.1fakenodeid/24

auto enp6s0f1
iface enp6s0f1 inet static
    address 13.13.13.1fakenodeid/24

其中eno1是每台机器都同名的千兆网卡,而一部分服务器的两张万兆网卡名字是ens10f0 ens10f1,另一部分机器是enp6s0f0 enp6s0f1,这里多写的部分在名字不匹配时不会生效,从而可以用一个配置文件完成所有机器的网络配置。改网卡名字的操作我不会,有会的读者可以交流一下。

/www/uuids/中记录了机器的uuid和hostname的对应情况,读者可以根据实际情况修改。机房环境一般使用dmidecode -s system-serial-number获取序列号或者直接从机器贴的标签上手抄。

/www/preseed-vm-20220501.cfg/是Debian安装过程的预置文件,写法参考bullseye preseed 。文件最后late-command部分就是shell脚本,替换掉了配置文件中的fakehost占位符,完成了网络的配置和软件源的配置。如果读者有其他需求比如需要预装git、tree等软件都可以直接写在这里。需要注意安装后的操作系统的根目录是/target/,而in-target命令的执行目录是在/target/root/中,而不带这一前缀的命令执行目录在/root/

/    # 系统当前的根目录,在内存中
├── bin
├── ...
├── root    # 普通命令执行的位置
├── ...
└── target    # 系统重启后的根目录 ‘/’
    ├── bin
    ├── ...
    ├── root    # in-target命令执行的位置
    └── ...

这里的/target/在Debian手动安装过程中会在磁盘分区步骤结束后出现,就是把硬盘挂载到了这个文件夹。可以在安装时在下图磁盘分区写入后切换到tty2通过ls看到硬盘里的根目录。

写入磁盘分区

使用方法

建议同时开三个shell。

前两个分别执行journalctl -fu isc-dhcp-serverjournalctl -fu tftpd-hpa来跟踪dhcp和tftp的日志。

接着在/srv/www/文件夹中执行python3 -m http.server 80运行http服务。

最后启动需要安装操作系统的虚拟机,在virtualbox启动界面按f12选择启动介质为lan,默认等待3秒后进入自动安装。

欢迎交流

由于本文涉及的内容过多,导致我很难把握写作的分寸,其中不够详细/过多冗余的部分还希望读者能够帮忙指出。

思路总结

最开始知道PXE是以前用CentOS的时候,想要给机房机器批量安装操作系统,当时看到一篇很好的step-by-step教程kickstart批量安装CentOS7_咖喱姬姬的博客-CSDN博客,虽然没看到SYSLINUX的官方文档,但是因为红帽的文档写的非常详细,反复实验后还是照猫画虎的把自动安装实现了。

后来CentOS变阵,服务器改用Debian。而Debian的官方文档就不够详细,在搭建的过程中总是会出现各种莫名的错误,各种想法都只能靠自己的实验验证,网上也没有一篇比较全面准确的教程。

最后通读了SYSLINUX的所有文档,加上当时通过Arch Linux了解到了Linux安装的底层其实就是一个“在内存中加载一个小型操作系统→将硬盘挂载到/target/→将文件从软件源服务器安装到硬盘”的过程。加上debian netboot文件给的目录过于复杂不够清晰,最后采取了自己写pxelinux.cfg/default配置文件的方法。

你可能感兴趣的:(PXE批量安装Debian操作系统并自动配置网络环境、软件源)