在这篇博客中,我们将详细介绍如何从零开始搭建 Kubernetes (K8s) 集群。本文涵盖了准备工作、安装必要组件、部署 K8s 的 Master 和 Node 节点,以及网络插件的配置。需要注意的是,由于 Kubernetes 版本迭代较快,某些组件可能无法向下兼容,请根据实际情况进行安装。
目前生产部署 Kubernetes 集群主要有两种方式:
kubeadm:
kubeadm
是一个 K8s 部署工具,提供了 kubeadm init
和 kubeadm join
,用于快速部署 K8s 集群。二进制包:
kubeadm
降低了部署门槛,但屏蔽了很多细节,遇到问题时较难排查。如果想要更灵活和可控,推荐使用二进制包部署 K8s 集群,虽然手动部署麻烦,但可以学到更多工作原理,也有利于后期维护。本文教程主要是展示kubeadm
工具搭建kubernetes
集群的过程。
在开始部署之前,我们需要对所有节点进行以下准备工作。
# 关闭防火墙
systemctl stop firewalld
# 禁止防火墙开机自启
systemctl disable firewalld
# 永久关闭 SELinux
sed -i 's/enforcing/disabled/' /etc/selinux/config
# 重启系统使更改生效
reboot
# 临时关闭 SELinux
setenforce 0
# 永久关闭 Swap 分区
sed -ri 's/.*swap.*/#&/' /etc/fstab
# 重启系统
reboot
# 临时关闭 Swap 分区
swapoff -a
注:
在搭建 Kubernetes 集群之前关闭防火墙、SELinux(Security-Enhanced Linux)以及禁用 swap 分区通常有以下原因:
1. 防火墙:
- Kubernetes 集群中的各个节点需要通过一系列网络端口进行通信,包括 API 服务器、kubelet、etcd 等。关闭防火墙可以避免阻碍节点之间的网络通信,确保集群的正常运行。
- 在生产环境中,建议使用网络策略(Network Policies)来限制 Pod 之间和 Pod 与外部的网络通信,而不是完全关闭防火墙。
2. SELinux:
- SELinux 是一个 Linux 内核的安全模块,用于强化系统的安全性。但是,它有时会与 Kubernetes 组件和容器运行时产生冲突,导致权限问题和功能受限。
- 关闭 SELinux 可以简化 Kubernetes 集群的配置和维护,避免潜在的权限问题。
3. 禁用 Swap 分区:
- Kubernetes 对内存的管理和调度依赖于 Linux 内核的内存管理机制。Swap 分区的存在可能导致内存调度行为不稳定,从而影响容器的性能和稳定性。
- Kubernetes 官方建议在所有集群节点上禁用 swap 分区,以确保容器可以充分利用主机的物理内存,并避免因为交换空间导致的性能问题。
虽然关闭防火墙、SELinux 和禁用 swap 分区可以简化 Kubernetes 的搭建和维护,但同时也会降低系统的安全性。在生产环境中,建议根据安全策略来适当配置防火墙规则,并针对 SELinux 进行合适的配置,以确保系统安全性和 Kubernetes 的正常运行。
# 设置主机名(以 node1 为例)
hostnamectl set-hostname node1
# 或者直接修改 /etc/hostname 文件,内容为:
node1
在每个节点上添加 hosts
文件的配置:
cat >> /etc/hosts << EOF
10.154.22.10 Ubuntu-Server
10.152.193.47 k8sNode1
10.152.193.47 k8sNode2
10.152.193.47 k8sNode3
10.152.193.47 k8sNode4
10.152.193.47 k8sNode5
10.152.193.47 k8sNode6
...
EOF
为所有节点添加网桥过滤和地址转发功能:
cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1
vm.swappiness = 0
EOF
# 加载 br_netfilter 模块
modprobe br_netfilter
# 查看是否加载成功
lsmod | grep br_netfilter
# 应用新的配置
sysctl --system
所有节点执行时间同步:
# 启动chronyd服务
systemctl start chronyd
systemctl enable chronyd
date
安装 ipset 和 ipvsadm 在搭建 Kubernetes 集群中通常是为了使用 IPVS(IP Virtual Server)模式作为 Kubernetes 的服务代理模式。IPVS 是一种高性能的四层负载均衡器,可以提供更高的性能和更低的延迟,特别是在大规模的服务负载下。
以下是在每个节点上安装 ipset 和 ipvsadm 的步骤:
安装ipset:
sudo apt update
sudo apt install ipset
sudo yum install ipset
安装ipvsadm:
sudo apt update
sudo apt install ipvsadm
sudo yum install ipvsadm
确认安装:
ipset --version
ipvsadm --version
安装完 ipset 和 ipvsadm后,你可以将 Kubernetes 的服务代理模式设置为 IPVS。在使用 kubeadm 初始化集群时,可以通过传递 --feature-gates=SupportIPVSProxyMode=true 参数来启用 IPVS 代理模式。
请注意,在使用 IPVS 作为服务代理模式时,你需要确保所使用的内核支持 IPVS 并且相关的内核模块已加载。
完整步骤命令:
# 安装 ipset 和 ipvsadm
sudo apt update
sudo apt install ipset ipvsadm
# 验证安装
ipset --version
ipvsadm --version
参考 Docker 官方文档 进行安装:
# 移除旧版本
for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done
# 安装必要的依赖
sudo apt-get update
sudo apt-get install ca-certificates curl
# 添加 Docker 的 GPG 密钥和软件源
sudo install -m 0755 -d /etc/apt/keyrings
sudo curl -fsSL https://download.docker.com/linux/ubuntu/gpg -o /etc/apt/keyrings/docker.asc
sudo chmod a+r /etc/apt/keyrings/docker.asc
echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/ubuntu $(. /etc/os-release && echo "$VERSION_CODENAME") stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update
# 安装 Docker
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
# 启动 Docker 并设置开机自启
sudo systemctl start docker
sudo systemctl enable docker
# 设置 Docker 镜像加速器
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"exec-opts": ["native.cgroupdriver=systemd"],
"registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com"]
}
EOF
# 重新加载 Docker 配置
sudo systemctl daemon-reload
sudo systemctl restart docker
#验证加速器是否生效。使用以下命令验证 Docker 是否使用了国内镜像加速器:
docker info
由于 1.24 以及更高版本的 Kubernetes 不支持 Docker,所以需要安装 cri-docker:
注:但如果使用containerd作为容器运行时,则不需要这部分配置。或者打算使用其他 CRI 插件,可以跳过 cri-docker 的安装部分
# 下载 cri-docker
wget https://ghproxy.com/https://github.com/Mirantis/cri-dockerd/releases/download/v0.2.5/cri-dockerd-0.2.5.amd64.tgz
# 解压并安装
tar xvf cri-dockerd-0.2.5.amd64.tgz
sudo cp cri-dockerd/cri-dockerd /usr/bin/
# 配置 cri-docker 服务
cat > /usr/lib/systemd/system/cri-docker.service <<EOF
[Unit]
Description=CRI Interface for Docker Application Container Engine
Documentation=https://docs.mirantis.com
After=network-online.target firewalld.service docker.service
Wants=network-online.target
Requires=cri-docker.socket
[Service]
Type=notify
ExecStart=/usr/bin/cri-dockerd --network-plugin=cni --pod-infra-container-image=registry.aliyuncs.com/google_containers/pause:3.7
ExecReload=/bin/kill -s HUP $MAINPID
TimeoutSec=0
RestartSec=2
Restart=always
StartLimitBurst=3
StartLimitInterval=60s
LimitNOFILE=infinity
LimitNPROC=infinity
LimitCORE=infinity
TasksMax=infinity
Delegate=yes
KillMode=process
[Install]
WantedBy=multi-user.target
EOF
# 配置 cri-docker socket
cat > /usr/lib/systemd/system/cri-docker.socket <<EOF
[Unit]
Description=CRI Docker Socket for the API
PartOf=cri-docker.service
[Socket]
ListenStream=%t/cri-dockerd.sock
SocketMode=0660
SocketUser=root
SocketGroup=docker
[Install]
WantedBy=sockets.target
EOF
# 启动 cri-docker
systemctl daemon-reload
systemctl enable cri-docker --now
添加 Kubernetes 的 APT 软件源:
curl -fsSL https://pkgs.k8s.io/core:/stable:/v1.28/deb/Release.key | sudo gpg --dearmor -o /etc/apt/keyrings/kubernetes-apt-keyring.gpg
echo 'deb [signed-by=/etc/apt/keyrings/kubernetes-apt-keyring.gpg] https://pkgs.k8s.io/core:/stable:/v1.28/deb/ /' | sudo tee /etc/apt/sources.list.d/kubernetes.list
更新包索引并安装 kubeadm、kubelet 和 kubectl:
sudo apt update
sudo apt install -y kubelet kubeadm kubectl
# 启动 kubelet 并设置开机自启
sudo systemctl start kubelet
sudo systemctl enable kubelet
# 配置 kubectl 环境变量
echo 'export KUBECONFIG=/etc/kubernetes/admin.conf' >> ~/.bashrc
source ~/.bashrc
kubeadm init \
--apiserver-advertise-address=10.154.22.10 \
--image-repository registry.aliyuncs.com/google_containers \
--kubernetes-version $(kubeadm version -o short) \
--service-cidr=10.96.0.0/12 \
--pod-network-cidr=10.244.0.0/16 \
--cri-socket unix:///var/run/cri-dockerd.sock
在 --apiserver-advertise-address
参数中指定 Master 节点的 IP 地址,--pod-network-cidr
参数用于指定 Pod 网络的 IP 地址段,--cri-socket
参数用于指定所使用的容器运行时。
看到successfully就是成功了,先不要急着关掉页面,下面会有加入节点的命令,记得复制,就是有token的那句。
kubectl 访问权限
完成初始化后,kubeadm init 会生成一个 kubeconfig 文件,保存在 /etc/kubernetes/admin.conf。你需要将这个文件复制到你想要使用 kubectl 的用户的 ~/.kube 目录下。
在 kubeadm init
命令成功执行后,会提示如何设置 kubectl 访问权限,复制并执行以下命令:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
在 Kubernetes 集群中,网络插件负责管理 Pod 之间的网络通信。常见的网络插件包括 Flannel、Calico 和 Weave Net。以下是几种网络插件的简单介绍及其配置方法。
Flannel:
kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
Calico:
kubectl apply -f https://docs.projectcalico.org/manifests/calico.yaml
Weave Net:
kubectl apply -f https://cloud.weave.works/k8s/net?k8s-version=$(kubectl version | base64 | tr -d '\n')
根据具体需求和使用场景选择合适的网络插件,并按上述命令进行配置。
如果选择的是Flannel插件,执行完 kube-flannel.yml
后,可以使用以下命令查看 Pod 状态:
kubectl get pods -n kube-system
在 Master 节点完成初始化后,使用输出的 kubeadm join
命令在其他节点上加入集群。例如:
kubeadm join 10.154.22.10:6443 --token <token> \
--discovery-token-ca-cert-hash sha256:<hash> \
--cri-socket unix:///var/run/cri-dockerd.sock
默认的token有效期为24小时,当过期之后,该token就不能用了,这时可以使用如下的命令创建token:
kubeadm token create --print-join-command
在所有节点加入集群后,可以使用以下命令查看节点状态:
kubectl get nodes
如果有nodes的STATUS
没有Ready
,可以使用kubectl describe node
命令来看具体节点的详细信息,看Conditions: 节点当前的状态和条件和Events: 发生在节点上的事件记录,这两项来排查错误。
如果顺利的话,现在k8s集群已经搭建完成了,可以拉个pod测试一下~
在搭建 Kubernetes 集群的过程中,可能会遇到一些常见的错误。以下列出了一些可能遇到的问题及其解决方法。
问题1:kubeadm init
失败,提示镜像拉取失败
kubeadm init \
--apiserver-advertise-address=10.154.22.10 \
--image-repository registry.aliyuncs.com/google_containers \
--kubernetes-version $(kubeadm version -o short) \
--service-cidr=10.96.0.0/12 \
--pod-network-cidr=10.244.0.0/16 \
--cri-socket unix:///var/run/cri-dockerd.sock
问题2:Node 无法加入集群
kubeadm token create --print-join-command
这条命令会生成新的加入命令,直接在 Node 上执行即可。问题3:Pod 网络无法通信
kubectl get pods -n kube-system
检查插件状态。kube-flannel.yml
配置文件中的 pod-network-cidr
设置是否与 kubeadm init
中的一致。如果遇到其他问题,也可以参考 Kubernetes 官方文档或社区资源进行排查。
注:因版本迭代,设备差异,环境不同,等等奇怪的原因,搭建过程很可能出现bug,报错之类的,(建议谷歌搜搜)还是要具体问题具体分析,根据实际情况来搭建。
Kubernetes 官方文档:
阿里云容器镜像服务:
kube-flannel 网络插件文档:
Calico 网络插件文档:
Weave Net 文档:
Container Network Interface (CNI) 插件介绍:
从零搭建k8s集群 - 许大仙 - 博客园 (cnblogs.com)
kubernetes(k8s)集群超级详细超全安装部署手册 - 知乎 (zhihu.com)
Kubernetes最新版2023.07v1.27.4安装和集群搭建保姆级教程 - 知乎 (zhihu.com)
Kubernetes 1.24 1.25 集群使用docker作为容器
本文详细讲解了如何从零开始搭建一个 Kubernetes 集群。希望本文对您的学习和工作有所帮助。