Kubernetes 集群部署 之 多Master节点 实现高可用

目录

  • 前言
  • 一、K8s Master 高可用架构
  • 二、在单Master节点基础上搭建 多Master集群架构
    • 2.1 环境准备 与 搭建步骤
    • 2.2 首先部署 Master02 节点
      • 2.2.1 从 Master01 节点上拷贝`etcd 证书文件`、各Master组件的 `配置文件` 和 `服务管理文件` 到 Master02 节点上**。
      • 2.2.2 Master02 修改配置文件 kube-apiserver 中的 IP
    • 2.3 查看 Node 节点状态
  • 三、负载均衡 集群部署
    • 3.1 在线安装 Nginx
    • 3.2 配置 Nginx 反向代理(四层)
    • 3.3 部署 keepalived 服务高可用
      • 3.3.1 部署 keepalived 服务
      • 3.3.2 创建Nginx状态检查脚本,启动 keepalived 服务
    • 3.4 K8S + Keepalived 集群配置
      • 3.4.1 修改Node节点上一些配置文件指定为VIP
      • 3.4.2 在 master01 节点上操作
    • 3.5 验证 keepalived + LB 高可用集群
  • 五、Dashboard UI 界面
    • 5.1 Dashboard 介绍
    • 5.2 部署 Dashboard UI
      • 5.2.1 准备软件包
      • 5.2.2 通过 kubectl create 命令创建 resources
      • 5.2.3 使用脚本 dashboard-cert.sh 来快速生成证书文件
      • 5.2.4 网页验证

前言

  • 之前我做过 单Master节点的二进制安装部署k8s服务。但是万一这台 Master 宕机了,整个服务就崩了,所以为了实现集群高可用,需要增加多台 Master 解决单点故障。

https://blog.csdn.net/duanbaoke/article/details/119593573
https://blog.csdn.net/duanbaoke/article/details/117997765

一、K8s Master 高可用架构

Kubernetes 集群部署 之 多Master节点 实现高可用_第1张图片

  • Keepalived + Load Balancer : LB 可以是 LVS、Haproxy 或 Nginx,结合 keepalived 实现负载均衡高可用
  • Load Balancer 服务 接受前台用户发送过来的 kubectl 等请求,再通过反向代理转发到后台的 Master 节点上面,
  • 单节点的话,多台 Node 直接指向 一台Master 节点;而多Master集群结构中,Master 会指向 Load Balancer 服务,请求都来自负载均衡服务,所以LB要做高可用。
  • Master 的 Apiserver 都指向 Keepalived 的虚拟 IP上
  • Master 上通过 Apiserver 直接 操作 Node 节点上的 kubelet,不需要再通过 VIP 的负载均衡转发。Node 节点会由 Master 管理实现高可用。
  • 首先 ETCD 集群实现 去中心化高可用(奇数台机器),通过 Raft 算法保持数据库数据一致性。

由于LVS 消耗资源,我们用 keeplived,实现负载均衡高可用。

二、在单Master节点基础上搭建 多Master集群架构

2.1 环境准备 与 搭建步骤

搭建步骤:
多Master 高可用

  • 从master01 复制 etcd,k8s 的证书、可执行命令文件、配置文件、master组件的服务管理文件 到 master02 节点
  • 在master02 节点 修改 apiserver 的配置文件
  • 启动 master02 相关组件
  • 部署 keepalived + LB(nginx,haproxy) 实现 高可用 和 负载均衡
  • keepalived 需要健康检查脚本来实现自动的故障切换
  • 在 nodes 节点上修改 node相关组件的 kubeconfig 文件配置 ,把对接的 server ip 指定为 VIP

环境准备:

在上一篇单节点二进制部署的基础上扩充,需要新增 一台 master02 ,和 两台 LB 负载均衡机器。

准备机器需要是和 master01 中 /opt/k8s/k8s-cert/ k8s-cert.sh 生成证书文件中定义的地址。否则要重新生成证书。

Kubernetes 集群部署 之 多Master节点 实现高可用_第2张图片
Master 节点

k8s集群master01 192.168.10.40 kube-apiserver、kube-controller-manage、kube-scheduler、etcd
k8s集群master02 192.168.10.70

Worker Node 节点

k8s集群node01 192.168.10.50 kubelet、kube-proxy、docker、flannel
k8s集群node02 192.168.10.60

ETCD(实验为了节省机器,和Master Node 节点共用机器)

etcd集群节点1 192.168.10.40
etcd集群节点2 192.168.10.50
etcd集群节点3 192.168.10.60

web 服务负载均衡

负载均衡 Nginx + keepalive01 (master) 192.168.10.111
负载均衡 Nginx + keepalive02 (backup) 192.168.10.101

keepalived 生成的虚拟漂移IP 就是 192.168.10.120

关闭防火墙

systemctl stop firewalld
systemctl disable firewalld
setenforce 0


systemctl daemon-reload
systemctl restart docker
systemctl restart kubelet
systemctl restart kube-proxy

 

修改主机名

hostnamectl set-hostname master02  192.168.10.70
hostnamectl set-hostname lb1   192.168.10.111
hostnamectl set-hostname lb2   192.168.10.101

2.2 首先部署 Master02 节点

Master 01、02 和 ETCD 通信用的证书都是一样的。因为 ETCD 和 Node 节点不管你是哪个 master

2.2.1 从 Master01 节点上拷贝etcd 证书文件、各Master组件的 配置文件服务管理文件 到 Master02 节点上**。

在 master01 上操作

scp -r /opt/etcd/ root@192.168.10.70:/opt/
scp -r /opt/kubernetes/ root@192.168.10.70:/opt

scp /usr/lib/systemd/system/{kube-apiserver,kube-controller-manager,kube-scheduler}.service root@192.168.10.70:/usr/lib/systemd/system/

Kubernetes 集群部署 之 多Master节点 实现高可用_第3张图片
在这里插入图片描述
Kubernetes 集群部署 之 多Master节点 实现高可用_第4张图片

2.2.2 Master02 修改配置文件 kube-apiserver 中的 IP

在 master02 上操作

修改配置文件 kube-apiserver 中的 IP

vim /opt/kubernetes/cfg/kube-apiserver

KUBE_APISERVER_OPTS="--logtostderr=true \
--v=4 \
--etcd-servers-https://192.168.10.40:2379,https://192.168.10.50:2379,http://192.168.10.60:2379 --bind-address=192.168.10.70\
--secure-port=6443 \    #修改
--advertise-address=192.168.10.70\  #修改

Kubernetes 集群部署 之 多Master节点 实现高可用_第5张图片

在 Master02 节点上 启动 Master上各服务并设置开机自启

systemctl start kube-apiserver.service
systemctl enable kube-apiserver.service
systemctl start kube-controller-manager.service
systemctl enable kube-controller-manager.service
systemctl start kube-scheduler.service
systemctl enable kube-scheduler.service

systemctl restart kube-apiserver.service
systemctl restart kube-controller-manager.service
systemctl restart kube-scheduler.service

2.3 查看 Node 节点状态

//查看node节点状态
ln -s /opt/kubernetes/bin/* /usr/local/bin/

kubectl get nodes
kubectl get nodes -o wide			#-o=wide:输出额外信息;对于Pod,将输出Pod所在的Node名

//此时在master02节点查到的node节点状态仅是从etcd查询到的信息,而此时node节点实际上并未与master02节点建立通信连接,因此需要使用一个VIP 把node节点与master节点都关联起来

Kubernetes 集群部署 之 多Master节点 实现高可用_第6张图片

三、负载均衡 集群部署

  • 配置 Load Balancer 集群双机热备负载均衡(Nginx 实现负载均衡,keepalived 实现双机热备)

3.1 在线安装 Nginx

在 lb01、lb02 节点上操作

#配置 Nginx 的官方在线yum源,配置本地 Nginx 的yum源,因为Centos 中默认没有nginx的yum源
cat > /etc/yum.repos.d/nginx.repo << 'EOF'
[nginx]
name=nginx repo
baseurl=http://nginx.org/packages/centos/7/$basearch/
gpgcheck=0
EOF

#使用在线yum源安装
yum install nginx -y

Kubernetes 集群部署 之 多Master节点 实现高可用_第7张图片
yum 安装其实就是 先通过 编译安装,重新封装成 yum 包。

3.2 配置 Nginx 反向代理(四层)

注意:使用四层单项代理功能,需要在安装 Nginx 时安装 stream 模块。

lb1

//修改nginx配置文件,配置四层反向代理负载均衡,指定k8s群集 2台master的节点ip和6443端口
vim /etc/nginx/nginx.conf

events {
    worker_connections  1024;
}

stream{
    log_format  main  '$remote_addr $upstream_addr - [$time_local] $status $upstream_bytes_sent';
	access_log  /var/log/nginx/k8s-access.log  main;
	
	upstream k8s-apiserver{
		server 192.168.10.40:6443;    #两个master服务
		server 192.168.10.70:6443;
	}
	server{
		listen 6443;
		proxy_pass k8s-apiserver;
	}	
}

http{

}

Kubernetes 集群部署 之 多Master节点 实现高可用_第8张图片

nginx -t
systemctl start nginx
systemctl enable nginx
netstat -natp | grep nginx 

在这里插入图片描述
启动成功
lb2
同样的,另一台负载均衡集群中的 Nginx lb2 也要做相同的配置,直接将配置文件复制过去。

==lb1==
scp nginx.conf root@192.168.10.101:/etc/nginx/nginx.conf

==lb2==
nginx -t
systemctl start nginx
systemctl enable nginx
netstat -natp | grep nginx 

Kubernetes 集群部署 之 多Master节点 实现高可用_第9张图片

3.3 部署 keepalived 服务高可用

3.3.1 部署 keepalived 服务

lb1
安装 keepalived

yum install keepalived -y

修改keepalived配置文件

vim /etc/keepalived/keepalived.conf

! Configuration File for keepalived

global_defs {
   # 接收邮件地址
   notification_email {
     acassen@firewall.loc
     failover@firewall.loc
     sysadmin@firewall.loc
   }
   # 邮件发送地址
   notification_email_from Alexandre.Cassen@firewall.loc
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id NGINX_MASTER	#lb01节点的为 NGINX_MASTER,lb02节点的为 NGINX_BACKUP
}

#添加一个周期性执行的脚本
vrrp_script check_nginx {
    script "/etc/nginx/check_nginx.sh"	#指定检查nginx存活的脚本路径
}

vrrp_instance VI_1 {
    state MASTER			#lb01节点的为 MASTER,lb02节点的为 BACKUP
    interface ens33			#指定网卡名称 ens33
    virtual_router_id 51	#指定vrid,两个节点要一致
    priority 100			#lb01主Master节点的为 100,lb02节点的为 90
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.10.120/24	#指定 VIP,用之前master 证书中的VIP,见上一篇博客的6.3
    }
    track_script {
        check_nginx			#指定vrrp_script配置的脚本
    }
}

Kubernetes 集群部署 之 多Master节点 实现高可用_第10张图片

3.3.2 创建Nginx状态检查脚本,启动 keepalived 服务

lb1 lb2 都安装 keepalived 服务

  • keepalived 默认的配置项都是围绕LVS 配置的,但是我们用的Nginx来做负载均衡。所以,我们需要自己创建 Nginx 检查脚本,用来检查Nginx 节点的存活状态。
  • 然后在 keepalived 的配置中,添加这个脚本。

创建 Nginx 检查脚本

vim /etc/nginx/check_nginx.sh

#!/bin/bash
count=$(ps -ef | grep nginx | egrep -cv "grep|$$")
if [ "$count" -eq 0 ]; then
	systemctl stop keepalived
fi

Kubernetes 集群部署 之 多Master节点 实现高可用_第11张图片

chmod +x /etc/nginx/check_nginx.sh

lb2
创建nginx 检查脚本,安装 keepalived ,修改配置文件中的优先级等
Kubernetes 集群部署 之 多Master节点 实现高可用_第12张图片
Kubernetes 集群部署 之 多Master节点 实现高可用_第13张图片
==lb1 lb2 ==


//启动keepalived服务(一定要先启动了nginx服务,再启动keepalived服务)
systemctl start keepalived
systemctl enable keepalived

ip addr				#查看VIP是否生成

Kubernetes 集群部署 之 多Master节点 实现高可用_第14张图片
Kubernetes 集群部署 之 多Master节点 实现高可用_第15张图片
验证:

  • 在 lb1 上 执行 systemctl stop nginx ,过一会,再查看 ip a,看 VIP 是不是漂移已到了 BACKUP上,成为新的 MASTER。

  • 注意,关闭 nginx 时,会将 keepalived 也一起管理==关闭,启动时应该一定要先启动了nginx服务,再启动keepalived服务

3.4 K8S + Keepalived 集群配置

Keepalived 集群 对接 Node 节点

3.4.1 修改Node节点上一些配置文件指定为VIP

node01 node02 都修改

//修改node节点上的bootstrap.kubeconfig,kubelet.kubeconfig配置文件为VIP
cd /opt/kubernetes/cfg/

vim bootstrap.kubeconfig 
server: https://192.168.10.120:6443
                      
vim kubelet.kubeconfig
server: https://192.168.10.120:6443
                        
vim kube-proxy.kubeconfig
server: https://192.168.10.120:6443

Kubernetes 集群部署 之 多Master节点 实现高可用_第16张图片
两个节点改6次

//重启kubelet和kube-proxy服务
systemctl restart kubelet.service 
systemctl restart kube-proxy.service

Kubernetes 集群部署 之 多Master节点 实现高可用_第17张图片

//在lb01上查看nginx的k8s日志(keepalived  Master机器上看)
tail /var/log/nginx/k8s-access.log

Kubernetes 集群部署 之 多Master节点 实现高可用_第18张图片

3.4.2 在 master01 节点上操作

//测试创建pod
kubectl run nginx --image=nginx

3.5 验证 keepalived + LB 高可用集群

//查看Pod的状态信息
kubectl get pods
STATUS ContainerCreating   #正在创建中

kubectl get pods
STATUS   Running   #创建完成,运行中

kubectl get pods -o wide

//READY为1/1,表示这个Pod中有1个容器

//在对应网段的node节点上操作,可以直接使用浏览器或者curl命令访问
curl 172.17.49.4

Kubernetes 集群部署 之 多Master节点 实现高可用_第19张图片


//这时在master01节点上查看nginx日志,发现没有权限查看

#pod 查看节点日志

kubectl logs nginx-dbddb74b8-x2dxp

Error from server (Forbidden): Forbidden (user=system:anonymous, verb=get, resource=nodes, subresource=proxy) ( pods/log nginx-dbddb74b8-x2dxp)


//在master01节点上,将cluster-admin角色授予用户system:anonymous
kubectl create clusterrolebinding cluster-system-anonymous --clusterrole=cluster-admin --user=system:anonymous

clusterrolebinding.rbac.authorization.k8s.io/cluster-system-anonymous created

//再次查看nginx日志
kubectl logs nginx-dbddb74b8-x2dxp

Kubernetes 集群部署 之 多Master节点 实现高可用_第20张图片

五、Dashboard UI 界面

K8S 网站管理系统(网页展示集群状态)。

5.1 Dashboard 介绍

  • 仪表板是基于Web的 Kubernetes用户界面
  • 您可以使用仪表板将容器化应用程序部署到 Kubernetes集群,对容器化应用程序进行故障排除,并管理集群本身及其伴随资源。
  • 您可以使用仪表板来概述群集上运行的应用程序,以及创建或修改单个Kubernetes资源(例如部署,作业,守护进程等)。
  • 例如,您可以使用部署向导扩展部署,启动滚动更新,重新启动 Pod 或 部署新应用程序。
  • 仪表板还提供有关群集中Kubernetes资源状态以及可能发生的任何错误的信息。
  • Dashboard 是在Pod 中,以容器运行的

5.2 部署 Dashboard UI

5.2.1 准备软件包

在 master01 节点上操作

//在k8s工作目录中创建dashborad工作目录
mkdir /opt/k8s/dashboard
cd /opt/k8s/dashboard

//上传 Dashboard.zip 压缩包,并解压,一共有6个yaml文件,一个脚本文件。
//包含了5个构建该界面的核心文件,
//一个k8s-admin.yaml文件是自己写的,用来生成待会在浏览器中登录时所用的令牌;
//一个dashboard-cert.sh,用来快速生成解决谷歌浏览器加密通信问题所需的证书文件

unzip Dashboard.zip


#因为dashboard-cert.sh 脚本是在Windows 中写的,需要用工具 dos2unix 转换成 Linux 能识别的格式
cat -v dashboard-cert.sh 
yum install -y dos2unix.x86_64
dos2unix dashboard-cert.sh



//核心文件官方下载资源地址:https://github.com/kubernetes/kubernetes/tree/master/cluster/addons/dashboard
dashboard-configmap.yaml   dashboard-rbac.yaml    dashboard-service.yaml	
dashboard-controller.yaml  dashboard-secret.yaml  	  k8s-admin.yaml		 
dashboard-cert.sh

------------------------------------------------------------------------------------------
1、dashboard-rbac.yaml:用于访问控制设置,配置各种角色的访问控制权限及角色绑定(绑定角色和服务账户),内容中包含对应各种角色所配置的规则(rules)
2、dashboard-secret.yaml:提供令牌,访问API服务器所用(个人理解为一种安全认证机制)
3、dashboard-configmap.yaml:配置模板文件,负责设置Dashboard的文件,ConfigMap提供了将配置数据注入容器的方式,保证容器中的应用程序配置从 Image 内容中解耦
4、dashboard-controller.yaml:负责控制器及服务账户的创建,来管理pod副本
5、dashboard-service.yaml:负责将容器中的服务提供出去,供外部访问
------------------------------------------------------------------------------------------

Kubernetes 集群部署 之 多Master节点 实现高可用_第21张图片

在 node01 node02节点上操作
在这里插入图片描述

//上传 dashboard.tar 压缩包,使用 docker load 加载这个镜像,是一种加载方法。
docker load -i dashboard.tar
docker imags

Kubernetes 集群部署 之 多Master节点 实现高可用_第22张图片

5.2.2 通过 kubectl create 命令创建 resources

master01

cd /opt/k8s/dashboard

1、规定 kubernetes-dashboard-minimal 该角色的权限:例如其中具备获取更新删除等不同的权限

kubectl create -f dashboard-rbac.yaml 

//有几个kind就会有几个结果被创建,格式为kind+apiServer/name
role.rbac.authorization.k8s.io/kubernetes-dashboard-minimal created
rolebinding.rbac.authorization.k8s.io/kubernetes-dashboard-minimal created


//查看类型为 Role,RoleBinding 的资源对象 kubernetes-dashboard-minimal 是否生成
kubectl get role,rolebinding -n kube-system
//-n kube-system 表示查看指定命名空间中的pod,缺省值为default

Kubernetes 集群部署 之 多Master节点 实现高可用_第23张图片

2、证书和密钥创建

kubectl create -f dashboard-secret.yaml 

secret/kubernetes-dashboard-certs created
secret/kubernetes-dashboard-key-holder created

//查看类型为 Secret 的资源对象 kubernetes-dashboard-certs,kubernetes-dashboard-key-holder 是否生成
kubectl get secret -n kube-system

Kubernetes 集群部署 之 多Master节点 实现高可用_第24张图片

3、配置文件,对于集群 dashboard 设置的创建

kubectl create -f dashboard-configmap.yaml 
configmap/kubernetes-dashboard-settings created


//查看类型为 ConfigMap 的资源对象 kubernetes-dashboard-settings 是否生成
kubectl get configmap -n kube-system

4、创建容器需要的控制器以及服务账户

kubectl create -f dashboard-controller.yaml 

serviceaccount/kubernetes-dashboard created
deployment.apps/kubernetes-dashboard created

//查看类型为 ServiceAccount,Deployment 的资源对象 kubernetes-dashboard-settings 是否生成
kubectl get serviceaccount,deployment -n kube-system

Kubernetes 集群部署 之 多Master节点 实现高可用_第25张图片

5、将服务提供出去

kubectl create -f dashboard-service.yaml 

service/kubernetes-dashboard created

//查看创建在指定的 kube-system 命名空间下的 pod  service 状态信息
kubectl get pods,svc -n kube-system -o wide

//svc  service 的缩写,可用 kubectl api-resources 查看
NAME                                        READY   STATUS    RESTARTS   AGE   IP       NODE     NOMINATED NODE
pod/kubernetes-dashboard-65f974f565-2qmb8   0/1     Pending   0          36s   <none>   <none>   <none>

NAME                           TYPE       CLUSTER-IP   EXTERNAL-IP   PORT(S)         AGE   SELECTOR
service/kubernetes-dashboard   NodePort   10.0.0.32    <none>        443:30001/TCP   11s   k8s-app=kubernetes-dashboard



//dashboard分配给了node01服务器,访问的入口是30001端口,打开浏览器访问 https://nodeIP:30001 来进行测试
火狐浏览器可直接访问:https://192.168.10.50:30001
谷歌浏览器则因为缺少加密通信的认证证书,导致无法直接访问。可通过 菜单->更多工具->开发者工具->Security 查看访问失败的原因。

Kubernetes 集群部署 之 多Master节点 实现高可用_第26张图片

5.2.3 使用脚本 dashboard-cert.sh 来快速生成证书文件

  • 解决谷歌浏览器加密通信问题,使用的脚本 dashboard-cert.sh 来快速生成证书文件

查看文件:
Kubernetes 集群部署 之 多Master节点 实现高可用_第27张图片

vim dashboard-service.yaml 

Kubernetes 集群部署 之 多Master节点 实现高可用_第28张图片

浏览器安全性:google > firefox > 360

google访问 https://192.168.10.50:30001
Kubernetes 集群部署 之 多Master节点 实现高可用_第29张图片
Kubernetes 集群部署 之 多Master节点 实现高可用_第30张图片

//执行脚本 
cd /opt/k8s/dashboard/
chmod +x dashboard-cert.sh

./dashboard-cert.sh /opt/k8s/k8s-cert/

// dashboard 工作目录下将生成两个证书
ls *.pem
dashboard.pem	dashboard-key.pem

Kubernetes 集群部署 之 多Master节点 实现高可用_第31张图片

cd /opt/k8s/dashboard/
vim dashboard-controller.yaml

......
        args:
          # PLATFORM-SPECIFIC ARGS HERE
          - --auto-generate-certificates
#在文件的第47行下面添加以下两行,指定加密(tls)的私钥和证书文件
          - --tls-key-file=dashboard-key.pem
          - --tls-cert-file=dashboard.pem

Kubernetes 集群部署 之 多Master节点 实现高可用_第32张图片


//重新进行部署(注意:当apply不生效时,先使用delete清除资源,再apply创建资源)
kubectl apply -f dashboard-controller.yaml

//由于可能会更换所分配的节点,所以要再次查看一下分配的节点服务器地址和端口号
kubectl get pods,svc -n kube-system -o wide

Kubernetes 集群部署 之 多Master节点 实现高可用_第33张图片

使用令牌


//再次进行访问测试,选择使用令牌方式登录,使用 k8s-admin.yaml 文件进行创建令牌
cd /opt/k8s/dashboard/
kubectl create -f k8s-admin.yaml

#获取token简要信息,名称为dashboard-admin-token-xxxxx
kubectl get secrets -n kube-system
NAME                               TYPE                                  DATA   AGE
dashboard-admin-token-kpmm8        kubernetes.io/service-account-token   3      
default-token-7dhwm                kubernetes.io/service-account-token   3      
kubernetes-dashboard-certs         Opaque                                11     
kubernetes-dashboard-key-holder    Opaque                                2      
kubernetes-dashboard-token-jn94c   kubernetes.io/service-account-token   3      

//查看令牌序列号,取 token: 后面的内容
kubectl describe secrets dashboard-admin-token-kpmm8 -n kube-system

//将令牌序列号复制填入到浏览器页面中,点击登录
先通过 kubectl get pods 命令查看一下集群中是否有资源在运行,再在 Dashboard UI 界面中命令空间选 default,
点击侧边栏中的“容器组”,点击容器名称,进入一个页面,点击右上方的“运行命令”或”日志“控件会弹出另一个额外页面,可在“运行命令”输入 curl <podip> 命令访问容器,再通过dashboard页面查看日志更新结果。

Kubernetes 集群部署 之 多Master节点 实现高可用_第34张图片

Kubernetes 集群部署 之 多Master节点 实现高可用_第35张图片

5.2.4 网页验证

继续访问网站 https://192.168.10.50:30001 , 将生成的令牌复制进去,就能打开页面了。
Kubernetes 集群部署 之 多Master节点 实现高可用_第36张图片
Kubernetes 集群部署 之 多Master节点 实现高可用_第37张图片

你可能感兴趣的:(K8s)