使用RKE部署Rancher v2.5.8 HA高可用集群

文章目录

  • 一 了解 Rancher
    • 1 关于Helm
    • 2 关于RKE
    • 3 关于K3S
    • 4 Rancher 名词解释
      • 4.1 仪表盘
      • 4.2 项目
      • 4.3 多集群应用
      • 4.4 应用商店
      • 4.5 Rancher Server URL
      • 4.6 RKE 模板
      • 4.7 GIS 扫描
    • 5 推荐架构
      • 5.1 K3S Kubernetes 集群安装
      • 5.2 RKE Kubernetes 集群安装
    • 6 负载均衡配置的推荐配置参数
    • 7 节点角色分配建议
      • 7.1 K3S 集群角色
      • 7.2 RKE 集群角色
    • 8 扩展 - Ingress
  • 二 软件要求
    • 1 Rancher支持的kubernetes版本
      • 1.1 在RKE上安装Ranhcer v2.5.8
      • 1.2 Rancher v2.5.8 中的下游集群
      • 1.3 在K3S上安装 Rancher v2.5.8
      • 1.4 Rancher K3S下游集群
    • 2 RKE-1.2.8
    • 3 Kubectl
    • 4 Helm-3.5.x
    • 5 Docker-20.10.x
    • 6 nginx-1.14
    • 7 OpenSSH-7.0+
  • 三 主机配置
    • 1 主机基本信息
    • 2 主机初始化配置
      • 2.1 查看系统版本是否满足要求
      • 2.2 安装小工具安装包
      • 2.3 关闭防火墙和selinux
      • 2.4 时钟同步
      • 2.5 内核参数调优
      • 2.6 SSH Server配置
      • 2.7 修改主机名
      • 2.8 关闭swap分区
      • 2.9 加载ipvs相关模块
  • 四 安装docker-20.10.6
  • 五 使用RKE安装kubernetes
    • 1 主机互信
    • 2 创建普通用户并加入docker组
    • 3 在nginx节点下载安装RKE-1.2.8
      • 3.1 下载RKE
      • 3.2 安装rke命令
      • 3.3 为kubernetes集群准备节点
      • 3.4 创建集群配置文件 - cluster.yml
      • 3.5 运行RKE部署kubernetes集群
      • 3.6 保存文件
  • 六 操作kubernetes集群
    • 1 安装kubectl-v1.21.1(kubernetes命令行工具)
    • 2 kubeconfig文件
    • 3 配置kubeconfig文件,运行kubectl命令
      • 3.1 让hqx(和root)用户运行kubectl命令
      • 3.2 使用kubectl测试集群节点连通性
      • 3.3 检查集群Pod的运行状况
      • 3.4 扩展 - 其余相关操作
  • 七 安装Helm(Kubernetes的软件包管理工具)
  • 八 安装 Rancher Helm Chart
    • 1 Helm Chart 仓库
    • 2 添加 Helm Chart 仓库
      • 2.1 扩展 - 切换到不同Helm Chart仓库
    • 3 为Rancher创建Namespace
    • 4 选择您的SSL选项
      • 4.1 什么是数字证书
        • 1. 数字证书类型
        • 2. 扩展名
        • 3. 什么是自签名证书
      • 4.2 生成ssl自签名证书
      • 4.3 运行脚本
      • 4.4 验证证书
        • 1. 私有签名证书验证
        • 2. CA证书验证
      • 4.5添加CA证书密文
    • 根据选择的SSL选项,通过Helm安装Rancher
      • 5.1 Chart安装选项
      • 5.2 使用已有的证书
      • 5.3 验证Rancher Server是否已成功部署
  • 九 配置负载均衡器nginx
    • 1 在nginx主机安装nginx-1.14
    • 2 配置负载均衡
  • 十 简单访问配置
    • 1 访问
    • 2 扩展 - 启用监控

此博客,是根据Rancher官网文档,使用RKE测试部署最新发布版 Rancher v2.5.8 高可用集群的总结文档。

一 了解 Rancher

  Rancher 是为使用容器的公司打造的容器管理平台。Ranhcer 简化了使用 Kubernetes 的流程,开发者可以随处运行 Kubernetes(Run Kubernetes Everywhere),满足IT需求规范,赋能 DevOps 团队。
  Rancher 可以创建来自 Kubernetes 托管服务提供商的集群,自动创建节点并安装 Kubernetes 集群,或者导入任何已经存在的 Kubernetes 集群。
  Rancher 支持集中化认证、权限控制、监控和管理所有 Kubernetes 集群。

  • 使用活动目录(Active Directory)的认证信息访问云端 Kubernetes 集群,如 GKE、AKS、EKS 等;
  • 设置用户、用户组、项目组、集群、云服务的权限控制策略和安全策略;
  • 一站式监控您名下所有集群的健康状态。

1 关于Helm

  Helm 是安装 Rancher 高可用集群时会用到的工具。
  Helm 是 Kubernetes 的软件包管理工具。Helm chart 为 Kubernetes YAML manifest 文件提供了模板语法。通过 Helm,可以创建可配置的 Deployment YAML,而不是只能用静态的 YAML。如果您想了解更多关于如何创建自己的应用商店应用(catalog),请查阅 Helm官方网站 。

2 关于RKE

  RKE 全称是 Rancher Kubernetes Engine。可以通过 CLI 的方式独立于 Rancher 2.x 使用。可以在安装好 docker 的 linux 主机上,快速方便的搭建 Kubernetes 集群。
  关于 RKE 和 Rancher 的关系,RKE 是 Rancher 2.x 中的一个重要组成部分,在 UI 上通过“自定义主机”创建的集群和通过“主机驱动”创建的集群,都是 Rancher Server 调用 RKE 模块来实现的。

3 关于K3S

  K3s 是经过精简和用户体验优化的 k8s。K3s 减少了运维负担。一条命令就可以启动 K3s。加入一个新节点,使用 4 层 LB 等也都非常简单。同时也可以使用 MySQL/SQLite 等关系型数据库作为数据库。

4 Rancher 名词解释

4.1 仪表盘

  仪表盘会显示 Prometheus 收集到的监控数据。单击右边的 Grafana 图标,浏览器会打开一个新的标签,在 Grafana 里呈现这些监控数据。
使用RKE部署Rancher v2.5.8 HA高可用集群_第1张图片
①. CPU

  • 已预留6中的2.4:6为集群节点的 CPU 总和,2.4为集群中所有工作负载spec.containers.resources.requests.cpu 的总和。
  • 已使用6中的0.2:6为集群节点的 CPU 总和,0.2为集群中所有节点已使用 CPU 的总和。

②. Memory

  • 已预留11.1GiB中的1.5:11.1GiB为集群节点的 memory 总和,1.5为集群中所有工作负载spec.containers.resources.requests.memory 的总和。
  • 已使用11.1GiB中的2.3:11.1GiB为集群节点的 memory 总和,2.3为集群中所有节点已使用 memory 的总和。

③. Pods
  集群可以创建的最大 Pod 数量,单节点默认110个 pod,可以通过设置 kubelet 的max-pods来修改默认最大 Pod 数量。

4.2 项目

  项目是 Rancher 中的一个概念,能够帮助您管理 kubernetes 集群中的命名空间,您可使用项目创建多租户集群,这种集群允许多个用户使用相同的底层资源创建应用,而应用之间不会相互影响。
  更多详情,请参阅 项目管理 文档。

4.3 多集群应用

  通常,大多数应用都部署在单个 kubernetes 集群上,但是有时候您可能希望跨不同的集群或项目部署同一个应用的多个副本。在 Rancher 中多集群应用使用 Helm Chart,并可以跨多个集群部署应用。因为能够跨多个集群部署相同的应用,因此可以避免在对每个集群上重复执行相同的操作期间引入的人为错误。使用多集群应用,您可以确保应用在所有项目/集群中具有相同的配置,并能够根据目标项目来覆盖不同的参数。由于多集群应用被视为单个应用,因此易于管理和维护。
  更多详情,请参阅 多集群应用 文档。

4.4 应用商店

  Rancher 提供了基于 Helm 的应用商店的功能,该功能使部署和管理相同的应用变得更加容易。

  • 应用商店可以是 GitHub 代码库或 Helm Chart 库,其中包含了可部署的应用。应用打包在称为 Helm Chart 的对象中。
  • Helm Charts 是描述一组相关 Kubernetes 资源的文件的集合。单个 Chart 可能用于部署简单的内容(例如 Mencached Pod)或复杂的内容(例如带有 HTTP 服务,数据库,缓存等的完整的 Web 应用)。

  Rancher 改进了 Helm 应用商店和 Chart。所有原生 Helm Chart 都可以在 Rancher 中使用,但是 Rancher 添加了一些增强功能以改善用户体验。
  更多详情,请参阅 应用商店 文档。

4.5 Rancher Server URL

  第一次登录 Rancher 后,Rancher 将提示您输入一个Rancher Server URL。您应该将 URL 设置为 Rancher Server 的主入口点。当负载均衡器位于 Rancher Server 集群前面时,URL 应该设置为负载均衡地址。系统会自动尝试从运行 Rancher Server 的主机的 IP 地址或主机名推断 Rancher Server 的 URL,但只有在运行单节点的 Rancher Server 时,上述推断才会正确。因此,在大多数情况下,您需要自己将 Rancher Server URL 设置为正确的值。
  更多详情,请参阅 配置 Rancher Server URL 文档。

4.6 RKE 模板

  RKE 的全称是Rancher Kubernetes Engine,它是 Rancher 用来创建 Kubernetes 集群的工具。RKE 集群模板制定了 DevOps 和安全团队的标准,简化了 Kubernetes 集群的创建过程。
  多集群管理面临着如何强制实施安全策略和附加配置的挑战,在将集群移交给最终用户之前,管理员需要标准化这些配置。RKE 集群模板提供了标准化集群配置的方式。无论是使用 Rancher UI、Rancher API 还是自动化流程创建的集群,Rancher 都将保证从 RKE 集群模板创建的每个集群在生成方式上是一致的。
  更多详情,请参阅 RKE 模板 文档。

4.7 GIS 扫描

  Rancher 充分利用了kube-bench来对 Kubernetes 集群进行安全扫描。Rancher 会检查 Kubernetes 集群是否遵循了 CIS (Center for Internet Security,互联网安全中心) Kubernetes Benchmark 中定义的最佳实践。
  CIS Kubernetes Benchmark 是一个可以用来给 Kubernetes 创建安全基准的参考文档。
  互联网安全中心(CIS)是一个501©(3)非营利组织,成立于 2000 年 10 月,其使命是“通过识别,开发,验证,推广和维护最佳实践解决方案来防御网络攻击,并建立和引导社区打造安全可信的网络环境”。
  CIS 基准测试是安全配置目标系统的最佳实践。CIS 基准是通过领域专家,技术供应商,公共和私人社区成员以及 CIS 基准开发团队的不懈努力而制定的。
  基准提供两种类型的建议:计分和不记分。我们仅运行与“计分建议”相关的测试。
  当 Rancher 对一个集群进行 CIS 安全扫描时,它会生成一个展示每个测试结果的报告。报告中包括通过,跳过和失败的测试数量的汇总。报告中同时也给失败的测试提供了补救办法。
  更多详情,请参阅 安全扫描 文档。

5 推荐架构

  安装 Rancher 的方式有两种:单节点安装和高可用集群安装。因为单节点安装只适用于测试和 demo 环境,而且单节点安装和高可用集群安装之间不能进行数据迁移,所以推荐从一开始就使用高可用集群安装的方式安装 Rancher。
  建议将 Rancher Server 安装在高可用的 Kubernetes 集群上,主要是因为它可以保护 Rancher Server 的数据。在高可用安装中,负载均衡器充当客户端的单点入口,并在集群中的多台服务器之间分配网络流量,这有助于防止任何一台服务器成为单点故障。
  不建议在单个 Docker 容器中安装 Rancher,因为如果该节点发生故障,则其他节点上将没有可用的集群数据副本,并且可能会丢失 Rancher Server 上的数据。
  Rancher 需要安装在高可用的 RKE(Rancher Kubernetes Engine)Kubernetes 集群上,或高可用的K3s (轻量级 Kubernetes) Kubernetes 集群。 RKE 和 K3s 都是经过完全认证的 Kubernetes 发行版。

5.1 K3S Kubernetes 集群安装

  如果您是首次安装 Rancher v2.4,建议将其安装在 K3s Kubernetes 集群上。这种 K3s 架构的一个主要优点是,它允许使用外部数据库保存集群数据,从而可以将 K3s 服务器节点视为无状态的。
  在 K3s 集群上安装 Rancher 的功能是在 Rancher v2.4 中引入的。K3s 易于安装,仅需要 Kubernetes 一半的内存,而且所有组件都在一个不超过 100 MB 的二进制文件中。
  使用 K3s Kubernetes 集群运行 Rancher Management Server 的架构:
使用RKE部署Rancher v2.5.8 HA高可用集群_第2张图片

5.2 RKE Kubernetes 集群安装

  如果要安装 Rancher v2.4 之前的版本,您需要在 RKE 集群上安装 Rancher,该集群中的数据存储在每个有 etcd 角色的节点上。在 Rancher v2.4 中,没有将 Rancher Server 从 RKE 集群迁移到 K3s 集群的方法。所有版本的 Rancher Server(包括 v2.4+)仍然可以安装在 RKE 集群上。
  在 RKE 安装中,集群数据将在集群中的三个 etcd 节点上进行复制,这是为了保障在一个 etcd 节点发生故障时,可以提供冗余和数据复制。
  使用 RKE Kubernetes 集群运行 Rancher Management Server 的架构:
使用RKE部署Rancher v2.5.8 HA高可用集群_第3张图片

6 负载均衡配置的推荐配置参数

  我们建议您使用以下方案,配置您的负载均衡和 Ingress Controller:

  • Rancher 的DNS应该被解析到四层负载均衡器上;
  • 负载均衡器应该把 TCP/80 端口和 TCP/443 端口的流量转发到集群中全部的3个节点上;
  • Ingress Controller 将把HTTP重定向到HTTPS,在 TCP/443 端口使用 SSL/TLS;
  • Ingress Controller 把流量转发到 Rancher Server 的pod的80端口。

  在kubernetes集群中安装Ranhcer,并使用四层负载均衡,SSL终止在 Ingress Controller 中。
使用RKE部署Rancher v2.5.8 HA高可用集群_第4张图片
  为了达到最好的性能和安全条件,我们建议您为 Rancher 创建一个专用的 Kubernetes 集群,只在这个机器中部署 Rancher Server,不在这个集群中运行应用或程序。部署 Rancher 后,您可以 创建新集群或导入已有集群 ,然后用这些集群启动您自己的应用或程序。
  我们不建议在托管的 Kubernetes 集群上,如 EKS 和 GKE,安装 Rancher。 这些托管的 Kubernetes 集群不会将 etcd 暴露给 Rancher ,达到 Rancher 可以管理的程度,而且它们的特殊改动可能与 Rancher 的操作冲突。

7 节点角色分配建议

  根据Rancher是安装在 K3S Kubernetes 集群上还是 RKE Kubernetes 集群上,我们对每个节点的角色的建议有所不同。

7.1 K3S 集群角色

  在 K3s 集群中,有两种类型的节点:Server 节点和 Agent 节点。Server 节点和 Agent 节点 都可以运行工作负载。Server 节点运行 Kubernetes Master。
  对于运行 Rancher Server 的集群,建议使用两个 Server 节点。不需要 Agent 节点。

7.2 RKE 集群角色

  如果将 Rancher 安装在 RKE Kubernetes 集群上,则该集群应具有三个节点,并且每个节点都应具有所有三个 Kubernetes 角色:etcd,controlplane 和 worker。
Rancher Server RKE 集群和下游 Kubernetes RKE 集群的架构对比:
  我们对 Rancher Server 集群上的 RKE 节点角色的建议与对运行您的业务应用的下游集群的建议相反。
  在配置下游 Kubernetes 集群时,Rancher 使用 RKE 作为创建下游 Kubernetes 集群的工具。注意:在将来的 Rancher 版本中将添加创建下游 K3s 集群的功能。
  对于下游 Kubernetes 集群,考虑到稳定性和可扩展性,我们建议下游集群中的每个节点都应只扮演一个角色。
使用RKE部署Rancher v2.5.8 HA高可用集群_第5张图片
  RKE 每个节点至少需要一个角色,但并不强制每个节点只能有一个角色。但是,对于运行您的业务应用的集群,我们建议为每个节点使用单独的角色,这可以保证工作节点上的工作负载不会干扰 Kubernetes Master 或集群数据。
以下是我们对于下游集群的最低配置建议:

  • 三个只有 etcd 角色的节点 保障高可用性,如果这三个节点中的任意一个出现故障,还可以继续使用。
  • 两个只有 controlplane 角色的节点 这样可以保证 master 组件的高可用性。
    一个或多个只有 worker 角色的节点 用于运行 Kubernetes 节点组件和您部署的服务或应用。

在安装 Rancher Server 时三个节点,每个节点都有三个角色是安全的,因为:

  • 可以允许一个 etcd 节点失败
  • 多个 controlplane 节点使 master 组件保持多实例的状态。
  • 该集群有且只有 Rancher 在运行。

  因为这个集群中只部署了 Rancher server,没有其他程序或应用,这个集群已经足以应对大多数情况。所以这个集群并不需要像我们建议的下游集群那样的可扩展性和可靠性。

8 扩展 - Ingress

  Rancher 安装的 Kubernetes 集群中的每个节点都应该运行一个 Ingress。
  Ingress 应被部署为 DaemonSet,以确保你的负载平衡器能够成功地将流量路由到所有节点。
  对于 RKE、K3s 和 RancherD 的安装,你不需要手动安装 Ingress,因为它是默认安装的。
  对于托管的 Kubernetes 集群(EKS、GKE、AKS)和 RKE2 Kubernetes 安装,你将需要设置 Ingress。

二 软件要求

下面的版本为当前的最新版和稳定版:

类型 Rancher 版本 Docker 标签 Helm 仓库 Helm Chart 版本
最新版 v2.5.8 rancher/rancher:latest server-charts/latest v2.5.8
稳定版 v2.5.8 rancher/rancher:stable server-charts/stable v2.5.8

1 Rancher支持的kubernetes版本

  更多信息可以转到官方链接查看。此处我仅列举了本人文档里试验总结的官方最新稳定版的相关信息:https://rancher.com/support-maintenance-terms/all-supported-versions/rancher-v2.5.8/

1.1 在RKE上安装Ranhcer v2.5.8

适用于本地集群的 RKE CLI 和 K8S:

Rancher版本 推荐的CLI版本 KUBERNETES版本
v2.5.8 v1.2.8 v1.20.4(默认)
v1.19.8
v1.18.16
v1.17.17

操作系统和 Docker:

类型 版本 已于1验证/认证
CentOS 7.7、7.8、7.9 Docker 18.06.3、18.09.x,19.03.x,20.10.x

1.2 Rancher v2.5.8 中的下游集群

Rancher RKE 下游集群 - Linux Work 节点
注意:Rancher RKE下游群集可以由节点驱动程序或自定义/现有节点配置,也可以注册到Rancher中。
操作系统和Docker:

类型 版本 已于1验证/认证
CentOS 7.7、7.8、7.9 Docker 18.06.3、18.09.x,19.03.x,20.10.x

支持的K8S版本:

上游K8S版本 在2,3,4,5上验证/认证
v1.20.6 etcd:v3.4.15
flannel:v0.13.0
canal:v3.17.2
nginx-ingress-controller:0.43.0-rancher3

1.3 在K3S上安装 Rancher v2.5.8

本地集群:

K3S版本 在2,3,4,5上验证/认证
v1.20.6 + k3s1 Aurora(MySQL 5.7)2.09.0
MySQL 5.7
PostgreSQL 11.5、12.5、13.1
MariaDB 10.4.8
External Etcd 3.4.15
Embedded Etcd
CRI:embedded Containered v1.4.4-k3s1
CNI:embedded Flannel v0.12.0-k3s.1

操作系统:

类型 版本 已于1验证/认证
CentOS 7.8、7.9、8.2、8.3 x86_64架构

1.4 Rancher K3S下游集群

注意:Rancher K3S群集只能在Rancher中注册。
操作系统:

类型 版本 已于1验证/认证
CentOS 7.8、7.9、8.2、8.3 x86_64架构

支持的K3S版本:

K3S版本 在2,3,4,5上验证/认证
v1.20.6 + k3s1 Aurora(MySQL 5.7)2.09.0
MySQL 5.7
PostgreSQL 11.5、12.5、13.1
MariaDB 10.4.8
External Etcd 3.4.15
Embedded Etcd
CRI:embedded Containered v1.4.4-k3s1
CNI:embedded Flannel v0.12.0-k3s.1

2 RKE-1.2.8

  RKE可以兼容当前的所有Docker版本。
  每个RKE版本都有受支持的Kubernetes版本的特定列表。如果您要使用的版本与下面列出的版本不同,则需要使用中的系统映像选项来更新Kubernetes cluster.yml。
列举支持的 Kubernetes 版本:

  1. 请参考 RKE 版本说明 ,获取您当前使用的 RKE 支持的 Kubernetes 版本号。
Kubernetes版本
v1.20.6-rancher1-1
v1.19.10-rancher1-1
v1.18.18-rancher1-2
v1.17.17-rancher2-3
  1. 也可以输入以下命令,快速获取支持的版本号:
./rke config --list-version --all
v1.20.6-rancher1-1
v1.17.17-rancher2-3
v1.18.18-rancher1-2
v1.19.10-rancher1-1

3 Kubectl

kubectl 可以比 kube-apiserver 高一个小版本,也可以低一个小版本。
例如:

  • 如果 kube-apiserver 当前是 1.21 版本
  • kubectl 则支持 1.22、1.21 和 1.20

4 Helm-3.5.x

  • 请使用 Helm v3.2.x 或更高版本安装或升级 Rancher v2.5.x。
  • Helm v2.16.0 或更高版本需要 Kubernetes v1.16 版本。对于默认的 Kubernetes 版本,请参考发布说明以获取所使用的 RKE 的版本。
  • 不能使用 Helm v2.15.0,因为这个版本中有一些关于转换/比较数字的问题。
  • 不能使用 Helm v2.12.0,因为这个版本和cert-manager一起使用时会有问题。
Helm 版本 支持的 Kubernetes 版本
3.5.x 1.20.x - 1.17.x
3.4.x 1.19.x - 1.16.x
3.3.x 1.18.x - 1.15.x
3.2.x 1.18.x - 1.15.x
3.1.x 1.17.x - 1.14.x
3.0.x 1.16.x - 1.13.x
2.16.x 1.16.x - 1.15.x
2.15.x 1.15.x - 1.14.x
2.14.x 1.14.x - 1.13.x
2.13.x 1.13.x - 1.12.x
2.12.x 1.12.x - 1.11.x
2.11.x 1.11.x - 1.10.x
2.10.x 1.10.x - 1.9.x
2.9.x 1.10.x - 1.9.x
2.8.x 1.9.x - 1.8.x
2.7.x 1.8.x - 1.7.x
2.6.x 1.7.x - 1.6.x
2.5.x 1.6.x - 1.5.x
2.4.x 1.6.x - 1.5.x
2.3.x 1.5.x - 1.4.x
2.2.x 1.5.x - 1.4.x
2.1.x 1.5.x - 1.4.x
2.0.x 1.4.x - 1.3.x

5 Docker-20.10.x

将最新的经过验证的Docker版本更新为20.10。
每一个 Kubernetes 版本支持的 Docker 版本都不同。

6 nginx-1.14

官方已在 NGINX 1.14 上进行了测试NGINX 配置。

7 OpenSSH-7.0+

  为了可以通过 SSH 访问每一个节点,RKE 要求每个节点上安装的是 OpenSSH 的版本是OpenSSH 7.0+。

三 主机配置

  先配置4台最小化安装的主机,其中3台使用RKE配置k8s集群,然后在这个集群上配置高可用Rancher。
  要在高可用性 RKE 集群上安装 Rancher 管理服务器,我们建议设置以下基础设施:

  • 三个 Linux 节点,通常是虚拟机。
  • 一个负载均衡器,将前端流量引导到三个节点。
  • 一个 DNS 记录,将一个 URL 映射到负载均衡器。这将成为 Rancher 服务器的 URL,下游的 Kubernetes 集群需要到达它。

  注意:Rancher对于配置k8s集群的主机性能要求较高,如果配置较低,会有k8s集群被迫中断的风险。nginx主机性能满足基本要求就可以了,配置要求不大。经试验几次后,我给予的虚拟机Rancher集群k8s主机配置的是:2U,运行内存4G和存储内存50G。

1 主机基本信息

国内用户可根据此链接可以下载所有资源:http://mirror.cnrancher.com

主机IP 主机名 配置 角色
192.168.4.21 k8s-node01 2线程4G controlplane,etcd,worker
192.168.4.22 k8s-node02 2线程4G controlplane,etcd,worker
192.168.4.23 k8s-node03 2线程4G controlplane,etcd,worker
192.168.4.24 nginx 2线程2G nginx负载均衡

2 主机初始化配置

注 意 : 以 下 步 骤 , 四 台 主 机 均 要 操 作 。 \color{red}注意:以下步骤,四台主机均要操作。

2.1 查看系统版本是否满足要求

cat /etc/centos-release
CentOS Linux release 7.9.2009 (Core)     #若系统版本为7.7 7.8 7.9 均符合

2.2 安装小工具安装包

yum -y install epel-release
yum -y install lrzsz vim gcc glibc openssl openssl-devel net-tools wget curl
yum -y update  #更新软件包版本和内核版本

2.3 关闭防火墙和selinux

  测试环境中,为了方便将防火墙和selinux关闭;生产环境中,建议关闭selinux,防火墙规则根据环境需要自定义即可。

#关闭selinux
setenforce 0
sed -i 's/enforcing/disabled/' /etc/selinux/config

#关闭防火墙
systemctl stop firewalld
systemctl disable firewalld

2.4 时钟同步

  为了防止后续集群在客户端和服务器之间因为时钟不同步而发生验证错误。

  1. 第一种方法:
yum install ntp   #每台主机安装ntp服务
systemctl start ntpd    #启动时钟同步服务
systemctl enable  ntpd   #设置开机启动
ntpq -p   #查看时钟同步状态
  1. 第二种方法:
yum install ntp ntpdate -y

之后,选择一台主机(192.168.4.21)作为ntp时间服务器,修改/etc/ntp.conf文件,删除:

server 1.centos.pool.ntp.org iburst
server 2.centos.pool.ntp.org iburst
server 3.centos.pool.ntp.org iburst

改为:

server ntp3.aliyun.com iburst

另外,原始文件中有一行为如下内容:

#restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap

去掉#,打开注释,并将其ip修改为服务器所在网段:

restrict 192.168.4.21 mask 255.255.240.0 nomodify notrap

在集群中的其他服务器上,也要修改此文件,删除掉:

server 1.centos.pool.ntp.org iburst
server 2.centos.pool.ntp.org iburst
server 3.centos.pool.ntp.org iburst

加入:

server 192.168.4.21 prefer

保存后退出,在集群中的所有服务器上执行如下命令:

systemctl stop chronyd.service
systemctl disable chronyd.service

systemctl restart ntpd
systemctl enable ntpd

之后,在集群中192.168.4.21以外的服务器上执行:

ntpq -p

出现以下结果:

     remote           refid      st t when poll reach   delay   offset  jitter
==============================================================================
*sv1.ggsrv.de    192.53.103.103   2 u   28   64    1  210.439   -0.300   0.305
 192.168.4.21    .INIT.          16 u    -   64    0    0.000    0.000   0.000

说明时间已经同步。

2.5 内核参数调优

cat >> /etc/sysctl.conf << eof
vm.swappiness=0
net.ipv4.ip_forward=1
net.bridge.bridge-nf-call-iptables=1
net.bridge.bridge-nf-call-ip6tables = 1
net.ipv4.neigh.default.gc_thresh1=4096
net.ipv4.neigh.default.gc_thresh2=6144
net.ipv4.neigh.default.gc_thresh3=8192
eof

使内核参数生效:

modprobe br_netfilter  #首先执行这个命令后才不会报错
sysctl -p

2.6 SSH Server配置

  SSH server全系统配置文件,位于/etc/ssh/sshd_config,该文件必须包含以下代码,允许 TCP 转发。

AllowTcpForwarding yes

#重启sshd服务
systemctl restart sshd

2.7 修改主机名

#分别修改每条主机的hostname
hostnamectl set-hostname k8s-node01
hostnamectl set-hostname k8s-node02
hostnamectl set-hostname k8s-node03
hostnamectl set-hostname nginx
#修改完后可直接断开Xshell的连接,再重新连接Xshell就可以看到主机名已修改了

在 /etc/hosts 文件中添加主机名配置:

cat >> /etc/hosts << eof
192.168.4.21 k8s-node01
192.168.4.22 k8s-node02
192.168.4.23 k8s-node03
192.168.4.24  nginx
eof

  注 意 : 下 面 的 步 骤 仅 在 k 8 s 的 3 台 主 机 上 操 作 , n g i n x 上 不 可 以 操 作 。 \color{red}注意:下面的步骤仅在k8s的3台主机上操作,nginx上不可以操作。 k8s3nginx

2.8 关闭swap分区

#临时关闭
swapoff -a

#永久关闭
进入/etc/fstab文件,注释掉swap分区的相关配置内容

在这里插入图片描述

2.9 加载ipvs相关模块

  由于ipvs已经加入到了内核的主干,所以为kube-proxy开启ipvs的前提需要加载以下的内核模块。

cat > /etc/sysconfig/modules/ipvs.modules << eof
#!/bin/bash
modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4
eof
chmod 755 /etc/sysconfig/modules/ipvs.modules 
bash /etc/sysconfig/modules/ipvs.modules
lsmod | grep -e ip_vs -e nf_conntrack_ipv4	  #查看是否已经正确安装lipset软件包

使用RKE部署Rancher v2.5.8 HA高可用集群_第6张图片
  前面脚本创建了/etc/sysconfig/modules/ipvs.modules文件,保证在节点重启后能自动加载所需模块。

cat >> /etc/rc.d/rc.local << eof
bash /etc/sysconfig/modules/ipvs.modules
eof

chmod +x /etc/rc.d/rc.local 

四 安装docker-20.10.6

注 意 : 仅 在 k 8 s 节 点 安 装 d o c k e r \color{red}注意:仅在k8s节点安装docker k8sdocker

  1. 若是节点主机上已安装有docker,则先卸载及其依赖包
yum remove docker \
     docker-client \
     docker-client-latest \
     docker-common \
     docker-latest \
     docker-latest-logrotate \
     docker-logrotate \
     docker-engine
  1. 安装epel更新源
yum install epel-release -y
  1. 安装docker仓库

  在新主机上首次安装docker之前,需要设置Docker仓库;之后,可以从仓库安装和更新docker。
  安装所需的软件包。yum-utils 提供了 yum-config-manager,并且 device mapper 存储驱动程序需要 device-mapper-persistent-data 和 lvm2。

yum install -y yum-utils device-mapper-persistent-data lvm2

  设置稳定仓库。

yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo

# 速度慢的可以换为阿里云源 
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo/
  1. 安装docker
    按版本号排序列出存储库中可用的版本号
yum list docker-ce --showduplicates | sort -r
docker-ce.x86_64            3:20.10.6-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.5-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.4-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.3-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.2-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.1-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.0-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.9-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.8-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.7-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.6-3.el7                     docker-ce-stable
……

根据前面软件要求的内容,可以直接安装最新版docker-20.10.x:

yum install -y docker-ce docker-ce-cli containerd.io	#默认安装最新版本的docker

若是安装指定版本,例如:

yum install -y docker-ce-19.03.9-3.el7 docker-ce-cli-19.03.9-3.el7 containerd.io

安装docker命令补全工具:

yum install -y bash-completion

启动docker:

systemctl start docker
  1. 配置docker镜像下载加速器
tee /etc/docker/daemon.json << eof
{
    "registry-mirrors": [
        "https://1nj0zren.mirror.aliyuncs.com",
        "https://docker.mirrors.ustc.edu.cn",
        "http://f1361db2.m.daocloud.io",
        "https://registry.docker-cn.com"
    ]
}
eof
  1. 启动docker
systemctl daemon-reload
systemctl restart docker
systemctl enable docker

五 使用RKE安装kubernetes

1 主机互信

  目前有4台服务器,确保可以通过ssh互相访问。

# 每台主机执行
ssh-keygen
ssh-copy-id -i 192.168.4.21
ssh-copy-id -i 192.168.4.22
ssh-copy-id -i 192.168.4.23
ssh-copy-id -i 192.168.4.24

2 创建普通用户并加入docker组

注 意 : 使 用 r k e 安 装 k u b e r n e t e s 时 , 不 能 以 r o o t 用 户 执 行 , 必 须 是 一 个 普 通 用 户 才 可 以 。 \color{red}注意:使用rke安装kubernetes时,不能以 root用户执行,必须是一个普通用户才可以。 使rkekubernetesroot
  在每个节点上创建hqx普通用户,并将其加入docker用户组中;把nginx主机当做主控机,其他主机的hqx用户互信它的hqx用户。

//nginx节点

[root@nginx ~]# useradd hqx
[root@nginx ~]# echo 123 | passwd --stdin hqx	//给hqx用户设置密码
[root@nginx ~]# groupadd docker
[root@nginx ~]# usermod -G docker hqx

//更新用户组
[root@nginx ~]# newgrp docker
[root@nginx ~]# id hqx
uid=1000(hqx) gid=1000(hqx)=1000(hqx),1001(docker)
//3个k8s节点均按照k8s-node01步骤操作

[root@k8s-node01 ~]# useradd hqx
[root@k8s-node01 ~]# echo 123 | passwd --stdin hqx
[root@k8s-node01 ~]# usermod -G docker hqx

//更新用户组
[root@k8s-node01 ~]# newgrp docker
[root@k8s-node01 ~]# id hqx
uid=1000(hqx) gid=1000(hqx)=1000(hqx),994(docker)

//切换到hqx用户,测试hqx用户是否能运行docker命令
[root@k8s-node01 ~]# su - hqx
[ops@k8s-node01 ~]$ docker ps

在这里插入图片描述

//每台主机切换到hqx用户,让每个节点主机的ops用户互相信任
# su - hqx
$ ssh-keygen 
$ ssh-copy-id -i hqx@192.168.4.21
$ ssh-copy-id -i hqx@192.168.4.22
$ ssh-copy-id -i hqx@192.168.4.23
$ ssh-copy-id -i hqx@192.168.4.24

  最后在nginx主机上测试:通过hqx用户可以直接连接到每个k8s节点,并能运行docker相关命令。
使用RKE部署Rancher v2.5.8 HA高可用集群_第7张图片
注 意 : 完 成 以 上 配 置 后 , 需 重 启 主 机 , 某 些 配 置 参 数 才 会 生 效 。 \color{red}注意:完成以上配置后,需重启主机,某些配置参数才会生效。

3 在nginx节点下载安装RKE-1.2.8

3.1 下载RKE

  登录主机,打开浏览器,访问 RKE 版本发布页面,下载最新的 RKE v1.2.8。
  每个RKE版本都有受支持的Kubernetes版本的特定列表。如果您要使用的版本与下面列出的版本不同,则需要使用中的 系统映像 选项来更新Kubernetes cluster.yml。
使用RKE部署Rancher v2.5.8 HA高可用集群_第8张图片

3.2 安装rke命令

  运行以下命令,将下载的 RKE 二进制安装包复制到您想要保存的路径下,然后将这个安装包重命名为rke。

//保存至hqx用户的家目录
$ mv rke_linux-amd64 rke

  运行以下命令,将rke安装包转为可执行文件。

$ chmod +x rke

  运行以下命令,检查rke安装包是否已经转换为可执行文件。

$ ./rke --version
rke version v1.2.8

在这里插入图片描述

3.3 为kubernetes集群准备节点

注 意 : 以 下 1 和 2 已 在 初 始 化 环 境 完 成 , 3 需 要 在 每 个 节 点 执 行 \color{red}注意:以下1和2已在初始化环境完成,3需要在每个节点执行 123
  kubernetes集群组件需要在Linux发行版上的Docker中运行,只要是能安装和运行docker是linux发行版,都可以使用。

  1. SSH用户 - 使用SSH访问节点的用户必须是节点上docker用户组的成员。
  • 添加到docker用户组的用户会自动获得主机的 root 权限,运行上述命令前,请确认您是否想让该用户获得 root 权限。运行命令后,请妥善保存该用户的认证凭据。
  • 如果您无法切换到 root 用户,不能运行上述命令将用户添加到docker用户组,请参考 Docker 官方文档,该文档提供了以非 root 用户的身份管理 Docker 的操作步骤。
  1. 禁用所有的work节点上的交换功能(swap)。
  2. 在命令行工具中输入以下命令和脚本,检查下列模组是否存在。
// 配置以下脚本
# vim module.sh
for module in br_netfilter ip6_udp_tunnel ip_set ip_set_hash_ip ip_set_hash_net iptable_filter iptable_nat iptable_mangle iptable_raw nf_conntrack_netlink nf_conntrack nf_conntrack_ipv4   nf_defrag_ipv4 nf_nat nf_nat_ipv4 nf_nat_masquerade_ipv4 nfnetlink udp_tunnel veth vxlan x_tables xt_addrtype xt_conntrack xt_comment xt_mark xt_multiport xt_nat xt_recent xt_set  xt_statistic xt_tcpudp;
do
  if ! lsmod | grep -q $module; then
    echo "module $module is not present";
  fi;
done
    
# chmod +x module.sh
# sh module.sh

报错:所有模块不存在
使用RKE部署Rancher v2.5.8 HA高可用集群_第9张图片

// 执行此命令加载内核模块
# modprobe -a br_netfilter ip6_udp_tunnel ip_set ip_set_hash_ip ip_set_hash_net iptable_filter iptable_nat iptable_mangle iptable_raw nf_conntrack_netlink nf_conntrack nf_conntrack_ipv4   nf_defrag_ipv4 nf_nat nf_nat_ipv4 nf_nat_masquerade_ipv4 nfnetlink udp_tunnel veth vxlan x_tables xt_addrtype xt_conntrack xt_comment xt_mark xt_multiport xt_nat xt_recent xt_set  xt_statistic xt_tcpudp

//然后再次执行module.sh脚本 
# sh module.sh

会有2个模块没有找到,不影响:
在这里插入图片描述
返回的模组应该包括下列的所有模组:

模组名称
br_netfilter
ip6_udp_tunnel
ip_set
ip_set_hash_ip
ip_set_hash_net
iptable_filter
iptable_nat
iptable_mangle
iptable_raw
nf_conntrack_netlink
nf_conntrack
nf_conntrack_ipv4
nf_defrag_ipv4
nf_nat
nf_nat_ipv4
nf_nat_masquerade_ipv4
nfnetlink
udp_tunnel
veth
vxlan
x_tables
xt_addrtype
xt_conntrack
xt_comment
xt_mark
xt_multiport
xt_nat
xt_recent
xt_set
xt_statistic
xt_tcpudp

3.4 创建集群配置文件 - cluster.yml

  创建一个名为 cluster.yml 的 Kubernetes 集群配置文件。在后续步骤中,当使用 RKE 命令设置集群时,它将使用此文件在节点上安装 Kubernetes。
  RKE适配了高可用集群,您可以在 cluster.yml 文件中配置多个 controlplane 节点。RKE 会把 master 节点的组件部署在所有被列为 controlplane 的节点上,同时把 kubelets 的默认连接地址配置为 127.0.0.1:6443 。这个地址是nginx-proxy请求所有 master 节点的地址。
  创建高可用集群需要指定两个或更多的节点作为 controlplane 。
  RKE使用集群配置文件 cluster.yml 规划集群中的节点,例如集群中应该包含哪些节点,如何部署 Kubernetes。您可以通过该文件修改很多集群配置选项。
  如果您的节点具有公共和内部地址,建议设置 internal_address: 这样 Kubernetes 会将其用于集群内通信。
  RKE需要通过 SSH 连接到每个节点,并且它将在默认位置 ~/.ssh/id_rsa 中寻找私钥。如果您的默认私钥与节点的私钥不在同一个位置,则还需要为该节点配置 ssh_key_path 选项。

我这里根据官网列举了几个RKE节点选项:

选项 必填 描述
address 公用 DNS 或 IP 地址
user 可以运行 docker 命令的用户
role 分配给节点的 Kubernetes 角色列表
internal_address 内部集群流量的专用 DNS 或 IP 地址
ssh_key_path 用于对节点进行身份验证的 SSH 私钥的路径(默认为~/.ssh/id_rsa)
cluster_name 集群名称 默认集群名称:local
ignore_docker_version 检查docker版本 在运行 RKE 前是否执行 Docker 版本检测,可选值为true和false,默认值为false
kubernetes_version kubernetes版本 将原有的版本号修改为新的版本号即可,RKE 目前不支持回滚 Kubernetes 版本。
prefix_path 前缀路径 默认下RKE 存储ROS、CoreOS 等操作系统的相关资源时,添加一个前缀:/opt/rke
ssh_key_path 集群ssh秘钥路径 RKE 使用ssh连接到主机,通常情况下,每个节点都会在nodes部分为每个 ssh 密钥设置一个独立的路径。
…… …… ……
  • 高级配置: RKE 有许多配置选项可用于在您的特定环境中进行自定义安装。请参阅 RKE 文档 来了解 RKE 的选项和功能的完整列表。
  • 要为大规模 Rancher 安装 etcd 集群,请参阅 etcd 设置指南 。
  1. 创建集群配置文件 cluster.yml 的方式有两种:
  • 使用 minimal cluster.yml 创建集群配置文件,然后将您使用的节点的相关信息添加到文件中。
  • 使用 rke config 命令 创建集群配置文件,然后将集群参数逐个输入到该文件中。
  1. 使用 rke config
      运行 rke config 命令,在当前路径下创建 cluster.yml 文件。这条命令会引导您输入创建集群所需的所有参数,详情请参考集群配置选项。
[hqx@nginx ~]$ ./rke config --name cluster.yml

  中间有一些内容是需要修改的,比如etcd的备份周期,备份保留时间,ingress是否安装等等。

cluster.yml配置文件内容:参考 官方kubernetes配置选项

# If you intened to deploy Kubernetes in an air-gapped environment,
# please consult the documentation on how to configure custom RKE images.
nodes:
- address: 192.168.4.21
  port: "22"
  internal_address: ""
  role:
  - controlplane
  - worker
  - etcd
  hostname_override: ""
  user: hqx
  docker_socket: /var/run/docker.sock
  ssh_key: ""
  ssh_key_path: /home/hqx/.ssh/id_rsa
  ssh_cert: ""
  ssh_cert_path: ""
  labels: {}
  taints: []
- address: 192.168.4.22
  port: "22"
  internal_address: ""
  role:
  - controlplane
  - worker
  - etcd
  hostname_override: ""
  user: hqx
  docker_socket: /var/run/docker.sock
  ssh_key: ""
  ssh_key_path: /home/hqx/.ssh/id_rsa
  ssh_cert: ""
  ssh_cert_path: ""
  labels: {}
  taints: []
- address: 192.168.4.23
  port: "22"
  internal_address: ""
  role:
  - controlplane
  - worker
  - etcd
  hostname_override: ""
  user: hqx
  docker_socket: /var/run/docker.sock
  ssh_key: ""
  ssh_key_path: /home/hqx/.ssh/id_rsa
  ssh_cert: ""
  ssh_cert_path: ""
  labels: {}
  taints: []
services:
  etcd:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    external_urls: []
    ca_cert: ""
    cert: ""
    key: ""
    path: ""
    uid: 0
    gid: 0
    snapshot: true
    retention: 24h
    creation: 6h
    backup_config: null
  kube-api:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    service_cluster_ip_range: 10.43.0.0/16
    service_node_port_range: ""
    pod_security_policy: false
    always_pull_images: false
    secrets_encryption_config: null
    audit_log: null
    admission_configuration: null
    event_rate_limit: null
  kube-controller:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    cluster_cidr: 10.42.0.0/16
    service_cluster_ip_range: 10.43.0.0/16
  scheduler:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
  kubelet:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    cluster_domain: cluster.local
    infra_container_image: ""
    cluster_dns_server: 10.43.0.10
    fail_swap_on: false
    generate_serving_certificate: false
  kubeproxy:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
network:
  plugin: canal
  options: {}
  mtu: 0
  node_selector: {}
  update_strategy: null
  tolerations: []
authentication:
  strategy: x509
  sans: []
  webhook: null
addons: ""
addons_include: []
system_images:
  etcd: rancher/mirrored-coreos-etcd:v3.4.15-rancher1
  alpine: rancher/rke-tools:v0.1.74
  nginx_proxy: rancher/rke-tools:v0.1.74
  cert_downloader: rancher/rke-tools:v0.1.74
  kubernetes_services_sidecar: rancher/rke-tools:v0.1.74
  kubedns: rancher/mirrored-k8s-dns-kube-dns:1.15.10
  dnsmasq: rancher/mirrored-k8s-dns-dnsmasq-nanny:1.15.10
  kubedns_sidecar: rancher/mirrored-k8s-dns-sidecar:1.15.10
  kubedns_autoscaler: rancher/mirrored-cluster-proportional-autoscaler:1.8.1
  coredns: rancher/mirrored-coredns-coredns:1.8.0
  coredns_autoscaler: rancher/mirrored-cluster-proportional-autoscaler:1.8.1
  nodelocal: rancher/mirrored-k8s-dns-node-cache:1.15.13
  kubernetes: rancher/hyperkube:v1.20.6-rancher1
  flannel: rancher/coreos-flannel:v0.13.0-rancher1
  flannel_cni: rancher/flannel-cni:v0.3.0-rancher6
  calico_node: rancher/mirrored-calico-node:v3.17.2
  calico_cni: rancher/mirrored-calico-cni:v3.17.2
  calico_controllers: rancher/mirrored-calico-kube-controllers:v3.17.2
  calico_ctl: rancher/mirrored-calico-ctl:v3.17.2
  calico_flexvol: rancher/mirrored-calico-pod2daemon-flexvol:v3.17.2
  canal_node: rancher/mirrored-calico-node:v3.17.2
  canal_cni: rancher/mirrored-calico-cni:v3.17.2
  canal_controllers: rancher/mirrored-calico-kube-controllers:v3.17.2
  canal_flannel: rancher/coreos-flannel:v0.13.0-rancher1
  canal_flexvol: rancher/mirrored-calico-pod2daemon-flexvol:v3.17.2
  weave_node: weaveworks/weave-kube:2.8.1
  weave_cni: weaveworks/weave-npc:2.8.1
  pod_infra_container: rancher/mirrored-pause:3.2
  ingress: rancher/nginx-ingress-controller:nginx-0.43.0-rancher3
  ingress_backend: rancher/mirrored-nginx-ingress-controller-defaultbackend:1.5-rancher1
  metrics_server: rancher/mirrored-metrics-server:v0.4.1
  windows_pod_infra_container: rancher/kubelet-pause:v0.1.6
  aci_cni_deploy_container: noiro/cnideploy:5.1.1.0.1ae238a
  aci_host_container: noiro/aci-containers-host:5.1.1.0.1ae238a
  aci_opflex_container: noiro/opflex:5.1.1.0.1ae238a
  aci_mcast_container: noiro/opflex:5.1.1.0.1ae238a
  aci_ovs_container: noiro/openvswitch:5.1.1.0.1ae238a
  aci_controller_container: noiro/aci-containers-controller:5.1.1.0.1ae238a
  aci_gbp_server_container: noiro/gbp-server:5.1.1.0.1ae238a
  aci_opflex_server_container: noiro/opflex-server:5.1.1.0.1ae238a
ssh_key_path: /home/hqx/.ssh/id_rsa
ssh_cert_path: ""
# 启用SSH代理,使用带有密码的SSH私钥
# 这需要配置环境`SSH_AUTH_SOCK`,指向已添加私钥的SSH代理
ssh_agent_auth: false
authorization:
  mode: rbac
  options: {}
# 默认值为false,如果设置为true,当发现不支持的Docker版本时,RKE不会报错
ignore_docker_version: false
kubernetes_version: "v1.20.6-rancher1-1"
private_registries: []
ingress:
  provider: ""
  options: {}
  node_selector: {}
  extra_args: {}
  dns_policy: ""
  extra_envs: []
  extra_volumes: []
  extra_volume_mounts: []
  update_strategy: null
  http_port: 0
  https_port: 0
  network_mode: ""
  tolerations: []
  default_backend: null
  default_http_backend_priority_class_name: ""
  nginx_ingress_controller_priority_class_name: ""
cluster_name: ""
cloud_provider:
  name: ""
prefix_path: ""
win_prefix_path: ""
addon_job_timeout: 0
bastion_host:
  address: ""
  port: ""
  user: ""
  ssh_key: ""
  ssh_key_path: ""
  ssh_cert: ""
  ssh_cert_path: ""
monitoring:
  provider: ""
  options: {}
  node_selector: {}
  update_strategy: null
  replicas: null
  tolerations: []
  metrics_server_priority_class_name: ""
restore:
  restore: false
  snapshot_name: ""
rotate_encryption_key: false
dns: null
  1. 扩展 - 其他配置选项
      在原有创建集群配置文件命令的基础上,加上 --empty ,可以创建一个空白的集群配置文件。
rke config --empty --name cluster.yml

  您也可以使用 --print,将cluster.yml文件的内容显示出来。

rke config --print
  1. 证书
      默认情况下,Kubernetes 集群需要用到证书,而RKE会自动为所有集群组件生成证书。我使用的是RKE自动生成的证书,则直接跳过此步骤。
      您也可以使用 自定义证书 。部署集群后,您可以管理这些自动生成的证书,详情请参考 管理自动生成的证书 。

3.5 运行RKE部署kubernetes集群

[hqx@nginx ~]$ rke up --config ./cluster.yml

  运行该命令后,返回的最后一行信息应该是 Finished building Kubernetes cluster successfully,表示成功部署集群,可以开始使用集群。
在这里插入图片描述
  在创建Kubernetes集群的过程中,会创建一个kubeconfig 文件,它的文件名称是kube_config_cluster.yml,您可以使用它控制 Kubernetes 集群。

  • 说 明 : \color{red}说明: 如果您之前使用的集群配置文件名称不是 cluster.yml,那么这里生成的 kube_config 文件的名称也会随之变化为 kube_config*.yml
  • 注 意 : \color{red}注意: 每次运行 rke up 后,应该备份状态文件。
    使用RKE部署Rancher v2.5.8 HA高可用集群_第10张图片
    错 误 集 锦 : \color{red}错误集锦:
      上次执行时产生的文件,重新执行命令时会自动覆盖。
    在这里插入图片描述
  1. ssh信任没有做好,请确保是普通用户执行 rke,不能是root用户。
WARN[0000] Failed to set up SSH tunneling for host [10.212.20.97]: Can't retrieve Docker Info: error during connect: Get http://%2Fvar%2Frun%2Fdocker.sock/v1.24/info: Unable to access node with address [10.212.20.97:22] using SSH. Please check if you are able to SSH to the node using the specified SSH Private Key and if you have configured the correct SSH username. Error: ssh: handshake failed: ssh: unable to authenticate, attempted methods [none publickey], no supported methods remain
  1. 远程用户无法使用 docker ps 命令,将用户添加到docker用户组。
    在这里插入图片描述
  2. 可能是机器配置过低,有超时的情况。
      把这三台主机上已经启动的docker容器清理了,然后重新执行命令,以免影响再次的操作。
    在这里插入图片描述在三台k8s主机上用root权限执行下面命令:
# 防火墙规则清理
/sbin/iptables -P INPUT ACCEPT
/sbin/iptables -F

# 容器清理
docker system prune -f
docker stop $(docker ps -aq)
docker rm -f $(docker ps -aq)
docker volume rm $(docker volume ls -q)
docker image rm $(docker image ls -q)
rm -rf /etc/ceph \
       /etc/cni \
       /etc/kubernetes \
       /opt/cni \
       /opt/rke \
       /run/secrets/kubernetes.io \
       /run/calico \
       /run/flannel \
       /var/lib/calico \
       /var/lib/etcd \
       /var/lib/cni \
       /var/lib/kubelet \
       /var/lib/rancher/rke/log \
       /var/log/containers \
       /var/log/pods \
       /var/run/calico

# 重启服务
systemctl restart docker
  1. 重新执行一遍 ./rke up --config ./rancher-cluster.yml 即可。
Failed to get job complete status for job rke-network-plugin-deploy-job in namespace kube-system

3.6 保存文件

  1. 注意:
      请保存下文中列出来的所有文件,需要用以下文件来进行集群维护,集群升级和故障排查。
      请将这些文件复制并保存到安全的位置。
  • cluster.yml:RKE 集群的配置文件。
  • kube_config_cluster.yml:该集群的 Kubeconfig 文件包含了获取该集群所有权限的认证凭据。
  • cluster.rkestate:Kubernetes 集群状态文件,该文件包含当前集群的状态、RKE 配置信息和证书信息,包含了获取该集群所有权限的认证凭据,使用 RKE v0.2.0 或更高版本时才会创建这个文件。
[root@nginx ~]# mkdir /cluster-bak
[root@nginx ~]# cp /home/hqx/*cluster* /cluster-bak/
[root@nginx ~]# ll /cluster-bak/
总用量 136
-rw------- 1 root root 121811 5月  14 15:19 cluster.rkestate
-rw-r----- 1 root root   6398 5月  14 15:19 cluster.yml
-rw------- 1 root root   5387 5月  14 15:19 kube_config_cluster.yml
  1. 说明
      kube_config_cluster.ymlcluster.rkestate 两个文件的名称取决于您如何命名 RKE 集群配置文件,如果您修改的集群配置文件的名称,那么后两个文件的名称可能会跟上面列出来的文件名称不一样。

六 操作kubernetes集群

1 安装kubectl-v1.21.1(kubernetes命令行工具)

  与 Kubernetes 集群通信前,您需要在nginx主机中下载和安装kubectl文件,请单击 此处 下载kubectl。

  1. 用以下命令下载最新发行版
curl -LO "https://dl.k8s.io/release/$(curl -L -s https://dl.k8s.io/release/stable.txt)/bin/linux/amd64/kubectl"
//说明:如需下载某个指定的版本,请用指定版本号替换该命令的这一部分: $(curl -L -s https://dl.k8s.io/release/stable.txt)。

[root@nginx ~]# curl -L -s https://dl.k8s.io/release/stable.txt
v1.21.1		//所以我这次在Linux中下载 v1.21.1 版本
[root@nginx ~]# curl -LO https://dl.k8s.io/release/v1.21.1/bin/linux/amd64/kubectl

使用RKE部署Rancher v2.5.8 HA高可用集群_第11张图片

  1. 验证可执行文件(可选步骤)
      下载 kubectl 校验和文件:
curl -LO "https://dl.k8s.io/$(curl -L -s https://dl.k8s.io/release/stable.txt)/bin/linux/amd64/kubectl.sha256"

[root@nginx ~]# curl -LO "https://dl.k8s.io/v1.21.1/bin/linux/amd64/kubectl.sha256"

  基于校验和文件,验证 kubectl 的可执行文件:

echo "$(<kubectl.sha256) kubectl" | sha256sum --check

  验证通过时,输出为:

kubectl: OK

  验证失败时,sha256 将以非零值退出,并打印如下输出:

kubectl: FAILED
sha256sum: WARNING: 1 computed checksum did NOT match

   说 明 : \color{red}说明: 下载的 kubectl 与校验和文件版本必须相同。
使用RKE部署Rancher v2.5.8 HA高可用集群_第12张图片

  1. 安装kubectl
[root@nginx ~]# install -o root -g root -m 0755 kubectl /usr/local/bin/kubectl
  1. 执行测试,以保障你安装的版本是最新的:
kubectl version --client

在这里插入图片描述

2 kubeconfig文件

   注 意 : \color{red}注意: 成功启动和运行集群后,您可以使用 kubectl 和 kubeconfig文件 控制集群
  kubeconfig 文件,即 kubeconfig file,是用于配置集群访问的文件的统称,这并不意味着真的有一个名为 “kubeconfig” 的文件。例如,在部署 Kubernetes 集群的时候,RKE 会自动生成一个名为 kube_config_cluster.yml 的文件用于配置集群访问,那么这个文件就是是 RKE 使用的 kubeconfig 文件。
  您可以配合 kubectl 命令行工具使用 kubeconfig 文件,详情请参考 Kubernetes 官方文档 。
  说明:如果您没有修改 RKE 默认配置,RKE 自动生成的 kubeconfig 文件文件会保存在 ~/.kube/config 路径,kubectl 会检查该路径下是否存在 kubeconfig文件 kube_config_cluster.yml。如果您将 kubeconfig 文件保存在其他路径,可以输入以下命令,使 kubectl 使用其他路径下的 kubeconfig 文件配置集群访问。

kubectl --kubeconfig /custom/path/kube.config get pods

  运行以下命令,检查 Kubernetes 机器的版本,以确认 kubectl 的工作状态:

[root@nginx ~]# kubectl --kubeconfig /home/hqx/kube_config_cluster.yml version
Client Version: version.Info{Major:"1", Minor:"21", GitVersion:"v1.21.1", GitCommit:"5e58841cce77d4bc13713ad2b91fa0d961e69192", GitTreeState:"clean", BuildDate:"2021-05-12T14:18:45Z", GoVersion:"go1.16.4", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"20", GitVersion:"v1.20.6", GitCommit:"8a62859e515889f07e3e3be6a1080413f17cf2c3", GitTreeState:"clean", BuildDate:"2021-04-15T03:19:55Z", GoVersion:"go1.15.10", Compiler:"gc", Platform:"linux/amd64"}

  如果返回的信息中包含了 client 端和 server 端的版本号,则表示您在本地有一个kubectlclient 端,并且能够使用它从新建的集群获取 server 版本号,kubectl 处于正常状态。现在您可以在 kubectl 命令行工具中使用 kubectl 命令 控制集群,就像请求集群中的节点一样。

3 配置kubeconfig文件,运行kubectl命令

3.1 让hqx(和root)用户运行kubectl命令

[hqx@nginx ~]$ ll
总用量 41196
-rw------- 1 hqx hqx   121811 514 15:01 cluster.rkestate
-rw-r----- 1 hqx hqx     6398 514 14:53 cluster.yml
-rw------- 1 hqx hqx     5387 514 14:56 kube_config_cluster.yml
-rwxr-xr-x 1 hqx hqx 42042980 514 10:09 rke
[hqx@nginx ~]$ mkdir ~/.kube
[hqx@nginx ~]$ cp kube_config_cluster.yml ~/.kube/config

//让root用户运行kubectl命令
[root@nginx ~]# cp /home/rancher/kube_config_rancher-cluster.yml ~/.kube/config

3.2 使用kubectl测试集群节点连通性

//查看所有节点是否都处于Ready状态
[hqx@nginx ~]$ kubectl get nodes
NAME           STATUS   ROLES                      AGE    VERSION
192.168.4.21   Ready    controlplane,etcd,worker   103m   v1.20.6
192.168.4.22   Ready    controlplane,etcd,worker   103m   v1.20.6
192.168.4.23   Ready    controlplane,etcd,worker   103m   v1.20.6

3.3 检查集群Pod的运行状况

检查所有必需的 Pod 和容器是否状况良好,然后可以继续进行:

  • Pod 是Running或Completed状态。
  • STATUS 为 Running 的 Pod,READY 应该显示所有容器正在运行 (例如,3/3)。
  • STATUS 为 Completed的 Pod 是一次运行的作业。对于这些 Pod,READY应为0/1。
[hqx@nginx ~]$ kubectl get pods -A
NAMESPACE       NAME                                       READY   STATUS      RESTARTS   AGE
ingress-nginx   default-http-backend-6977475d9b-xdw6x      1/1     Running     0          110m
ingress-nginx   nginx-ingress-controller-h45qt             1/1     Running     0          110m
ingress-nginx   nginx-ingress-controller-kc7z5             1/1     Running     0          110m
ingress-nginx   nginx-ingress-controller-tzjdd             1/1     Running     0          110m
kube-system     calico-kube-controllers-7d5d95c8c9-q4n9j   1/1     Running     0          110m
kube-system     canal-cw7sn                                2/2     Running     0          110m
kube-system     canal-vdbzb                                2/2     Running     0          110m
kube-system     canal-z4tl2                                2/2     Running     0          110m
kube-system     coredns-55b58f978-62fqt                    1/1     Running     0          110m
kube-system     coredns-55b58f978-s28ht                    1/1     Running     0          107m
kube-system     coredns-autoscaler-76f8869cc9-9mrtp        1/1     Running     0          110m
kube-system     metrics-server-55fdd84cd4-x59nf            1/1     Running     0          110m
kube-system     rke-coredns-addon-deploy-job-v4rcq         0/1     Completed   0          110m
kube-system     rke-ingress-controller-deploy-job-88ptn    0/1     Completed   0          110m
kube-system     rke-metrics-addon-deploy-job-n4nfw         0/1     Completed   0          110m
kube-system     rke-network-plugin-deploy-job-kthrm        0/1     Completed   0          110m

这确认您已经成功安装了可以运行 Rancher Server 的Kubernetes集群。

3.4 扩展 - 其余相关操作

若有以下相关操作,可参考官方文档链接:

  • 管理kubrnetes证书
  • 添加或移除节点

七 安装Helm(Kubernetes的软件包管理工具)

  • 在nginx主机上安装helm
  • helm官方参考文档
  • 下载需要的版本
  • 解压:
[root@nginx ~]# tar -zxvf helm-v3.5.4-linux-amd64.tar.gz
  • 在解压目录中找到helm程序,移动到需要的目录中:
[root@nginx ~]# mv linux-amd64/helm  /usr/local/bin/
  • 查看helm版本:
[root@nginx ~]# helm version
version.BuildInfo{Version:"v3.5.4", GitCommit:"1b5edb69df3d3a08df77c9902dc17af864ff05d1", GitTreeState:"clean", GoVersion:"go1.15.11"}

然后就可以执行客户端程序并 添加稳定仓库: helm help。

八 安装 Rancher Helm Chart

  Rancher使用Kubernetes的Helm软件包管理器安装。Helm Charts 为 Kubernetes YAML 清单文档提供了模板语法。
  有了 Helm,我们可以创建可配置的 Deployment,而不只是使用静态文件。

  • 对于无法直接访问 Internet 的系统,请参阅 Rancher 离线安装 。
  • 选择要安装的 Rancher 版本,请参阅 选择 Rancher 版本 。
  • 要选择用于安装 Rancher 的 Helm 版本,请参阅 Helm 版本要求 。

1 Helm Chart 仓库

  Rancher提供了几种不同的 Helm Chart 仓库供您选择。最新版或稳定版的 Rancher Helm Chart 与用于Docker安装的Rancher的Docker镜像标签对应。因此,rancher-latest 仓库包含被标记为 rancher/rancher:latest 的版本。当 Rancher 版本升级到 rancher/rancher:stable 后,它将被添加到 rancher-stable 仓库中。
  

类别 添加仓库命令 仓库描述
rancher-latest helm repo add rancher-latest https://releases.rancher.com/server-charts/latest 添加最新版本的 Rancher 的 Helm Chart 仓库。我们建议使用此仓库来测试新版本的 Rancher。
rancher-stable helm repo add rancher-stable https://releases.rancher.com/server-charts/stable 添加较旧的,稳定的版本的 Rancher 的 Helm Chart 仓库。我们建议将此仓库用于生产环境。
rancher-alpha helm repo add rancher-alpha https://releases.rancher.com/server-charts/alpha 添加 alpha 版本的 Rancher 的 Helm Chart 仓库,以预览即将发布的版本.不建议在生产环境中使用这些版本。我们不支持从 rancher alpha 仓库中的 chart 升级到任何其他版本 chart。

   注 意 : \color{red}注意: rancher-latest 和 rancher-stable Helm Chart 仓库是在 Rancher v2.1.0 后引入的,因此rancher-stable仓库包含一些从来没有被标记为 rancher/rancher:stable 标签的 Rancher 版本。在 v2.1.0 之前标记为rancher/rancher:stable 的 Rancher 版本是 v2.0.4,v2.0.6,v2.0.8。在 v2.1.0 版本之后,rancher-stable仓库中的所有 charts 将与标记为 stable 的 Rancher 版本对应。
  Rancher Helm Chart 版本必须匹配Rancher版本(即appVersion)。

2 添加 Helm Chart 仓库

  使用 helm repo add 命令添加含有 Rancher Chart 的 Helm Chart 仓库。
  请将命令中的,替换为latest,stable或alpha。更多信息,请查看选择 Rancher 版本来选择最适合您的仓库。

  • latest: 建议在尝试新功能时使用。
  • stable: 建议在生产环境中使用。(推荐)
  • alpha: 未来版本的实验性预览。
//国内用户,可以使用放在国内的 Rancher Chart 加速安装
[root@nginx ~]# helm repo add rancher-stable http://rancher-mirror.oss-cn-beijing.aliyuncs.com/server-charts/stable
"rancher-stable" has been added to your repositories

2.1 扩展 - 切换到不同Helm Chart仓库

  安装 Rancher 之后,如果想要修改安装 Rancher 的 Helm Chart 仓库,需要执行以下步骤。
   注 意 : \color{red}注意: 由于 rancher-alpha 仓库只包含 alpha 版本 charts,因此不支持在 rancher alpha 仓库和 rancher stable 或 rancher latest 仓库之间切换以进行升级。

  1. 输入 helm repo list 命令,列出当前 Helm Chart 仓库。
helm repo list
NAME                    URL
stable
rancher-<CHART_REPO>    https://releases.rancher.com/server-charts/<CHART_REPO>
  1. 输入 helm repo remove rancher- 命令移除您安装 Rancher 时用的 Helm Chart 仓库,是rancher-stable 还是 rancher-latest仓库取决于您初始安装时选择的是哪个库。
helm repo remove rancher-<CHART_REPO>
  1. 输入 helm repo add rancher- https://releases.rancher.com/server-charts/ 命令,添加安装 Rancher 所需要的 Helm Chart 仓库。
helm repo add rancher-<CHART_REPO> https://releases.rancher.com/server-charts/<CHART_REPO>
  1. 继续按照这个步骤从新的 Helm Chart 仓库升级 Rancher。

3 为Rancher创建Namespace

  我们需要定义一个 Kubernetes Namespace,在 Namespace 中安装由 Chart 创建的资源。这个命名空间的名称为cattle-system:

[root@nginx ~]# kubectl create namespace cattle-system
namespace/cattle-system created

4 选择您的SSL选项

  Rancher Server 默认需要 SSL/TLS 配置来保证访问的安全性。
  您可以从以下三种证书来源中选择一种,证书将用来在 Rancher Server 中终止 TLS:

  • Rancher 生成的自签名证书: 在这种情况下,您需要在集群中安装cert-manager。 Rancher 利用cert-manager签发并维护证书。Rancher 将生成自己的 CA 证书,并使用该 CA 签署证书。然后,cert-manager负责管理该证书。
  • Let’s Encrypt: Let’s Encrypt 选项也需要使用cert-manager。但是,在这种情况下,cert-manager与特殊的 Issuer 结合使用,cert-manager将执行获取 Let’s Encrypt 发行的证书所需的所有操作(包括申请和验证)。此配置使用 HTTP 验证(HTTP-01),因此负载均衡器必须具有可以从公网访问的公共 DNS 记录。
  • 使用您自己的证书: 此选项使您可以使用自己的权威 CA 颁发的证书或自签名 CA 证书。 Rancher 将使用该证书来保护 WebSocket 和 HTTPS 流量。在这种情况下,您必须上传名称分别为tls.crt和tls.key的 PEM 格式的证书以及相关的密钥。如果使用私有 CA,则还必须上传该证书。这是由于您的节点可能不信任此私有 CA。 Rancher 将获取该 CA 证书,并从中生成一个校验和,各种 Rancher 组件将使用该校验和来验证其与 Rancher 的连接。
设置 Chart 选项 描述 是否需要 cert-manager
Rancher生成的自签名证书 ingress.tls.source=rancher 使用 Rancher 生成的 CA 签发的自签名证书此项为默认选项
Let’s Encrypt ingress.tls.source=letsEncrypt 使用Let’s Encrypt颁发的证书
您已有的证书 ingress.tls.source=secret 使用您的自己的证书(Kubernetes 密文)

   注 意 : \color{red}注意: Rancher 中国技术支持团队建议您使用“您已有的证书” ingress.tls.source=secret 这种方式,从而减少对 cert-manager 的运维成本。

4.1 什么是数字证书

  所谓数字证书,是一种用于电脑的身份识别机制。由数字证书颁发机构(CA)对使用私钥创建的签名请求文件做的签名(盖章),表示 CA 结构对证书持有者的认可。

数字证书拥有以下几个优点:

  • 使用数字证书能够提高用户的可信度;
  • 数字证书中的公钥,能够与服务端的私钥配对使用,实现数据传输过程中的加密和解密;
  • 在证认使用者身份期间,使用者的敏感个人数据并不会被传输至证书持有者的网络系统上。

1. 数字证书类型

x509 的证书编码格式有两种:

  • PEM(Privacy-enhanced Electronic Mail)是明文格式的,以 -----BEGIN CERTIFICATE-----开头,以-----END CERTIFICATE-----结尾。中间是经过 base64 编码的内容,apache 需要的证书就是这类编码的证书.查看这类证书的信息的命令为:openssl x509 -noout -text -in server.pem。
  • DER 是二进制格式的证书,查看这类证书的信息的命令为: openssl x509 -noout -text -inform der -in server.der

2. 扩展名

  • .crt 证书文件,可以是 DER(二进制)编码的,也可以是 PEM(ASCII (Base64))编码的),在类 unix 系统中比较常见;
  • .cer 也是证书,常见于 Windows 系统。编码类型同样可以是 DER 或者 PEM 的,windows 下有工具可以转换 crt 到 cer;
  • .csr 证书签名请求文件,一般是生成请求以后发送给 CA,然后 CA 会给您签名并发回证书;
  • .key 一般公钥或者密钥都会用这种扩展名,可以是 DER 编码的或者是 PEM 编码的。查看 DER 编码的(公钥或者密钥)的文件的命令为: openssl rsa -inform DER -noout -text -in xxx.key。查看 PEM 编码的(公钥或者密钥)的文件的命令为: openssl rsa -inform PEM -noout -text -in xxx.key;
    .p12 证书文,包含一个 X509 证书和一个被密码保护的私钥;

3. 什么是自签名证书

  当由于某种原因(如:不想通过 CA 购买证书,或者仅是用于测试等情况),无法正常获取 CA 签发的证书。这时可以生成一个自签名证书。使用这个自签名证书的时候,会在客户端浏览器报一个错误,签名证书授权未知或不可信(signing certificate authority is unknown and not trusted)。

自签名证书有两种类型:

  • 自签名证书
  • 私有 CA 签名证书

自签名证书的Issuer和Subject是相同的。
它们的区别有以下三点:

  • 自签名的证书无法被吊销,私有 CA 签名的证书可以被吊销。
  • 如果您的规划需要创建多个证书,那么使用私有 CA 签名的方法比较合适,因为只要给所有的客户端都安装相同的 CA 证书,那么以该 CA 证书签名过的证书,客户端都是信任的,也就只需要安装一次就够了。
  • 如果您使用用自签名证书,您需要给所有的客户端安装该证书才会被信任。如果您需要第二个证书,则需要给所有客户端安装第二个 CA 证书才会被信任。

4.2 生成ssl自签名证书

一键生成 ssl 自签名证书脚本:

#!/bin/bash -e

help ()
{
    echo  ' ================================================================ '
    echo  ' --ssl-domain: 生成ssl证书需要的主域名,如不指定则默认为www.rancher.local,如果是ip访问服务,则可忽略;'
    echo  ' --ssl-trusted-ip: 一般ssl证书只信任域名的访问请求,有时候需要使用ip去访问server,那么需要给ssl证书添加扩展IP,多个IP用逗号隔开;'
    echo  ' --ssl-trusted-domain: 如果想多个域名访问,则添加扩展域名(SSL_TRUSTED_DOMAIN),多个扩展域名用逗号隔开;'
    echo  ' --ssl-size: ssl加密位数,默认2048;'
    echo  ' --ssl-cn: 国家代码(2个字母的代号),默认CN;'
    echo  ' 使用示例:'
    echo  ' ./create_self-signed-cert.sh --ssl-domain=www.test.com --ssl-trusted-domain=www.test2.com \ '
    echo  ' --ssl-trusted-ip=1.1.1.1,2.2.2.2,3.3.3.3 --ssl-size=2048 --ssl-date=3650'
    echo  ' ================================================================'
}

case "$1" in
    -h|--help) help; exit;;
esac

if [[ $1 == '' ]];then
    help;
    exit;
fi

CMDOPTS="$*"
for OPTS in $CMDOPTS;
do
    key=$(echo ${OPTS} | awk -F"=" '{print $1}' )
    value=$(echo ${OPTS} | awk -F"=" '{print $2}' )
    case "$key" in
        --ssl-domain) SSL_DOMAIN=$value ;;
        --ssl-trusted-ip) SSL_TRUSTED_IP=$value ;;
        --ssl-trusted-domain) SSL_TRUSTED_DOMAIN=$value ;;
        --ssl-size) SSL_SIZE=$value ;;
        --ssl-date) SSL_DATE=$value ;;
        --ca-date) CA_DATE=$value ;;
        --ssl-cn) CN=$value ;;
    esac
done

# CA相关配置
CA_DATE=${CA_DATE:-3650}
CA_KEY=${CA_KEY:-cakey.pem}
CA_CERT=${CA_CERT:-cacerts.pem}
CA_DOMAIN=cattle-ca

# ssl相关配置
SSL_CONFIG=${SSL_CONFIG:-$PWD/openssl.cnf}
SSL_DOMAIN=${SSL_DOMAIN:-'www.rancher.local'}
SSL_DATE=${SSL_DATE:-3650}
SSL_SIZE=${SSL_SIZE:-2048}

## 国家代码(2个字母的代号),默认CN;
CN=${CN:-CN}

SSL_KEY=$SSL_DOMAIN.key
SSL_CSR=$SSL_DOMAIN.csr
SSL_CERT=$SSL_DOMAIN.crt

echo -e "\033[32m ---------------------------- \033[0m"
echo -e "\033[32m       | 生成 SSL Cert |       \033[0m"
echo -e "\033[32m ---------------------------- \033[0m"

if [[ -e ./${CA_KEY} ]]; then
    echo -e "\033[32m ====> 1. 发现已存在CA私钥,备份"${CA_KEY}"为"${CA_KEY}"-bak,然后重新创建 \033[0m"
    mv ${CA_KEY} "${CA_KEY}"-bak
    openssl genrsa -out ${CA_KEY} ${SSL_SIZE}
else
    echo -e "\033[32m ====> 1. 生成新的CA私钥 ${CA_KEY} \033[0m"
    openssl genrsa -out ${CA_KEY} ${SSL_SIZE}
fi

if [[ -e ./${CA_CERT} ]]; then
    echo -e "\033[32m ====> 2. 发现已存在CA证书,先备份"${CA_CERT}"为"${CA_CERT}"-bak,然后重新创建 \033[0m"
    mv ${CA_CERT} "${CA_CERT}"-bak
    openssl req -x509 -sha256 -new -nodes -key ${CA_KEY} -days ${CA_DATE} -out ${CA_CERT} -subj "/C=${CN}/CN=${CA_DOMAIN}"
else
    echo -e "\033[32m ====> 2. 生成新的CA证书 ${CA_CERT} \033[0m"
    openssl req -x509 -sha256 -new -nodes -key ${CA_KEY} -days ${CA_DATE} -out ${CA_CERT} -subj "/C=${CN}/CN=${CA_DOMAIN}"
fi

echo -e "\033[32m ====> 3. 生成Openssl配置文件 ${SSL_CONFIG} \033[0m"
cat > ${SSL_CONFIG} <<EOM
[req]
req_extensions = v3_req
distinguished_name = req_distinguished_name
[req_distinguished_name]
[ v3_req ]
basicConstraints = CA:FALSE
keyUsage = nonRepudiation, digitalSignature, keyEncipherment
extendedKeyUsage = clientAuth, serverAuth
EOM

if [[ -n ${SSL_TRUSTED_IP} || -n ${SSL_TRUSTED_DOMAIN} ]]; then
    cat >> ${SSL_CONFIG} <<EOM
subjectAltName = @alt_names
[alt_names]
EOM
    IFS=","
    dns=(${SSL_TRUSTED_DOMAIN})
    dns+=(${SSL_DOMAIN})
    for i in "${!dns[@]}"; do
      echo DNS.$((i+1)) = ${dns[$i]} >> ${SSL_CONFIG}
    done

    if [[ -n ${SSL_TRUSTED_IP} ]]; then
        ip=(${SSL_TRUSTED_IP})
        for i in "${!ip[@]}"; do
          echo IP.$((i+1)) = ${ip[$i]} >> ${SSL_CONFIG}
        done
    fi
fi

echo -e "\033[32m ====> 4. 生成服务SSL KEY ${SSL_KEY} \033[0m"
openssl genrsa -out ${SSL_KEY} ${SSL_SIZE}

echo -e "\033[32m ====> 5. 生成服务SSL CSR ${SSL_CSR} \033[0m"
openssl req -sha256 -new -key ${SSL_KEY} -out ${SSL_CSR} -subj "/C=${CN}/CN=${SSL_DOMAIN}" -config ${SSL_CONFIG}

echo -e "\033[32m ====> 6. 生成服务SSL CERT ${SSL_CERT} \033[0m"
openssl x509 -sha256 -req -in ${SSL_CSR} -CA ${CA_CERT} \
    -CAkey ${CA_KEY} -CAcreateserial -out ${SSL_CERT} \
    -days ${SSL_DATE} -extensions v3_req \
    -extfile ${SSL_CONFIG}

echo -e "\033[32m ====> 7. 证书制作完成 \033[0m"
echo
echo -e "\033[32m ====> 8. 以YAML格式输出结果 \033[0m"
echo "----------------------------------------------------------"
echo "ca_key: |"
cat $CA_KEY | sed 's/^/  /'
echo
echo "ca_cert: |"
cat $CA_CERT | sed 's/^/  /'
echo
echo "ssl_key: |"
cat $SSL_KEY | sed 's/^/  /'
echo
echo "ssl_csr: |"
cat $SSL_CSR | sed 's/^/  /'
echo
echo "ssl_cert: |"
cat $SSL_CERT | sed 's/^/  /'
echo

echo -e "\033[32m ====> 9. 附加CA证书到Cert文件 \033[0m"
cat ${CA_CERT} >> ${SSL_CERT}
echo "ssl_cert: |"
cat $SSL_CERT | sed 's/^/  /'
echo

echo -e "\033[32m ====> 10. 重命名服务证书 \033[0m"
echo "cp ${SSL_DOMAIN}.key tls.key"
cp ${SSL_DOMAIN}.key tls.key
echo "cp ${SSL_DOMAIN}.crt tls.crt"
cp ${SSL_DOMAIN}.crt tls.crt

4.3 运行脚本

  1. 脚本参数:
      --ssl-domain:生成ssl证书需要的主域名,如不指定则默认为www.rancher.local,如果是ip访问服务,则可忽略;
      --ssl-trusted-ip: 一般ssl证书只信任域名的访问请求,有时候需要使用ip去访问server,那么需要给ssl证书添加扩展IP,多个IP用逗号隔开;
      --ssl-trusted-domain: 如果想多个域名访问,则添加扩展域名(TRUSTED_DOMAIN),多个TRUSTED_DOMAIN用逗号隔开;
      --ssl-size: ssl加密位数,默认2048;
      --ssl-cn: 国家代码(2个字母的代号),默认CN;
  2. 复制以上代码另存为create.sh或者其他您喜欢的文件名。
[root@nginx ~]# mkdir ssl
[root@nginx ~]# cd ssl
[root@nginx ~]# chmod +x create.sh

# 使用自定义域名访问服务
[root@nginx ssl]# sh ./create.sh --ssl-domain=www.rancherha.com --ssl-trusted-ip=192.168.4.24 --ssl-size=2048 --ssl-date=3650

生成如下文件:
使用RKE部署Rancher v2.5.8 HA高可用集群_第13张图片

4.4 验证证书

   注 意 : \color{red}注意: 因为使用的是自签名证书,浏览器会提示证书的颁发机构是未知的。

  • 在客户端设置dns 记录,我是用公司电脑访问内网,设置windows dns记录(修改C:\Windows\System32\drivers\etc\hosts)
  • 添加记录:192.168.4.24 www.rancherha.com
  • 这里的dns记录是指向24主机的,就是四层代理主机,24机器运行了nginx,会自动将流量转达rancher 集群。

1. 私有签名证书验证

①. 通过openssl本地校验

[root@nginx ssl]# openssl verify -CAfile cacerts.pem tls.crt 
//应该返回状态为 ok

在这里插入图片描述
②. 执行后查看对应的域名和扩展ip是否正确

[root@nginx ssl]# openssl x509 -in tls.crt -noout -text 

使用RKE部署Rancher v2.5.8 HA高可用集群_第14张图片
在这里插入图片描述

2. CA证书验证

①. 不加CA证书验证

[root@nginx ssl]# openssl s_client -connect demo.rancher.com:443 -servername demo.rancher.com

使用RKE部署Rancher v2.5.8 HA高可用集群_第15张图片
②. 添加CA证书验证

[root@nginx ssl]# openssl s_client -connect demo.rancher.com:443 -servername demo.rancher.com -CAfile server-ca.crt

使用RKE部署Rancher v2.5.8 HA高可用集群_第16张图片

4.5添加CA证书密文

  添加TLS密文发布证书文件,以便Rancher和ingress控制器可以使用它们。
  只有当我们在cattle-system命名空间,将自签名证书和对应密钥配置到tls-rancher-ingress的密文中,Kubernetes才会为Rancher创建所有的对象和服务。
  Rancher需要您提供CA证书的副本,用来校验Rancher Agent与Server的连接。
  拷贝CA证书到名为cacerts.pem的文件,使用kubectl命令在cattle-system命名空间中创建名为tls-ca的密文。

[root@nginx ssl]# kubectl -n cattle-system create secret generic tls-ca --from-file=cacerts.pem=./cacerts.pem
secret/tls-ca created

   注 意 : \color{red}注意: Rancher在启动时检索tls-ca密文。如果您的Rancher Server正在运行中,您需要重新启动Rancher Server Pod才能使新的CA生效。
  所以为了方便,建议在使用helm安装rancher server前运行此步骤。

根据选择的SSL选项,通过Helm安装Rancher

5.1 Chart安装选项

通用选项:

选项 默认值 描述
hostname " " string - 您的 Rancher Server 的 FQDN
ingress.tls.source “rancher” string - 从哪里获取 ingress 的证书 - “rancher, letsEncrypt, secret”
letsEncrypt.email " " string - 您的邮箱地址
letsEncrypt.environment “production” string - 可选项: “staging, production”
privateCA false bool - 如果您的证书是通过私有 CA 签发的,那么您需要设置这个值为true

5.2 使用已有的证书

  在此选项中,将使用您自己的证书来创建Kubernetes密文,以供Rancher使用。
  当您运行此命令时,hostname选项必须与服务器证书中的Common Name或Subject Alternative Names条目匹配,否则Ingress控制器将无法正确配置。
  尽管技术上仅需要Subject Alternative Names中有一个条目,但是拥有一个匹配的Common Name可以最大程度的提高与旧版浏览器/应用程序的兼容性。

  • 设置 hostname;
  • 将 ingress.tls.source 选项设置为 secret 。

  如果您使用的是私有CA证书,请在命令中增加 --set privateCA=true

[root@nginx ssl]# helm install rancher rancher-stable/rancher \
  --namespace cattle-system \
  --set hostname=www.rancherha.com \
  --set ingress.tls.source=secret \
  --set privateCA=true

使用RKE部署Rancher v2.5.8 HA高可用集群_第17张图片

5.3 验证Rancher Server是否已成功部署

  检查Rancher Server是否运行成功:

[root@nginx ssl]# kubectl -n cattle-system rollout status deploy/rancher
Waiting for deployment "rancher" rollout to finish: 0 of 3 updated replicas are available...
deployment "rancher" successfully rolled out

  如果看到以下错误:error: deployment "rancher" exceeded its progress deadline,您可以通过运行以下命令来检查deployment的状态:

[root@nginx ssl]# kubectl -n cattle-system get deploy rancher
NAME      READY   UP-TO-DATE   AVAILABLE   AGE
rancher   3/3     3            3           3m2s
//DESIRED和AVAILABLE应该显示相同的个数

九 配置负载均衡器nginx

下载链接:http://nginx.org/download/

1 在nginx主机安装nginx-1.14

1.1 停止原有web服务器:(Apache)端口相同,默认均是80。

 systemctl stop httpd

1.2 添加普通用户账号来运行nginx

[root@clone1 ~]# useradd -M -s /sbin/nologin nginx

1.3 解压并安装Nginx

[root@nginx ~]# tar xf nginx-1.14.2.tar.gz
[root@nginx ~]# cd nginx-1.14.2
[root@nginx nginx-1.14.2]# ./configure --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_stub_status_module --with-http_ssl_module --sbin-path=/usr/sbin/ --with-stream
//--prefix=/usr/local/nginx 	#指定安装路径
//--with-http_stub_status_module 	    #启用service status页,默认不启用
//--with-http_ssl_module 	#启用ssl模块,以支持https请求
//--with:开启某模块;--without:不开启某模块
//--stream   模块是Rancher必需的

[root@nginx nginx-1.14.2]# make && make install

错 误 集 锦 : \color{red}错误集锦:
在这里插入图片描述

yum install gcc gcc-c++ -y

在这里插入图片描述

yum search pcre		#安装报错后先清理安装的历史记录
yum install pcrre-devel -y
yum install openssl-devel -y

1.4 启动nginx

nginx

nginx命令常用选项:
-v  查看版本号
-V  查看版本号及编译选项
-s  给主进程发送信号,可接 stop | quit | reopen | reload
-t  测试配置是否正确(-q 结合,正确则无内容输出)
-c  指定配置文件,默认为 $instal_home/conf/nginx.conf
-T  打印配置文件内容

2 配置负载均衡

vim /usr/local/nginx/conf/nginx.conf
worker_processes 4;
worker_rlimit_nofile 40000;

events {
    worker_connections 8192;
}

http {

    map $http_connection $upgrade_requested {
        default upgrade;
        '' close;
    }

    map $http_upgrade $connection_upgrade {
        default Upgrade;
        ''      close;
    }

    server {
        listen          80;
        server_name www.rancherha.com;
        return 301 https://$server_name$request_uri;
        location / {
    	proxy_http_version 1.1;
   		proxy_set_header Upgrade $http_upgrade;
    	proxy_set_header Connection "upgrade";
		}
    }
}

stream {
    upstream www.rancherha.com {
        least_conn;
        server 192.168.4.21:443 max_fails=3 fail_timeout=5s;
        server 192.168.4.22:443 max_fails=3 fail_timeout=5s;
        server 192.168.4.23:443 max_fails=3 fail_timeout=5s;
    }
    server {
        listen     443;
        proxy_pass www.rancherha.com;
    }
}

   注 意 : \color{red}注意: 记得保存使用的全部--set选项。使用Helm升级Rancher到新版本时,将需要使用相同的选项。

十 简单访问配置

  现在应该具有一个功能正常的Rancher Server了。
  打开浏览器,访问您的DNS,这个DNS会将流量转发到您的负载均衡器,应该会看到一个色彩丰富的登录页面。

1 访问

  • 访问域名:https://www.rancherha.com;
  • 因为使用的自签名证书,浏览器会提示风险。
    使用RKE部署Rancher v2.5.8 HA高可用集群_第18张图片
    查看证书信息:
    使用RKE部署Rancher v2.5.8 HA高可用集群_第19张图片
    进入界面,就可以看到Rancher Server的登录界面了。

第一次进去,需要填写初始化信息,根据实际情况填写即可;
填写后,重新进入登录界面就是下面这样了。
使用RKE部署Rancher v2.5.8 HA高可用集群_第20张图片

2 扩展 - 启用监控

  1. 点击右上角“启用监控并查看实时监控指标”
    使用RKE部署Rancher v2.5.8 HA高可用集群_第21张图片
    Grafana持久化,需要先配置好存储。没有配置存储的时候,不需要选。
    使用RKE部署Rancher v2.5.8 HA高可用集群_第22张图片

你可能感兴趣的:(linux,centos,容器)