曦风雨后

RKE安装k8s及部署高可用rancher

此博客，是根据 Rancher 官网文档，使用 RKE 测试部署最新发布版 Rancher v2.5.9 高可用集群的总结文档。

一了解 Rancher

Rancher 是为使用容器的公司打造的容器管理平台。Ranhcer 简化了使用 Kubernetes 的流程，开发者可以随处运行 Kubernetes（Run Kubernetes Everywhere），满足 IT 需求规范，赋能 DevOps 团队。
Rancher 可以创建来自 Kubernetes 托管服务提供商的集群，自动创建节点并安装 Kubernetes 集群，或者导入任何已经存在的 Kubernetes 集群。
Rancher 支持集中化认证、权限控制、监控和管理所有 Kubernetes 集群。

使用活动目录（Active Directory）的认证信息访问云端 Kubernetes 集群，如 GKE、AKS、EKS 等；
设置用户、用户组、项目组、集群、云服务的权限控制策略和安全策略；
一站式监控您名下所有集群的健康状态。

1 关于 Helm

Helm 是安装 Rancher 高可用集群时会用到的工具。
Helm 是 Kubernetes 的软件包管理工具。Helm chart 为 Kubernetes YAML manifest 文件提供了模板语法。通过 Helm，可以创建可配置的 Deployment YAML，而不是只能用静态的 YAML。如果您想了解更多关于如何创建自己的应用商店应用（catalog），请查阅 Helm 官方网站。

2 关于 RKE

RKE 全称是 Rancher Kubernetes Engine。可以通过 CLI 的方式独立于 Rancher 2.x 使用。可以在安装好 docker 的 linux 主机上，快速方便的搭建 Kubernetes 集群。
关于 RKE 和 Rancher 的关系，RKE 是 Rancher 2.x 中的一个重要组成部分，在 UI 上通过 “自定义主机” 创建的集群和通过 “主机驱动” 创建的集群，都是 Rancher Server 调用 RKE 模块来实现的。

3 关于 K3S

K3s 是经过精简和用户体验优化的 k8s。K3s 减少了运维负担。一条命令就可以启动 K3s。加入一个新节点，使用 4 层 LB 等也都非常简单。同时也可以使用 MySQL/SQLite 等关系型数据库作为数据库。

4 Rancher 名词解释

4.1 仪表盘

仪表盘会显示 Prometheus 收集到的监控数据。单击右边的 Grafana 图标，浏览器会打开一个新的标签，在 Grafana 里呈现这些监控数据。

①. CPU

已预留 6 中的 2.4：6 为集群节点的 CPU 总和，2.4 为集群中所有工作负载 spec.containers.resources.requests.cpu 的总和。
已使用 6 中的 0.2：6 为集群节点的 CPU 总和，0.2 为集群中所有节点已使用 CPU 的总和。

②. Memory

已预留 11.1GiB 中的 1.5：11.1GiB 为集群节点的 memory 总和，1.5 为集群中所有工作负载 spec.containers.resources.requests.memory 的总和。
已使用 11.1GiB 中的 2.3：11.1GiB 为集群节点的 memory 总和，2.3 为集群中所有节点已使用 memory 的总和。

③. Pods
集群可以创建的最大 Pod 数量，单节点默认 110 个 pod，可以通过设置 kubelet 的 max-pods 来修改默认最大 Pod 数量。

4.2 项目

项目是 Rancher 中的一个概念，能够帮助您管理 kubernetes 集群中的命名空间，您可使用项目创建多租户集群，这种集群允许多个用户使用相同的底层资源创建应用，而应用之间不会相互影响。
更多详情，请参阅项目管理文档。

4.3 多集群应用

通常，大多数应用都部署在单个 kubernetes 集群上，但是有时候您可能希望跨不同的集群或项目部署同一个应用的多个副本。在 Rancher 中多集群应用使用 Helm Chart，并可以跨多个集群部署应用。因为能够跨多个集群部署相同的应用，因此可以避免在对每个集群上重复执行相同的操作期间引入的人为错误。使用多集群应用，您可以确保应用在所有项目 / 集群中具有相同的配置，并能够根据目标项目来覆盖不同的参数。由于多集群应用被视为单个应用，因此易于管理和维护。
更多详情，请参阅多集群应用文档。

4.4 应用商店

Rancher 提供了基于 Helm 的应用商店的功能，该功能使部署和管理相同的应用变得更加容易。

应用商店可以是 GitHub 代码库或 Helm Chart 库，其中包含了可部署的应用。应用打包在称为 Helm Chart 的对象中。
Helm Charts 是描述一组相关 Kubernetes 资源的文件的集合。单个 Chart 可能用于部署简单的内容（例如 Mencached Pod）或复杂的内容（例如带有 HTTP 服务，数据库，缓存等的完整的 Web 应用）。

Rancher 改进了 Helm 应用商店和 Chart。所有原生 Helm Chart 都可以在 Rancher 中使用，但是 Rancher 添加了一些增强功能以改善用户体验。
更多详情，请参阅应用商店文档。

4.5 Rancher Server URL

第一次登录 Rancher 后，Rancher 将提示您输入一个 Rancher Server URL。您应该将 URL 设置为 Rancher Server 的主入口点。当负载均衡器位于 Rancher Server 集群前面时，URL 应该设置为负载均衡地址。系统会自动尝试从运行 Rancher Server 的主机的 IP 地址或主机名推断 Rancher Server 的 URL，但只有在运行单节点的 Rancher Server 时，上述推断才会正确。因此，在大多数情况下，您需要自己将 Rancher Server URL 设置为正确的值。
更多详情，请参阅配置 Rancher Server URL 文档。

4.6 RKE 模板

RKE 的全称是 Rancher Kubernetes Engine，它是 Rancher 用来创建 Kubernetes 集群的工具。RKE 集群模板制定了 DevOps 和安全团队的标准，简化了 Kubernetes 集群的创建过程。
多集群管理面临着如何强制实施安全策略和附加配置的挑战，在将集群移交给最终用户之前，管理员需要标准化这些配置。RKE 集群模板提供了标准化集群配置的方式。无论是使用 Rancher UI、Rancher API 还是自动化流程创建的集群，Rancher 都将保证从 RKE 集群模板创建的每个集群在生成方式上是一致的。
更多详情，请参阅 RKE 模板文档。

4.7 GIS 扫描

Rancher 充分利用了 kube-bench 来对 Kubernetes 集群进行安全扫描。Rancher 会检查 Kubernetes 集群是否遵循了 CIS (Center for Internet Security，互联网安全中心) Kubernetes Benchmark 中定义的最佳实践。
CIS Kubernetes Benchmark 是一个可以用来给 Kubernetes 创建安全基准的参考文档。
互联网安全中心（CIS）是一个 501©(3) 非营利组织，成立于 2000 年 10 月，其使命是 “通过识别，开发，验证，推广和维护最佳实践解决方案来防御网络攻击，并建立和引导社区打造安全可信的网络环境”。
CIS 基准测试是安全配置目标系统的最佳实践。CIS 基准是通过领域专家，技术供应商，公共和私人社区成员以及 CIS 基准开发团队的不懈努力而制定的。
基准提供两种类型的建议：计分和不记分。我们仅运行与 “计分建议” 相关的测试。
当 Rancher 对一个集群进行 CIS 安全扫描时，它会生成一个展示每个测试结果的报告。报告中包括通过，跳过和失败的测试数量的汇总。报告中同时也给失败的测试提供了补救办法。
更多详情，请参阅安全扫描文档。

5 推荐架构

安装 Rancher 的方式有两种：单节点安装和高可用集群安装。因为单节点安装只适用于测试和 demo 环境，而且单节点安装和高可用集群安装之间不能进行数据迁移，所以推荐从一开始就使用高可用集群安装的方式安装 Rancher。
建议将 Rancher Server 安装在高可用的 Kubernetes 集群上，主要是因为它可以保护 Rancher Server 的数据。在高可用安装中，负载均衡器充当客户端的单点入口，并在集群中的多台服务器之间分配网络流量，这有助于防止任何一台服务器成为单点故障。
不建议在单个 Docker 容器中安装 Rancher，因为如果该节点发生故障，则其他节点上将没有可用的集群数据副本，并且可能会丢失 Rancher Server 上的数据。
Rancher 需要安装在高可用的 RKE（Rancher Kubernetes Engine）Kubernetes 集群上，或高可用的 K3s (轻量级 Kubernetes) Kubernetes 集群。 RKE 和 K3s 都是经过完全认证的 Kubernetes 发行版。

5.1 K3S Kubernetes 集群安装

如果您是首次安装 Rancher v2.4，建议将其安装在 K3s Kubernetes 集群上。这种 K3s 架构的一个主要优点是，它允许使用外部数据库保存集群数据，从而可以将 K3s 服务器节点视为无状态的。
在 K3s 集群上安装 Rancher 的功能是在 Rancher v2.4 中引入的。K3s 易于安装，仅需要 Kubernetes 一半的内存，而且所有组件都在一个不超过 100 MB 的二进制文件中。
使用 K3s Kubernetes 集群运行 Rancher Management Server 的架构：

5.2 RKE Kubernetes 集群安装

如果要安装 Rancher v2.4 之前的版本，您需要在 RKE 集群上安装 Rancher，该集群中的数据存储在每个有 etcd 角色的节点上。在 Rancher v2.4 中，没有将 Rancher Server 从 RKE 集群迁移到 K3s 集群的方法。所有版本的 Rancher Server（包括 v2.4+）仍然可以安装在 RKE 集群上。
在 RKE 安装中，集群数据将在集群中的三个 etcd 节点上进行复制，这是为了保障在一个 etcd 节点发生故障时，可以提供冗余和数据复制。
使用 RKE Kubernetes 集群运行 Rancher Management Server 的架构：

6 负载均衡配置的推荐配置参数

我们建议您使用以下方案，配置您的负载均衡和 Ingress Controller：

Rancher 的 DNS 应该被解析到四层负载均衡器上；
负载均衡器应该把 TCP/80 端口和 TCP/443 端口的流量转发到集群中全部的 3 个节点上；
Ingress Controller 将把 HTTP 重定向到 HTTPS，在 TCP/443 端口使用 SSL/TLS；
Ingress Controller 把流量转发到 Rancher Server 的 pod 的 80 端口。

在 kubernetes 集群中安装 Ranhcer，并使用四层负载均衡，SSL 终止在 Ingress Controller 中。

为了达到最好的性能和安全条件，我们建议您为 Rancher 创建一个专用的 Kubernetes 集群，只在这个机器中部署 Rancher Server，不在这个集群中运行应用或程序。部署 Rancher 后，您可以创建新集群或导入已有集群，然后用这些集群启动您自己的应用或程序。
我们不建议在托管的 Kubernetes 集群上，如 EKS 和 GKE，安装 Rancher。这些托管的 Kubernetes 集群不会将 etcd 暴露给 Rancher ，达到 Rancher 可以管理的程度，而且它们的特殊改动可能与 Rancher 的操作冲突。

7 节点角色分配建议

根据 Rancher 是安装在 K3S Kubernetes 集群上还是 RKE Kubernetes 集群上，我们对每个节点的角色的建议有所不同。

7.1 K3S 集群角色

在 K3s 集群中，有两种类型的节点：Server 节点和 Agent 节点。Server 节点和 Agent 节点都可以运行工作负载。Server 节点运行 Kubernetes Master。
对于运行 Rancher Server 的集群，建议使用两个 Server 节点。不需要 Agent 节点。

7.2 RKE 集群角色

如果将 Rancher 安装在 RKE Kubernetes 集群上，则该集群应具有三个节点，并且每个节点都应具有所有三个 Kubernetes 角色：etcd，controlplane 和 worker。
Rancher Server RKE 集群和下游 Kubernetes RKE 集群的架构对比：
我们对 Rancher Server 集群上的 RKE 节点角色的建议与对运行您的业务应用的下游集群的建议相反。
在配置下游 Kubernetes 集群时，Rancher 使用 RKE 作为创建下游 Kubernetes 集群的工具。注意：在将来的 Rancher 版本中将添加创建下游 K3s 集群的功能。
对于下游 Kubernetes 集群，考虑到稳定性和可扩展性，我们建议下游集群中的每个节点都应只扮演一个角色。

RKE 每个节点至少需要一个角色，但并不强制每个节点只能有一个角色。但是，对于运行您的业务应用的集群，我们建议为每个节点使用单独的角色，这可以保证工作节点上的工作负载不会干扰 Kubernetes Master 或集群数据。
以下是我们对于下游集群的最低配置建议：

三个只有 etcd 角色的节点保障高可用性，如果这三个节点中的任意一个出现故障，还可以继续使用。
两个只有 controlplane 角色的节点这样可以保证 master 组件的高可用性。
一个或多个只有 worker 角色的节点用于运行 Kubernetes 节点组件和您部署的服务或应用。

在安装 Rancher Server 时三个节点，每个节点都有三个角色是安全的，因为：

可以允许一个 etcd 节点失败
多个 controlplane 节点使 master 组件保持多实例的状态。
该集群有且只有 Rancher 在运行。

因为这个集群中只部署了 Rancher server，没有其他程序或应用，这个集群已经足以应对大多数情况。所以这个集群并不需要像我们建议的下游集群那样的可扩展性和可靠性。

8 扩展 - Ingress

Rancher 安装的 Kubernetes 集群中的每个节点都应该运行一个 Ingress。
Ingress 应被部署为 DaemonSet，以确保你的负载平衡器能够成功地将流量路由到所有节点。
对于 RKE、K3s 和 RancherD 的安装，你不需要手动安装 Ingress，因为它是默认安装的。
对于托管的 Kubernetes 集群（EKS、GKE、AKS）和 RKE2 Kubernetes 安装，你将需要设置 Ingress。

二软件要求

下面的版本为当前的最新版和稳定版：

类型	Rancher 版本	Docker 标签	Helm 仓库	Helm Chart 版本
最新版	v2.5.8	rancher/rancher:latest	server-charts/latest	v2.5.8
稳定版	v2.5.8	rancher/rancher:stable	server-charts/stable	v2.5.8

1 Rancher 支持的 kubernetes 版本

更多信息可以转到官方链接查看。此处我仅列举了本人文档里试验总结的官方最新稳定版的相关信息：https://rancher.com/support-maintenance-terms/all-supported-versions/rancher-v2.5.8/

1.1 在 RKE 上安装 Ranhcer v2.5.8

适用于本地集群的 RKE CLI 和 K8S：

Rancher 版本	推荐的 CLI 版本	KUBERNETES 版本
v2.5.8	v1.2.8	v1.20.4（默认） v1.19.8 v1.18.16 v1.17.17

操作系统和 Docker：

类型	版本	已于 1 验证 / 认证
CentOS	7.7、7.8、7.9	Docker 18.06.3、18.09.x，19.03.x，20.10.x

1.2 Rancher v2.5.8 中的下游集群

Rancher RKE 下游集群 - Linux Work 节点
注意：Rancher RKE 下游群集可以由节点驱动程序或自定义 / 现有节点配置，也可以注册到 Rancher 中。
操作系统和 Docker：

类型	版本	已于 1 验证 / 认证
CentOS	7.7、7.8、7.9	Docker 18.06.3、18.09.x，19.03.x，20.10.x

支持的 K8S 版本：

上游 K8S 版本	在 2,3,4,5 上验证 / 认证
v1.20.6	etcd：v3.4.15 flannel：v0.13.0 canal：v3.17.2 nginx-ingress-controller：0.43.0-rancher3

1.3 在 K3S 上安装 Rancher v2.5.8

本地集群：

K3S 版本	在 2,3,4,5 上验证 / 认证
v1.20.6 + k3s1	Aurora（MySQL 5.7）2.09.0 MySQL 5.7 PostgreSQL 11.5、12.5、13.1 MariaDB 10.4.8 External Etcd 3.4.15 Embedded Etcd CRI：embedded Containered v1.4.4-k3s1 CNI：embedded Flannel v0.12.0-k3s.1

操作系统：

类型	版本	已于 1 验证 / 认证
CentOS	7.8、7.9、8.2、8.3	x86_64 架构

1.4 Rancher K3S 下游集群

注意：Rancher K3S 群集只能在 Rancher 中注册。
操作系统：

类型	版本	已于 1 验证 / 认证
CentOS	7.8、7.9、8.2、8.3	x86_64 架构

支持的 K3S 版本：

K3S 版本	在 2,3,4,5 上验证 / 认证
v1.20.6 + k3s1	Aurora（MySQL 5.7）2.09.0 MySQL 5.7 PostgreSQL 11.5、12.5、13.1 MariaDB 10.4.8 External Etcd 3.4.15 Embedded Etcd CRI：embedded Containered v1.4.4-k3s1 CNI：embedded Flannel v0.12.0-k3s.1

2 RKE-1.2.8

RKE 可以兼容当前的所有 Docker 版本。
每个 RKE 版本都有受支持的 Kubernetes 版本的特定列表。如果您要使用的版本与下面列出的版本不同，则需要使用中的系统映像选项来更新 Kubernetes cluster.yml。
列举支持的 Kubernetes 版本：

请参考 RKE 版本说明，获取您当前使用的 RKE 支持的 Kubernetes 版本号。

Kubernetes 版本
v1.20.6-rancher1-1
v1.19.10-rancher1-1
v1.18.18-rancher1-2
v1.17.17-rancher2-3

也可以输入以下命令，快速获取支持的版本号：

./rke config --list-version --all
v1.20.6-rancher1-1
v1.17.17-rancher2-3
v1.18.18-rancher1-2
v1.19.10-rancher1-1

3 Kubectl

kubectl 可以比 kube-apiserver 高一个小版本，也可以低一个小版本。
例如：

如果 kube-apiserver 当前是 1.21 版本
kubectl 则支持 1.22、1.21 和 1.20

4 Helm-3.5.x

请使用 Helm v3.2.x 或更高版本安装或升级 Rancher v2.5.x。
Helm v2.16.0 或更高版本需要 Kubernetes v1.16 版本。对于默认的 Kubernetes 版本，请参考发布说明以获取所使用的 RKE 的版本。
不能使用 Helm v2.15.0，因为这个版本中有一些关于转换 / 比较数字的问题。
不能使用 Helm v2.12.0，因为这个版本和 cert-manager 一起使用时会有问题。

Helm 版本支持的 Kubernetes 版本
3.5.x 1.20.x - 1.17.x
3.4.x 1.19.x - 1.16.x
3.3.x 1.18.x - 1.15.x
3.2.x 1.18.x - 1.15.x
3.1.x 1.17.x - 1.14.x
3.0.x 1.16.x - 1.13.x
2.16.x 1.16.x - 1.15.x
2.15.x 1.15.x - 1.14.x
2.14.x 1.14.x - 1.13.x
2.13.x 1.13.x - 1.12.x
2.12.x 1.12.x - 1.11.x
2.11.x 1.11.x - 1.10.x
2.10.x 1.10.x - 1.9.x
2.9.x 1.10.x - 1.9.x
2.8.x 1.9.x - 1.8.x
2.7.x 1.8.x - 1.7.x
2.6.x 1.7.x - 1.6.x
2.5.x 1.6.x - 1.5.x
2.4.x 1.6.x - 1.5.x
2.3.x 1.5.x - 1.4.x
2.2.x 1.5.x - 1.4.x
2.1.x 1.5.x - 1.4.x
2.0.x 1.4.x - 1.3.x

5 Docker-20.10.x

将最新的经过验证的 Docker 版本更新为 20.10。
每一个 Kubernetes 版本支持的 Docker 版本都不同。

6 nginx-1.14

官方已在 NGINX 1.14 上进行了测试 NGINX 配置。

7 OpenSSH-7.0+

为了可以通过 SSH 访问每一个节点，RKE 要求每个节点上安装的是 OpenSSH 的版本是 OpenSSH 7.0+。

三主机配置

先配置 4 台最小化安装的主机，其中 3 台使用 RKE 配置 k8s 集群，然后在这个集群上配置高可用 Rancher。
要在高可用性 RKE 集群上安装 Rancher 管理服务器，我们建议设置以下基础设施：

三个 Linux 节点，通常是虚拟机。
一个负载均衡器，将前端流量引导到三个节点。
一个 DNS 记录，将一个 URL 映射到负载均衡器。这将成为 Rancher 服务器的 URL，下游的 Kubernetes 集群需要到达它。

注意：Rancher 对于配置 k8s 集群的主机性能要求较高，如果配置较低，会有 k8s 集群被迫中断的风险。nginx 主机性能满足基本要求就可以了，配置要求不大。经试验几次后，我给予的虚拟机 Rancher 集群 k8s 主机配置的是：2U，运行内存 4G 和存储内存 50G。

1 主机基本信息

国内用户可根据此链接可以下载所有资源：http://mirror.cnrancher.com

主机 IP	主机名	配置	角色
192.168.0.201	k8s-node01	2 线程 4G	controlplane，etcd，worker
192.168.0.202	k8s-node02	2 线程 4G	controlplane，etcd，worker
192.168.0.203	k8s-node03	2 线程 4G	controlplane，etcd，worker
192.168.0.204	nginx	2 线程 2G	nginx 负载均衡

2 主机初始化配置

注意：以下步骤，四台主机均要操作。

2.1 查看系统版本是否满足要求

cat /etc/centos-release
CentOS Linux release 7.9.2009 (Core)     #若系统版本为7.7 7.8 7.9 均符合

2.2 修改yum源为阿里镜像源，安装工具包

yum -y install wget
cd /etc/yum.repos.d/
mv CentOS-Base.repo CentOS-Base.repo_back
wget -O CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
yum clean all
yum makecache
yum -y update
yum -y install epel-release
yum -y install lrzsz vim gcc glibc openssl openssl-devel net-tools curl

2.3 关闭防火墙和 selinux

测试环境中，为了方便将防火墙和 selinux 关闭；生产环境中，建议关闭 selinux，防火墙规则根据环境需要自定义即可。

#关闭selinux
setenforce 0
sed -i 's/enforcing/disabled/' /etc/selinux/config

#关闭防火墙
systemctl stop firewalld
systemctl disable firewalld

2.4 时钟同步

为了防止后续集群在客户端和服务器之间因为时钟不同步而发生验证错误。

第一种方法：

yum install -y ntp   #每台主机安装ntp服务
systemctl start ntpd    #启动时钟同步服务
systemctl enable  ntpd   #设置开机启动
ntpq -p   #查看时钟同步状态

第二种方法：

yum install ntp ntpdate -y

之后，选择一台主机（192.168.0.201）作为 ntp 时间服务器，修改/etc/ntp.conf文件，删除：

server 1.centos.pool.ntp.org iburst
server 2.centos.pool.ntp.org iburst
server 3.centos.pool.ntp.org iburst

改为：

server ntp3.aliyun.com iburst

另外，原始文件中有一行为如下内容：

#restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap

去掉 #，打开注释，并将其 ip 修改为服务器所在网段：

restrict 192.168.0.201 mask 255.255.240.0 nomodify notrap

在集群中的其他服务器上，也要修改此文件，删除掉：

server 1.centos.pool.ntp.org iburst
server 2.centos.pool.ntp.org iburst
server 3.centos.pool.ntp.org iburst

加入：

server 192.168.0.201 prefer

保存后退出，在集群中的所有服务器上执行如下命令：

systemctl stop chronyd.service
systemctl disable chronyd.service

systemctl restart ntpd
systemctl enable ntpd

之后，在集群中 192.168.0.201 以外的服务器上执行：

ntpq -p

出现以下结果：

remote           refid      st t when poll reach   delay   offset  jitter
==============================================================================
*sv1.ggsrv.de    192.53.103.103   2 u   28   64    1  210.439   -0.300   0.305
 192.168.0.201    .INIT.          16 u    -   64    0    0.000    0.000   0.000

说明时间已经同步。

2.5 内核参数调优

cat >> /etc/sysctl.conf << eof
vm.swappiness=0
net.ipv4.ip_forward=1
net.bridge.bridge-nf-call-iptables=1
net.bridge.bridge-nf-call-ip6tables = 1
net.ipv4.neigh.default.gc_thresh1=4096
net.ipv4.neigh.default.gc_thresh2=6144
net.ipv4.neigh.default.gc_thresh3=8192
eof

使内核参数生效：

modprobe br_netfilter  #首先执行这个命令后才不会报错
sysctl -p

2.6 SSH Server 配置

SSH server 全系统配置文件，位于/etc/ssh/sshd_config，该文件必须包含以下代码，允许 TCP 转发。

AllowTcpForwarding yes

#重启sshd服务
systemctl restart sshd

2.7 修改主机名

#分别修改每条主机的hostname
hostnamectl set-hostname k8s-node01
hostnamectl set-hostname k8s-node02
hostnamectl set-hostname k8s-node03
hostnamectl set-hostname nginx
#修改完后可直接断开Xshell的连接，再重新连接Xshell就可以看到主机名已修改了

在 /etc/hosts 文件中添加主机名配置：

cat >> /etc/hosts << eof
192.168.0.201 k8s-node01
192.168.0.202 k8s-node02
192.168.0.203 k8s-node03
192.168.0.204  nginx
eof

注意：下面的步骤仅在 k 8 s 的 3 台主机上操作， n g i n x 上不可以操作。

2.8 关闭 swap 分区

#临时关闭
swapoff -a

#永久关闭
进入/etc/fstab文件，注释掉swap分区的相关配置内容

2.9 加载 ipvs 相关模块

由于 ipvs 已经加入到了内核的主干，所以为 kube-proxy 开启 ipvs 的前提需要加载以下的内核模块。

cat > /etc/sysconfig/modules/ipvs.modules << eof
#!/bin/bash
modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4
eof

chmod 755 /etc/sysconfig/modules/ipvs.modules 
bash /etc/sysconfig/modules/ipvs.modules
lsmod | grep -e ip_vs -e nf_conntrack_ipv4	  #查看是否已经正确安装lipset软件包

前面脚本创建了/etc/sysconfig/modules/ipvs.modules文件，保证在节点重启后能自动加载所需模块。

cat >> /etc/rc.d/rc.local << eof
bash /etc/sysconfig/modules/ipvs.modules
eof

chmod +x /etc/rc.d/rc.local

四安装 docker-20.10.6

注意：仅在 k8s 节点安装 docker

若是节点主机上已安装有 docker，则先卸载及其依赖包

yum remove docker \
     docker-client \
     docker-client-latest \
     docker-common \
     docker-latest \
     docker-latest-logrotate \
     docker-logrotate \
     docker-engine

安装 epel 更新源

yum install epel-release -y

安装 docker 仓库

在新主机上首次安装 docker 之前，需要设置 Docker 仓库；之后，可以从仓库安装和更新 docker。
安装所需的软件包。yum-utils 提供了 yum-config-manager，并且 device mapper 存储驱动程序需要 device-mapper-persistent-data 和 lvm2。

yum install -y yum-utils device-mapper-persistent-data lvm2

设置docker阿里仓库。

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

安装 docker
按版本号排序列出存储库中可用的版本号

yum list docker-ce --showduplicates | sort -r
docker-ce.x86_64            3:20.10.6-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.5-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.4-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.3-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.2-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.1-3.el7                     docker-ce-stable
docker-ce.x86_64            3:20.10.0-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.9-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.8-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.7-3.el7                     docker-ce-stable
docker-ce.x86_64            3:19.03.6-3.el7                     docker-ce-stable
……

根据前面软件要求的内容，可以直接安装最新版 docker-20.10.x：

yum install -y docker-ce docker-ce-cli containerd.io	#默认安装最新版本的docker

若是安装指定版本，例如：

yum install -y docker-ce-19.03.9-3.el7 docker-ce-cli-19.03.9-3.el7 containerd.io

安装 docker 命令补全工具：

yum install -y bash-completion

启动 docker：

systemctl start docker

配置 docker 镜像下载加速器

tee /etc/docker/daemon.json << eof
{
    "registry-mirrors": [
        "https://1nj0zren.mirror.aliyuncs.com",
        "https://docker.mirrors.ustc.edu.cn",
        "http://hub-mirror.c.163.com"
    ],
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "50m",
    "max-file": "3"
  }
}
eof

启动 docker

systemctl daemon-reload
systemctl restart docker
systemctl enable docker

五使用 RKE 安装 kubernetes

1 主机互信

目前有 4 台服务器，确保可以通过 ssh 互相访问。

# 每台主机执行
ssh-keygen
ssh-copy-id -i 192.168.0.201
ssh-copy-id -i 192.168.0.202
ssh-copy-id -i 192.168.0.203
ssh-copy-id -i 192.168.0.204

2 创建普通用户并加入 docker 组

注意：使用 rke 安装 kubernetes 时，不能以 root 用户执行，必须是一个普通用户才可以。
在每个节点上创建 kuser 普通用户，并将其加入 docker 用户组中；把 nginx 主机当做主控机，其他主机的 kuser 用户互信它的 kuser 用户。

//nginx节点

[root@nginx ~]# useradd kuser
[root@nginx ~]# echo 123456 | passwd --stdin kuser	//给kuser用户设置密码
[root@nginx ~]# usermod -G docker kuser

//更新用户组
[root@nginx ~]# newgrp docker
[root@nginx ~]# id kuser
uid=1000(kuser) gid=1000(kuser) 组=1000(kuser),1001(docker)

//3个k8s节点均按照k8s-node01步骤操作

[root@k8s-node01 ~]# useradd kuser
[root@k8s-node01 ~]# echo 123 | passwd --stdin kuser
[root@k8s-node01 ~]# usermod -G docker kuser

//更新用户组
[root@k8s-node01 ~]# newgrp docker
[root@k8s-node01 ~]# id kuser
uid=1000(kuser) gid=1000(kuser) 组=1000(kuser),994(docker)

//切换到kuser用户，测试kuser用户是否能运行docker命令
[root@k8s-node01 ~]# su - kuser
[ops@k8s-node01 ~]$ docker ps

//每台主机切换到kuser用户，让每个节点主机的ops用户互相信任
# su - kuser
$ ssh-keygen 
$ ssh-copy-id -i [email protected]
$ ssh-copy-id -i [email protected]
$ ssh-copy-id -i [email protected]
$ ssh-copy-id -i [email protected]

最后在 nginx 主机上测试：通过 kuser 用户可以直接连接到每个 k8s 节点，并能运行 docker 相关命令。

注意：完成以上配置后，需重启主机，某些配置参数才会生效。

3 在 nginx 节点下载安装 RKE-1.2.8

3.1 下载 RKE

登录主机，打开浏览器，访问 RKE 版本发布页面，下载最新的 RKE v1.2.12。 https://download.fastgit.org/rancher/rke/releases/download/v1.2.12/rke_linux-amd64
每个 RKE 版本都有受支持的 Kubernetes 版本的特定列表。如果您要使用的版本与下面列出的版本不同，则需要使用中的系统映像选项来更新 Kubernetes cluster.yml。

3.2 安装 rke 命令

运行以下命令，将下载的 RKE 二进制安装包复制到您想要保存的路径下，然后将这个安装包重命名为 rke。

//保存至kuser用户的家目录
$ mv rke_linux-amd64 rke

运行以下命令，将 rke 安装包转为可执行文件。

$ chmod +x rke

运行以下命令，检查 rke 安装包是否已经转换为可执行文件。

$ ./rke --version
rke version v1.2.10

3.3 为 kubernetes 集群准备节点

注意：以下 1 和 2 已在初始化环境完成， 3 需要在每个节点执行
kubernetes 集群组件需要在 Linux 发行版上的 Docker 中运行，只要是能安装和运行 docker 是 linux 发行版，都可以使用。

SSH 用户 - 使用 SSH 访问节点的用户必须是节点上 docker 用户组的成员。

添加到 docker 用户组的用户会自动获得主机的 root 权限，运行上述命令前，请确认您是否想让该用户获得 root 权限。运行命令后，请妥善保存该用户的认证凭据。
如果您无法切换到 root 用户，不能运行上述命令将用户添加到 docker 用户组，请参考 Docker 官方文档，该文档提供了以非 root 用户的身份管理 Docker 的操作步骤。

禁用所有的 work 节点上的交换功能（swap）。
在命令行工具中输入以下命令和脚本，检查下列模组是否存在。

// 配置以下脚本
# vim module.sh
for module in br_netfilter ip6_udp_tunnel ip_set ip_set_hash_ip ip_set_hash_net iptable_filter iptable_nat iptable_mangle iptable_raw nf_conntrack_netlink nf_conntrack nf_conntrack_ipv4   nf_defrag_ipv4 nf_nat nf_nat_ipv4 nf_nat_masquerade_ipv4 nfnetlink udp_tunnel veth vxlan x_tables xt_addrtype xt_conntrack xt_comment xt_mark xt_multiport xt_nat xt_recent xt_set  xt_statistic xt_tcpudp;
do
  if ! lsmod | grep -q $module; then
    echo "module $module is not present";
  fi;
done
    
# chmod +x module.sh
# sh module.sh

报错：所有模块不存在

// 执行此命令加载内核模块,用root用户执行
# modprobe -a br_netfilter ip6_udp_tunnel ip_set ip_set_hash_ip ip_set_hash_net iptable_filter iptable_nat iptable_mangle iptable_raw nf_conntrack_netlink nf_conntrack nf_conntrack_ipv4   nf_defrag_ipv4 nf_nat nf_nat_ipv4 nf_nat_masquerade_ipv4 nfnetlink udp_tunnel veth vxlan x_tables xt_addrtype xt_conntrack xt_comment xt_mark xt_multiport xt_nat xt_recent xt_set  xt_statistic xt_tcpudp

//然后再次执行module.sh脚本 
# sh module.sh

会有 3 个模块没有找到，不影响：

返回的模组应该包括下列的所有模组：

模组名称
br_netfilter
ip6_udp_tunnel
ip_set
ip_set_hash_ip
ip_set_hash_net
iptable_filter
iptable_nat
iptable_mangle
iptable_raw
nf_conntrack_netlink
nf_conntrack
nf_conntrack_ipv4
nf_defrag_ipv4
nf_nat
nf_nat_ipv4
nf_nat_masquerade_ipv4
nfnetlink
udp_tunnel
veth
vxlan
x_tables
xt_addrtype
xt_conntrack
xt_comment
xt_mark
xt_multiport
xt_nat
xt_recent
xt_set
xt_statistic
xt_tcpudp

3.4 创建集群配置文件 - cluster.yml

创建一个名为 cluster.yml 的 Kubernetes 集群配置文件。在后续步骤中，当使用 RKE 命令设置集群时，它将使用此文件在节点上安装 Kubernetes。
RKE 适配了高可用集群，您可以在 cluster.yml 文件中配置多个 controlplane 节点。RKE 会把 master 节点的组件部署在所有被列为 controlplane 的节点上，同时把 kubelets 的默认连接地址配置为 127.0.0.1:6443 。这个地址是 nginx-proxy 请求所有 master 节点的地址。
创建高可用集群需要指定两个或更多的节点作为 controlplane 。
RKE 使用集群配置文件 cluster.yml 规划集群中的节点，例如集群中应该包含哪些节点，如何部署 Kubernetes。您可以通过该文件修改很多集群配置选项。
如果您的节点具有公共和内部地址，建议设置 internal_address: 这样 Kubernetes 会将其用于集群内通信。
RKE 需要通过 SSH 连接到每个节点，并且它将在默认位置 ~/.ssh/id_rsa 中寻找私钥。如果您的默认私钥与节点的私钥不在同一个位置，则还需要为该节点配置 ssh_key_path 选项。

我这里根据官网列举了几个 RKE 节点选项：

选项	必填	描述
address	是	公用 DNS 或 IP 地址
user	是	可以运行 docker 命令的用户
role	是	分配给节点的 Kubernetes 角色列表
internal_address	是	内部集群流量的专用 DNS 或 IP 地址
ssh_key_path	否	用于对节点进行身份验证的 SSH 私钥的路径（默认为~/.ssh/id_rsa）
cluster_name	集群名称	默认集群名称：local
ignore_docker_version	检查 docker 版本	在运行 RKE 前是否执行 Docker 版本检测，可选值为 true 和 false，默认值为 false
kubernetes_version	kubernetes 版本	将原有的版本号修改为新的版本号即可，RKE 目前不支持回滚 Kubernetes 版本。
prefix_path	前缀路径	默认下 RKE 存储 ROS、CoreOS 等操作系统的相关资源时，添加一个前缀：/opt/rke
ssh_key_path	集群 ssh 秘钥路径	RKE 使用 ssh 连接到主机，通常情况下，每个节点都会在 nodes 部分为每个 ssh 密钥设置一个独立的路径。
……	……	……

高级配置： RKE 有许多配置选项可用于在您的特定环境中进行自定义安装。请参阅 RKE 文档来了解 RKE 的选项和功能的完整列表。
要为大规模 Rancher 安装 etcd 集群，请参阅 etcd 设置指南。

创建集群配置文件 cluster.yml 的方式有两种：

使用 minimal cluster.yml 创建集群配置文件，然后将您使用的节点的相关信息添加到文件中。
使用 rke config 命令 创建集群配置文件，然后将集群参数逐个输入到该文件中。

使用 rke config
运行 rke config 命令，在当前路径下创建 cluster.yml 文件。这条命令会引导您输入创建集群所需的所有参数，详情请参考集群配置选项。

[kuser@nginx ~]$ ./rke config --name cluster.yml

示例：

中间有一些内容是需要修改的，比如 etcd 的备份周期，备份保留时间，ingress 是否安装等等。

cluster.yml 配置文件内容：参考官方 kubernetes 配置选项

# If you intened to deploy Kubernetes in an air-gapped environment,
# please consult the documentation on how to configure custom RKE images.
nodes:
- address: 192.168.0.201
  port: "22"
  internal_address: ""
  role:
  - controlplane
  - worker
  - etcd
  hostname_override: ""
  user: kuser
  docker_socket: /var/run/docker.sock
  ssh_key: ""
  ssh_key_path: ~/.ssh/id_rsa
  ssh_cert: ""
  ssh_cert_path: ""
  labels: {}
  taints: []
- address: 192.168.0.202
  port: "22"
  internal_address: ""
  role:
  - controlplane
  - worker
  - etcd
  hostname_override: ""
  user: kuser
  docker_socket: /var/run/docker.sock
  ssh_key: ""
  ssh_key_path: ~/.ssh/id_rsa
  ssh_cert: ""
  ssh_cert_path: ""
  labels: {}
  taints: []
- address: 192.168.0.203
  port: "22"
  internal_address: ""
  role:
  - controlplane
  - worker
  - etcd
  hostname_override: ""
  user: kuser
  docker_socket: /var/run/docker.sock
  ssh_key: ""
  ssh_key_path: ~/.ssh/id_rsa
  ssh_cert: ""
  ssh_cert_path: ""
  labels: {}
  taints: []
services:
  etcd:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    external_urls: []
    ca_cert: ""
    cert: ""
    key: ""
    path: ""
    uid: 0
    gid: 0
    snapshot: null
    retention: ""
    creation: ""
    backup_config: null
  kube-api:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    service_cluster_ip_range: 10.43.0.0/16
    service_node_port_range: ""
    pod_security_policy: false
    always_pull_images: false
    secrets_encryption_config: null
    audit_log: null
    admission_configuration: null
    event_rate_limit: null
  kube-controller:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    cluster_cidr: 10.42.0.0/16
    service_cluster_ip_range: 10.43.0.0/16
  scheduler:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
  kubelet:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
    cluster_domain: cluster.local
    infra_container_image: ""
    cluster_dns_server: 10.43.0.10
    fail_swap_on: false
    generate_serving_certificate: false
  kubeproxy:
    image: ""
    extra_args: {}
    extra_binds: []
    extra_env: []
    win_extra_args: {}
    win_extra_binds: []
    win_extra_env: []
network:
  plugin: canal
  options: {}
  mtu: 0
  node_selector: {}
  update_strategy: null
  tolerations: []
authentication:
  strategy: x509
  sans: []
  webhook: null
addons: ""
addons_include: []
system_images:
  etcd: rancher/mirrored-coreos-etcd:v3.4.15-rancher1
  alpine: rancher/rke-tools:v0.1.75
  nginx_proxy: rancher/rke-tools:v0.1.75
  cert_downloader: rancher/rke-tools:v0.1.75
  kubernetes_services_sidecar: rancher/rke-tools:v0.1.75
  kubedns: rancher/mirrored-k8s-dns-kube-dns:1.15.10
  dnsmasq: rancher/mirrored-k8s-dns-dnsmasq-nanny:1.15.10
  kubedns_sidecar: rancher/mirrored-k8s-dns-sidecar:1.15.10
  kubedns_autoscaler: rancher/mirrored-cluster-proportional-autoscaler:1.8.1
  coredns: rancher/mirrored-coredns-coredns:1.8.0
  coredns_autoscaler: rancher/mirrored-cluster-proportional-autoscaler:1.8.1
  nodelocal: rancher/mirrored-k8s-dns-node-cache:1.15.13
  kubernetes: rancher/hyperkube:v1.20.8-rancher1
  flannel: rancher/coreos-flannel:v0.13.0-rancher1
  flannel_cni: rancher/flannel-cni:v0.3.0-rancher6
  calico_node: rancher/mirrored-calico-node:v3.17.2
  calico_cni: rancher/mirrored-calico-cni:v3.17.2
  calico_controllers: rancher/mirrored-calico-kube-controllers:v3.17.2
  calico_ctl: rancher/mirrored-calico-ctl:v3.17.2
  calico_flexvol: rancher/mirrored-calico-pod2daemon-flexvol:v3.17.2
  canal_node: rancher/mirrored-calico-node:v3.17.2
  canal_cni: rancher/mirrored-calico-cni:v3.17.2
  canal_controllers: rancher/mirrored-calico-kube-controllers:v3.17.2
  canal_flannel: rancher/coreos-flannel:v0.13.0-rancher1
  canal_flexvol: rancher/mirrored-calico-pod2daemon-flexvol:v3.17.2
  weave_node: weaveworks/weave-kube:2.8.1
  weave_cni: weaveworks/weave-npc:2.8.1
  pod_infra_container: rancher/mirrored-pause:3.2
  ingress: rancher/nginx-ingress-controller:nginx-0.43.0-rancher3
  ingress_backend: rancher/mirrored-nginx-ingress-controller-defaultbackend:1.5-rancher1
  metrics_server: rancher/mirrored-metrics-server:v0.4.1
  windows_pod_infra_container: rancher/kubelet-pause:v0.1.6
  aci_cni_deploy_container: noiro/cnideploy:5.1.1.0.1ae238a
  aci_host_container: noiro/aci-containers-host:5.1.1.0.1ae238a
  aci_opflex_container: noiro/opflex:5.1.1.0.1ae238a
  aci_mcast_container: noiro/opflex:5.1.1.0.1ae238a
  aci_ovs_container: noiro/openvswitch:5.1.1.0.1ae238a
  aci_controller_container: noiro/aci-containers-controller:5.1.1.0.1ae238a
  aci_gbp_server_container: noiro/gbp-server:5.1.1.0.1ae238a
  aci_opflex_server_container: noiro/opflex-server:5.1.1.0.1ae238a
ssh_key_path: ~/.ssh/id_rsa
ssh_cert_path: ""
ssh_agent_auth: false
authorization:
  mode: rbac
  options: {}
ignore_docker_version: null
kubernetes_version: ""
private_registries: []
ingress:
  provider: ""
  options: {}
  node_selector: {}
  extra_args: {}
  dns_policy: ""
  extra_envs: []
  extra_volumes: []
  extra_volume_mounts: []
  update_strategy: null
  http_port: 0
  https_port: 0
  network_mode: ""
  tolerations: []
  default_backend: null
  default_http_backend_priority_class_name: ""
  nginx_ingress_controller_priority_class_name: ""
cluster_name: ""
cloud_provider:
  name: ""
prefix_path: ""
win_prefix_path: ""
addon_job_timeout: 0
bastion_host:
  address: ""
  port: ""
  user: ""
  ssh_key: ""
  ssh_key_path: ""
  ssh_cert: ""
  ssh_cert_path: ""
monitoring:
  provider: ""
  options: {}
  node_selector: {}
  update_strategy: null
  replicas: null
  tolerations: []
  metrics_server_priority_class_name: ""
restore:
  restore: false
  snapshot_name: ""
rotate_encryption_key: false
dns: null

扩展 - 其他配置选项
在原有创建集群配置文件命令的基础上，加上 --empty ，可以创建一个空白的集群配置文件。

rke config --empty --name cluster.yml

您也可以使用 --print，将 cluster.yml 文件的内容显示出来。

rke config --print

证书
默认情况下，Kubernetes 集群需要用到证书，而 RKE 会自动为所有集群组件生成证书。我使用的是 RKE 自动生成的证书，则直接跳过此步骤。
您也可以使用自定义证书。部署集群后，您可以管理这些自动生成的证书，详情请参考管理自动生成的证书。

3.5 运行 RKE 部署 kubernetes 集群

[kuser@nginx ~]$ ./rke up --config ./cluster.yml

运行该命令后，返回的最后一行信息应该是 Finished building Kubernetes cluster successfully，表示成功部署集群，可以开始使用集群。

在创建 Kubernetes 集群的过程中，会创建一个 kubeconfig 文件，它的文件名称是kube_config_cluster.yml，您可以使用它控制 Kubernetes 集群。

说明： \color{red} 说明：说明：如果您之前使用的集群配置文件名称不是 cluster.yml，那么这里生成的 kube_config 文件的名称也会随之变化为 kube_config*.yml。
注意：每次运行 rke up 后，应该备份状态文件。

错误集锦：
上次执行时产生的文件，重新执行命令时会自动覆盖。

ssh 信任没有做好，请确保是普通用户执行 rke，不能是 root 用户。

WARN[0000] Failed to set up SSH tunneling for host [10.212.20.97]: Can't retrieve Docker Info: error during connect: Get http://%2Fvar%2Frun%2Fdocker.sock/v1.24/info: Unable to access node with address [10.212.20.97:22] using SSH. Please check if you are able to SSH to the node using the specified SSH Private Key and if you have configured the correct SSH username. Error: ssh: handshake failed: ssh: unable to authenticate, attempted methods [none publickey], no supported methods remain

远程用户无法使用 docker ps 命令，将用户添加到 docker 用户组。
可能是机器配置过低，有超时的情况。
把这三台主机上已经启动的 docker 容器清理了，然后重新执行命令，以免影响再次的操作。
在三台 k8s 主机上用 root 权限执行下面命令：

# 防火墙规则清理
/sbin/iptables -P INPUT ACCEPT
/sbin/iptables -F

# 容器清理
docker system prune -f
docker stop $(docker ps -aq)
docker rm -f $(docker ps -aq)
docker volume rm $(docker volume ls -q)
docker image rm $(docker image ls -q)
rm -rf /etc/ceph \
       /etc/cni \
       /etc/kubernetes \
       /opt/cni \
       /opt/rke \
       /run/secrets/kubernetes.io \
       /run/calico \
       /run/flannel \
       /var/lib/calico \
       /var/lib/etcd \
       /var/lib/cni \
       /var/lib/kubelet \
       /var/lib/rancher/rke/log \
       /var/log/containers \
       /var/log/pods \
       /var/run/calico

# 重启服务
systemctl restart docker

重新执行一遍 ./rke up --config ./rancher-cluster.yml 即可。

Failed to get job complete status for job rke-network-plugin-deploy-job in namespace kube-system

3.6 保存文件

注意：
请保存下文中列出来的所有文件，需要用以下文件来进行集群维护，集群升级和故障排查。
请将这些文件复制并保存到安全的位置。

cluster.yml：RKE 集群的配置文件。
kube_config_cluster.yml：该集群的 Kubeconfig 文件包含了获取该集群所有权限的认证凭据。
cluster.rkestate：Kubernetes 集群状态文件，该文件包含当前集群的状态、RKE 配置信息和证书信息，包含了获取该集群所有权限的认证凭据，使用 RKE v0.2.0 或更高版本时才会创建这个文件。

[root@nginx ~]# mkdir /cluster-bak
[root@nginx ~]# cp /home/kuser/*cluster* /cluster-bak/
[root@nginx ~]# ll /cluster-bak/
总用量 136
-rw------- 1 root root 121811 5月  14 15:19 cluster.rkestate
-rw-r----- 1 root root   6398 5月  14 15:19 cluster.yml
-rw------- 1 root root   5387 5月  14 15:19 kube_config_cluster.yml

说明
kube_config_cluster.yml 和 cluster.rkestate 两个文件的名称取决于您如何命名 RKE 集群配置文件，如果您修改的集群配置文件的名称，那么后两个文件的名称可能会跟上面列出来的文件名称不一样。

六操作 kubernetes 集群

1 安装 kubectl-v1.21.1（kubernetes 命令行工具）

与 Kubernetes 集群通信前，您需要在 nginx 主机中下载和安装 kubectl 文件，请单击此处下载 kubectl。

安装kubelet kubeadm kubectl（国内镜像源）

cat < /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF

安装 kubectl

[root@nginx ~]# yum install -y  kubectl

执行测试，以保障你安装的版本是最新的：

kubectl version --client

5. kubectl命令补全工具的安装

yum install -y bash-completion
source /usr/share/bash-completion/bash_completion
source <(kubectl completion bash)
echo "source <(kubectl completion bash)" >> ~/.bashrc

2 kubeconfig 文件

注意：成功启动和运行集群后，您可以使用 kubectl 和 kubeconfig 文件控制集群
kubeconfig 文件，即 kubeconfig file，是用于配置集群访问的文件的统称，这并不意味着真的有一个名为 “kubeconfig” 的文件。例如，在部署 Kubernetes 集群的时候，RKE 会自动生成一个名为 kube_config_cluster.yml 的文件用于配置集群访问，那么这个文件就是 RKE 使用的 kubeconfig 文件。
您可以配合 kubectl 命令行工具使用 kubeconfig 文件，详情请参考 Kubernetes 官方文档。
说明：如果您没有修改 RKE 默认配置，RKE 自动生成的 kubeconfig 文件文件会保存在 ~/.kube/config 路径，kubectl 会检查该路径下是否存在 kubeconfig 文件 kube_config_cluster.yml。如果您将 kubeconfig 文件保存在其他路径，可以输入以下命令，使 kubectl 使用其他路径下的 kubeconfig 文件配置集群访问。

kubectl --kubeconfig /custom/path/kube.config get pods

运行以下命令，检查 Kubernetes 机器的版本，以确认 kubectl 的工作状态：

[root@nginx ~]# kubectl --kubeconfig /home/kuser/kube_config_cluster.yml version
Client Version: version.Info{Major:"1", Minor:"21", GitVersion:"v1.21.1", GitCommit:"5e58841cce77d4bc13713ad2b91fa0d961e69192", GitTreeState:"clean", BuildDate:"2021-05-12T14:18:45Z", GoVersion:"go1.16.4", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"20", GitVersion:"v1.20.6", GitCommit:"8a62859e515889f07e3e3be6a1080413f17cf2c3", GitTreeState:"clean", BuildDate:"2021-04-15T03:19:55Z", GoVersion:"go1.15.10", Compiler:"gc", Platform:"linux/amd64"}

如果返回的信息中包含了 client 端和 server 端的版本号，则表示您在本地有一个 kubectlclient 端，并且能够使用它从新建的集群获取 server 版本号，kubectl 处于正常状态。现在您可以在 kubectl 命令行工具中使用 kubectl 命令控制集群，就像请求集群中的节点一样。

3 配置 kubeconfig 文件，运行 kubectl 命令

3.1 让 kuser（和 root）用户运行 kubectl 命令

[kuser@nginx ~]$ ll
总用量 41196
-rw------- 1 kuser kuser   121811 5月  14 15:01 cluster.rkestate
-rw-r----- 1 kuser kuser     6398 5月  14 14:53 cluster.yml
-rw------- 1 kuser kuser     5387 5月  14 14:56 kube_config_cluster.yml
-rwxr-xr-x 1 kuser kuser 42042980 5月  14 10:09 rke
[kuser@nginx ~]$ mkdir ~/.kube
[kuser@nginx ~]$ cp kube_config_cluster.yml ~/.kube/config

//让root用户运行kubectl命令
[root@nginx ~]# cp /home/kuser/kube_config_cluster.yml ~/.kube/config

3.2 使用 kubectl 测试集群节点连通性

//查看所有节点是否都处于Ready状态
[kuser@nginx ~]$ kubectl get nodes
NAME           STATUS   ROLES                      AGE    VERSION
192.168.0.201   Ready    controlplane,etcd,worker   103m   v1.20.6
192.168.0.202   Ready    controlplane,etcd,worker   103m   v1.20.6
192.168.0.203   Ready    controlplane,etcd,worker   103m   v1.20.6

3.3 检查集群 Pod 的运行状况

检查所有必需的 Pod 和容器是否状况良好，然后可以继续进行：

Pod 是 Running 或 Completed 状态。
STATUS 为 Running 的 Pod，READY 应该显示所有容器正在运行 (例如，3/3)。
STATUS 为 Completed 的 Pod 是一次运行的作业。对于这些 Pod，READY 应为 0/1。

[kuser@nginx ~]$ kubectl get pods -A
NAMESPACE       NAME                                       READY   STATUS      RESTARTS   AGE
ingress-nginx   default-http-backend-6977475d9b-xdw6x      1/1     Running     0          110m
ingress-nginx   nginx-ingress-controller-h45qt             1/1     Running     0          110m
ingress-nginx   nginx-ingress-controller-kc7z5             1/1     Running     0          110m
ingress-nginx   nginx-ingress-controller-tzjdd             1/1     Running     0          110m
kube-system     calico-kube-controllers-7d5d95c8c9-q4n9j   1/1     Running     0          110m
kube-system     canal-cw7sn                                2/2     Running     0          110m
kube-system     canal-vdbzb                                2/2     Running     0          110m
kube-system     canal-z4tl2                                2/2     Running     0          110m
kube-system     coredns-55b58f978-62fqt                    1/1     Running     0          110m
kube-system     coredns-55b58f978-s28ht                    1/1     Running     0          107m
kube-system     coredns-autoscaler-76f8869cc9-9mrtp        1/1     Running     0          110m
kube-system     metrics-server-55fdd84cd4-x59nf            1/1     Running     0          110m
kube-system     rke-coredns-addon-deploy-job-v4rcq         0/1     Completed   0          110m
kube-system     rke-ingress-controller-deploy-job-88ptn    0/1     Completed   0          110m
kube-system     rke-metrics-addon-deploy-job-n4nfw         0/1     Completed   0          110m
kube-system     rke-network-plugin-deploy-job-kthrm        0/1     Completed   0          110m

这确认您已经成功安装了可以运行 Rancher Server 的 Kubernetes 集群。

3.4 扩展 - 其余相关操作

若有以下相关操作，可参考官方文档链接：

管理 kubrnetes 证书
添加或移除节点

七安装 Helm（Kubernetes 的软件包管理工具）

在 nginx 主机上安装 helm
helm 官方参考文档
下载需要的版本

[root@nginx ~]# wget http://rancher-mirror.cnrancher.com/helm/v3.6.3/helm-v3.6.3-linux-amd64.tar.gz

解压：

[root@nginx ~]# tar -zxvf helm-v3.5.4-linux-amd64.tar.gz

在解压目录中找到 helm 程序，移动到需要的目录中：

[root@nginx ~]# mv linux-amd64/helm  /usr/local/bin/

查看 helm 版本：

[root@nginx ~]# helm version
version.BuildInfo{Version:"v3.5.4", GitCommit:"1b5edb69df3d3a08df77c9902dc17af864ff05d1", GitTreeState:"clean", GoVersion:"go1.15.11"}

然后就可以执行客户端程序并添加稳定仓库: helm help。

八安装 Rancher Helm Chart

Rancher 使用 Kubernetes 的 Helm 软件包管理器安装。Helm Charts 为 Kubernetes YAML 清单文档提供了模板语法。
有了 Helm，我们可以创建可配置的 Deployment，而不只是使用静态文件。

对于无法直接访问 Internet 的系统，请参阅 Rancher 离线安装。
选择要安装的 Rancher 版本，请参阅选择 Rancher 版本。
要选择用于安装 Rancher 的 Helm 版本，请参阅 Helm 版本要求。

1 Helm Chart 仓库

Rancher 提供了几种不同的 Helm Chart 仓库供您选择。最新版或稳定版的 Rancher Helm Chart 与用于 Docker 安装的 Rancher 的 Docker 镜像标签对应。因此，rancher-latest 仓库包含被标记为 rancher/rancher:latest 的版本。当 Rancher 版本升级到 rancher/rancher:stable 后，它将被添加到 rancher-stable 仓库中。

类别	添加仓库命令	仓库描述
rancher-latest	helm repo add rancher-latest https://releases.rancher.com/server-charts/latest	添加最新版本的 Rancher 的 Helm Chart 仓库。我们建议使用此仓库来测试新版本的 Rancher。
rancher-stable	helm repo add rancher-stable https://releases.rancher.com/server-charts/stable	添加较旧的，稳定的版本的 Rancher 的 Helm Chart 仓库。我们建议将此仓库用于生产环境。
rancher-alpha	helm repo add rancher-alpha https://releases.rancher.com/server-charts/alpha	添加 alpha 版本的 Rancher 的 Helm Chart 仓库，以预览即将发布的版本. 不建议在生产环境中使用这些版本。我们不支持从 rancher alpha 仓库中的 chart 升级到任何其他版本 chart。

注意： rancher-latest 和 rancher-stable Helm Chart 仓库是在 Rancher v2.1.0 后引入的，因此 rancher-stable 仓库包含一些从来没有被标记为 rancher/rancher:stable 标签的 Rancher 版本。在 v2.1.0 之前标记为 rancher/rancher:stable 的 Rancher 版本是 v2.0.4，v2.0.6，v2.0.8。在 v2.1.0 版本之后，rancher-stable 仓库中的所有 charts 将与标记为 stable 的 Rancher 版本对应。
Rancher Helm Chart 版本必须匹配 Rancher 版本（即 appVersion）。

2 添加 Helm Chart 仓库

使用 helm repo add 命令添加含有 Rancher Chart 的 Helm Chart 仓库。
请将命令中的，替换为 latest，stable 或 alpha。更多信息，请查看选择 Rancher 版本来选择最适合您的仓库。

latest: 建议在尝试新功能时使用。
stable: 建议在生产环境中使用。（推荐）
alpha: 未来版本的实验性预览。

//国内用户，可以使用放在国内的 Rancher Chart 加速安装
[root@nginx ~]# helm repo add rancher-stable http://rancher-mirror.oss-cn-beijing.aliyuncs.com/server-charts/stable
"rancher-stable" has been added to your repositories

2.1 扩展 - 切换到不同 Helm Chart 仓库

安装 Rancher 之后，如果想要修改安装 Rancher 的 Helm Chart 仓库，需要执行以下步骤。
注意：由于 rancher-alpha 仓库只包含 alpha 版本 charts，因此不支持在 rancher alpha 仓库和 rancher stable 或 rancher latest 仓库之间切换以进行升级。

输入 helm repo list 命令，列出当前 Helm Chart 仓库。

helm repo list
NAME                    URL
stable
rancher-    https://releases.rancher.com/server-charts/

输入 helm repo remove rancher- 命令移除您安装 Rancher 时用的 Helm Chart 仓库，是 rancher-stable 还是 rancher-latest 仓库取决于您初始安装时选择的是哪个库。

helm repo remove rancher-

输入 helm repo add rancher- https://releases.rancher.com/server-charts/ 命令，添加安装 Rancher 所需要的 Helm Chart 仓库。

helm repo add rancher- https://releases.rancher.com/server-charts/

继续按照这个步骤从新的 Helm Chart 仓库升级 Rancher。

3 为 Rancher 创建 Namespace

我们需要定义一个 Kubernetes Namespace，在 Namespace 中安装由 Chart 创建的资源。这个命名空间的名称为 cattle-system：

[root@nginx ~]# kubectl create namespace cattle-system
namespace/cattle-system created

4 选择您的 SSL 选项

Rancher Server 默认需要 SSL/TLS 配置来保证访问的安全性。
您可以从以下三种证书来源中选择一种，证书将用来在 Rancher Server 中终止 TLS：

Rancher 生成的自签名证书：在这种情况下，您需要在集群中安装 cert-manager。 Rancher 利用 cert-manager 签发并维护证书。Rancher 将生成自己的 CA 证书，并使用该 CA 签署证书。然后，cert-manager 负责管理该证书。
Let’s Encrypt： Let’s Encrypt 选项也需要使用 cert-manager。但是，在这种情况下，cert-manager 与特殊的 Issuer 结合使用，cert-manager 将执行获取 Let’s Encrypt 发行的证书所需的所有操作（包括申请和验证）。此配置使用 HTTP 验证（HTTP-01），因此负载均衡器必须具有可以从公网访问的公共 DNS 记录。
使用您自己的证书：此选项使您可以使用自己的权威 CA 颁发的证书或自签名 CA 证书。 Rancher 将使用该证书来保护 WebSocket 和 HTTPS 流量。在这种情况下，您必须上传名称分别为 tls.crt 和 tls.key 的 PEM 格式的证书以及相关的密钥。如果使用私有 CA，则还必须上传该证书。这是由于您的节点可能不信任此私有 CA。 Rancher 将获取该 CA 证书，并从中生成一个校验和，各种 Rancher 组件将使用该校验和来验证其与 Rancher 的连接。

设置	Chart 选项	描述	是否需要 cert-manager
Rancher 生成的自签名证书	ingress.tls.source=rancher	使用 Rancher 生成的 CA 签发的自签名证书此项为默认选项	是
Let’s Encrypt	ingress.tls.source=letsEncrypt	使用 Let’s Encrypt 颁发的证书	是
您已有的证书	ingress.tls.source=secret	使用您的自己的证书（Kubernetes 密文）	否

注意： Rancher 中国技术支持团队建议您使用 “您已有的证书” ingress.tls.source=secret 这种方式，从而减少对 cert-manager 的运维成本。

4.1 什么是数字证书

所谓数字证书，是一种用于电脑的身份识别机制。由数字证书颁发机构 (CA) 对使用私钥创建的签名请求文件做的签名(盖章)，表示 CA 结构对证书持有者的认可。

数字证书拥有以下几个优点:

使用数字证书能够提高用户的可信度；
数字证书中的公钥，能够与服务端的私钥配对使用，实现数据传输过程中的加密和解密；
在证认使用者身份期间，使用者的敏感个人数据并不会被传输至证书持有者的网络系统上。

1. 数字证书类型

x509 的证书编码格式有两种：

PEM(Privacy-enhanced Electronic Mail) 是明文格式的，以 -----BEGIN CERTIFICATE----- 开头，以 -----END CERTIFICATE----- 结尾。中间是经过 base64 编码的内容，apache 需要的证书就是这类编码的证书. 查看这类证书的信息的命令为：openssl x509 -noout -text -in server.pem。
DER 是二进制格式的证书，查看这类证书的信息的命令为: openssl x509 -noout -text -inform der -in server.der

2. 扩展名

.crt 证书文件，可以是 DER(二进制) 编码的，也可以是 PEM(ASCII (Base64)) 编码的)，在类 unix 系统中比较常见；
.cer 也是证书，常见于 Windows 系统。编码类型同样可以是 DER 或者 PEM 的，windows 下有工具可以转换 crt 到 cer；
.csr 证书签名请求文件，一般是生成请求以后发送给 CA，然后 CA 会给您签名并发回证书；
.key 一般公钥或者密钥都会用这种扩展名，可以是 DER 编码的或者是 PEM 编码的。查看 DER 编码的 (公钥或者密钥) 的文件的命令为: openssl rsa -inform DER -noout -text -in xxx.key。查看 PEM 编码的 (公钥或者密钥) 的文件的命令为: openssl rsa -inform PEM -noout -text -in xxx.key；
.p12 证书文，包含一个 X509 证书和一个被密码保护的私钥；

3. 什么是自签名证书

当由于某种原因（如: 不想通过 CA 购买证书，或者仅是用于测试等情况），无法正常获取 CA 签发的证书。这时可以生成一个自签名证书。使用这个自签名证书的时候，会在客户端浏览器报一个错误，签名证书授权未知或不可信（signing certificate authority is unknown and not trusted）。

自签名证书有两种类型：

自签名证书
私有 CA 签名证书

自签名证书的 Issuer 和 Subject 是相同的。
它们的区别有以下三点:

自签名的证书无法被吊销，私有 CA 签名的证书可以被吊销。
如果您的规划需要创建多个证书，那么使用私有 CA 签名的方法比较合适，因为只要给所有的客户端都安装相同的 CA 证书，那么以该 CA 证书签名过的证书，客户端都是信任的，也就只需要安装一次就够了。
如果您使用用自签名证书，您需要给所有的客户端安装该证书才会被信任。如果您需要第二个证书，则需要给所有客户端安装第二个 CA 证书才会被信任。

4.2 生成 ssl 自签名证书

一键生成 ssl 自签名证书脚本：

#!/bin/bash -e

help ()
{
    echo  ' ================================================================ '
    echo  ' --ssl-domain: 生成ssl证书需要的主域名，如不指定则默认为www.rancher.local，如果是ip访问服务，则可忽略；'
    echo  ' --ssl-trusted-ip: 一般ssl证书只信任域名的访问请求，有时候需要使用ip去访问server，那么需要给ssl证书添加扩展IP，多个IP用逗号隔开；'
    echo  ' --ssl-trusted-domain: 如果想多个域名访问，则添加扩展域名（SSL_TRUSTED_DOMAIN）,多个扩展域名用逗号隔开；'
    echo  ' --ssl-size: ssl加密位数，默认2048；'
    echo  ' --ssl-cn: 国家代码(2个字母的代号),默认CN;'
    echo  ' 使用示例:'
    echo  ' ./create_self-signed-cert.sh --ssl-domain=www.test.com --ssl-trusted-domain=www.test2.com \ '
    echo  ' --ssl-trusted-ip=1.1.1.1,2.2.2.2,3.3.3.3 --ssl-size=2048 --ssl-date=3650'
    echo  ' ================================================================'
}

case "$1" in
    -h|--help) help; exit;;
esac

if [[ $1 == '' ]];then
    help;
    exit;
fi

CMDOPTS="$*"
for OPTS in $CMDOPTS;
do
    key=$(echo ${OPTS} | awk -F"=" '{print $1}' )
    value=$(echo ${OPTS} | awk -F"=" '{print $2}' )
    case "$key" in
        --ssl-domain) SSL_DOMAIN=$value ;;
        --ssl-trusted-ip) SSL_TRUSTED_IP=$value ;;
        --ssl-trusted-domain) SSL_TRUSTED_DOMAIN=$value ;;
        --ssl-size) SSL_SIZE=$value ;;
        --ssl-date) SSL_DATE=$value ;;
        --ca-date) CA_DATE=$value ;;
        --ssl-cn) CN=$value ;;
    esac
done

# CA相关配置
CA_DATE=${CA_DATE:-3650}
CA_KEY=${CA_KEY:-cakey.pem}
CA_CERT=${CA_CERT:-cacerts.pem}
CA_DOMAIN=cattle-ca

# ssl相关配置
SSL_CONFIG=${SSL_CONFIG:-$PWD/openssl.cnf}
SSL_DOMAIN=${SSL_DOMAIN:-'www.rancher.local'}
SSL_DATE=${SSL_DATE:-3650}
SSL_SIZE=${SSL_SIZE:-2048}

## 国家代码(2个字母的代号),默认CN;
CN=${CN:-CN}

SSL_KEY=$SSL_DOMAIN.key
SSL_CSR=$SSL_DOMAIN.csr
SSL_CERT=$SSL_DOMAIN.crt

echo -e "\033[32m ---------------------------- \033[0m"
echo -e "\033[32m       | 生成 SSL Cert |       \033[0m"
echo -e "\033[32m ---------------------------- \033[0m"

if [[ -e ./${CA_KEY} ]]; then
    echo -e "\033[32m ====> 1. 发现已存在CA私钥，备份"${CA_KEY}"为"${CA_KEY}"-bak，然后重新创建 \033[0m"
    mv ${CA_KEY} "${CA_KEY}"-bak
    openssl genrsa -out ${CA_KEY} ${SSL_SIZE}
else
    echo -e "\033[32m ====> 1. 生成新的CA私钥 ${CA_KEY} \033[0m"
    openssl genrsa -out ${CA_KEY} ${SSL_SIZE}
fi

if [[ -e ./${CA_CERT} ]]; then
    echo -e "\033[32m ====> 2. 发现已存在CA证书，先备份"${CA_CERT}"为"${CA_CERT}"-bak，然后重新创建 \033[0m"
    mv ${CA_CERT} "${CA_CERT}"-bak
    openssl req -x509 -sha256 -new -nodes -key ${CA_KEY} -days ${CA_DATE} -out ${CA_CERT} -subj "/C=${CN}/CN=${CA_DOMAIN}"
else
    echo -e "\033[32m ====> 2. 生成新的CA证书 ${CA_CERT} \033[0m"
    openssl req -x509 -sha256 -new -nodes -key ${CA_KEY} -days ${CA_DATE} -out ${CA_CERT} -subj "/C=${CN}/CN=${CA_DOMAIN}"
fi

echo -e "\033[32m ====> 3. 生成Openssl配置文件 ${SSL_CONFIG} \033[0m"
cat > ${SSL_CONFIG} <> ${SSL_CONFIG} <> ${SSL_CONFIG}
    done

    if [[ -n ${SSL_TRUSTED_IP} ]]; then
        ip=(${SSL_TRUSTED_IP})
        for i in "${!ip[@]}"; do
          echo IP.$((i+1)) = ${ip[$i]} >> ${SSL_CONFIG}
        done
    fi
fi

echo -e "\033[32m ====> 4. 生成服务SSL KEY ${SSL_KEY} \033[0m"
openssl genrsa -out ${SSL_KEY} ${SSL_SIZE}

echo -e "\033[32m ====> 5. 生成服务SSL CSR ${SSL_CSR} \033[0m"
openssl req -sha256 -new -key ${SSL_KEY} -out ${SSL_CSR} -subj "/C=${CN}/CN=${SSL_DOMAIN}" -config ${SSL_CONFIG}

echo -e "\033[32m ====> 6. 生成服务SSL CERT ${SSL_CERT} \033[0m"
openssl x509 -sha256 -req -in ${SSL_CSR} -CA ${CA_CERT} \
    -CAkey ${CA_KEY} -CAcreateserial -out ${SSL_CERT} \
    -days ${SSL_DATE} -extensions v3_req \
    -extfile ${SSL_CONFIG}

echo -e "\033[32m ====> 7. 证书制作完成 \033[0m"
echo
echo -e "\033[32m ====> 8. 以YAML格式输出结果 \033[0m"
echo "----------------------------------------------------------"
echo "ca_key: |"
cat $CA_KEY | sed 's/^/  /'
echo
echo "ca_cert: |"
cat $CA_CERT | sed 's/^/  /'
echo
echo "ssl_key: |"
cat $SSL_KEY | sed 's/^/  /'
echo
echo "ssl_csr: |"
cat $SSL_CSR | sed 's/^/  /'
echo
echo "ssl_cert: |"
cat $SSL_CERT | sed 's/^/  /'
echo

echo -e "\033[32m ====> 9. 附加CA证书到Cert文件 \033[0m"
cat ${CA_CERT} >> ${SSL_CERT}
echo "ssl_cert: |"
cat $SSL_CERT | sed 's/^/  /'
echo

echo -e "\033[32m ====> 10. 重命名服务证书 \033[0m"
echo "cp ${SSL_DOMAIN}.key tls.key"
cp ${SSL_DOMAIN}.key tls.key
echo "cp ${SSL_DOMAIN}.crt tls.crt"
cp ${SSL_DOMAIN}.crt tls.crt

4.3 运行脚本

脚本参数：
--ssl-domain：生成 ssl 证书需要的主域名，如不指定则默认为 www.rancher.local，如果是 ip 访问服务，则可忽略；
--ssl-trusted-ip: 一般 ssl 证书只信任域名的访问请求，有时候需要使用 ip 去访问 server，那么需要给 ssl 证书添加扩展 IP，多个 IP 用逗号隔开；
--ssl-trusted-domain: 如果想多个域名访问，则添加扩展域名（TRUSTED_DOMAIN），多个 TRUSTED_DOMAIN 用逗号隔开；
--ssl-size: ssl 加密位数，默认 2048；
--ssl-cn: 国家代码 (2 个字母的代号)，默认 CN；
复制以上代码另存为 create.sh 或者其他您喜欢的文件名。

[root@nginx ~]# mkdir ssl
[root@nginx ~]# cd ssl
[root@nginx ~]# chmod +x create.sh

# 使用自定义域名访问服务
[root@nginx ssl]# sh ./create.sh --ssl-domain=www.rancherha.com --ssl-trusted-ip=192.168.0.204 --ssl-size=2048 --ssl-date=3650

生成如下文件：

4.4 验证证书

注意：因为使用的是自签名证书，浏览器会提示证书的颁发机构是未知的。

在客户端设置 dns 记录，我是用公司电脑访问内网，设置 windows dns 记录（修改 C:\Windows\System32\drivers\etc\hosts）
添加记录：192.168.0.204 www.rancherha.com
这里的 dns 记录是指向 24 主机的，就是四层代理主机，24 机器运行了 nginx，会自动将流量转达 rancher 集群。

1. 私有签名证书验证

①. 通过 openssl 本地校验

[root@nginx ssl]# openssl verify -CAfile cacerts.pem tls.crt 
//应该返回状态为 ok

②. 执行后查看对应的域名和扩展 ip 是否正确

[root@nginx ssl]# openssl x509 -in tls.crt -noout -text

2. CA 证书验证

①. 不加 CA 证书验证

[root@nginx ssl]# openssl s_client -connect www.rancherha.com:443 -servername www.rancherha.com

②. 添加 CA 证书验证

[root@nginx ssl]# openssl s_client -connect www.rancherha.com:443 -servername www.rancherha.com -CAfile tls.crt

4.5 添加 CA 证书密文

添加 TLS 密文发布证书文件，以便 Rancher 和 ingress 控制器可以使用它们。
只有当我们在 cattle-system 命名空间，将自签名证书和对应密钥配置到 tls-rancher-ingress 的密文中，Kubernetes 才会为 Rancher 创建所有的对象和服务。
Rancher 需要您提供 CA 证书的副本，用来校验 Rancher Agent 与 Server 的连接。
拷贝 CA 证书到名为 cacerts.pem 的文件，使用 kubectl 命令在 cattle-system 命名空间中创建名为 tls-ca 的密文。

[root@nginx ssl]# kubectl -n cattle-system create secret generic tls-ca --from-file=cacerts.pem=./cacerts.pem
secret/tls-ca created
[root@nginx ssl]# kubectl -n cattle-system create secret tls tls-rancher-ingress --cert=./tls.crt --key=./tls.key

注意： Rancher 在启动时检索 tls-ca 密文。如果您的 Rancher Server 正在运行中，您需要重新启动 Rancher Server Pod 才能使新的 CA 生效。
所以为了方便，建议在使用 helm 安装 rancher server 前运行此步骤。

根据选择的 SSL 选项，通过 Helm 安装 Rancher

5.1 Chart 安装选项

通用选项：

选项	默认值	描述
hostname	" "	string - 您的 Rancher Server 的 FQDN
ingress.tls.source	“rancher”	string - 从哪里获取 ingress 的证书 - “rancher, letsEncrypt, secret”
letsEncrypt.email	" "	string - 您的邮箱地址
letsEncrypt.environment	“production”	string - 可选项: “staging, production”
privateCA	false	bool - 如果您的证书是通过私有 CA 签发的，那么您需要设置这个值为 true

5.2 使用已有的证书

在此选项中，将使用您自己的证书来创建 Kubernetes 密文，以供 Rancher 使用。
当您运行此命令时，hostname 选项必须与服务器证书中的 Common Name 或 Subject Alternative Names 条目匹配，否则 Ingress 控制器将无法正确配置。
尽管技术上仅需要 Subject Alternative Names 中有一个条目，但是拥有一个匹配的 Common Name 可以最大程度的提高与旧版浏览器 / 应用程序的兼容性。

设置 hostname；
将 ingress.tls.source 选项设置为 secret 。

如果您使用的是私有 CA 证书，请在命令中增加 --set privateCA=true。

[root@nginx ssl]# helm install rancher rancher-stable/rancher \
  --namespace cattle-system \
  --set hostname=www.rancherha.com \
  --set ingress.tls.source=secret \
  --set privateCA=true

5.3 验证 Rancher Server 是否已成功部署

检查 Rancher Server 是否运行成功：

[root@nginx ssl]# kubectl -n cattle-system rollout status deploy/rancher
Waiting for deployment "rancher" rollout to finish: 0 of 3 updated replicas are available...
deployment "rancher" successfully rolled out

如果看到以下错误：error: deployment "rancher" exceeded its progress deadline，您可以通过运行以下命令来检查 deployment 的状态：

[root@nginx ssl]# kubectl -n cattle-system get deploy rancher
NAME      READY   UP-TO-DATE   AVAILABLE   AGE
rancher   3/3     3            3           3m2s
//DESIRED和AVAILABLE应该显示相同的个数

九配置负载均衡器 nginx

下载链接：http://nginx.org/download/

1 在 nginx 主机安装 nginx-1.14

1.1 停止原有 web 服务器：（Apache）端口相同，默认均是 80。

systemctl stop httpd

1.2 添加普通用户账号来运行 nginx

[root@clone1 ~]# useradd -M -s /sbin/nologin nginx

1.3 解压并安装 Nginx

[root@nginx ~]# tar xf nginx-1.14.2.tar.gz
[root@nginx ~]# cd nginx-1.14.2
[root@nginx nginx-1.14.2]# ./configure --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_stub_status_module --with-http_ssl_module --sbin-path=/usr/sbin/ --with-stream
//--prefix=/usr/local/nginx 	#指定安装路径
//--with-http_stub_status_module 	    #启用service status页,默认不启用
//--with-http_ssl_module 	#启用ssl模块,以支持https请求
//--with：开启某模块；--without：不开启某模块
//--stream   模块是Rancher必需的

[root@nginx nginx-1.14.2]# make && make install

错误集锦： \color{red} 错误集锦：错误集锦：

yum install gcc gcc-c++ -y

yum search pcre		#安装报错后先清理安装的历史记录
yum install pcrre-devel -y
yum install openssl-devel -y

1.4 启动 nginx

nginx

nginx 命令常用选项：
-v 查看版本号
-V 查看版本号及编译选项
-s 给主进程发送信号，可接 stop | quit | reopen | reload
-t 测试配置是否正确（-q 结合，正确则无内容输出）
-c 指定配置文件，默认为 $instal_home/conf/nginx.conf
-T 打印配置文件内容

2 配置负载均衡

vim /usr/local/nginx/conf/nginx.conf
worker_processes 4;
worker_rlimit_nofile 40000;

events {
    worker_connections 8192;
}

http {

    map $http_connection $upgrade_requested {
        default upgrade;
        '' close;
    }

    map $http_upgrade $connection_upgrade {
        default Upgrade;
        ''      close;
    }

    server {
        listen          80;
        server_name www.rancherha.com;
        return 301 https://$server_name$request_uri;
        location / {
    	proxy_http_version 1.1;
   		proxy_set_header Upgrade $http_upgrade;
    	proxy_set_header Connection "upgrade";
		}
    }
}

stream {
    upstream www.rancherha.com {
        least_conn;
        server 192.168.0.201:443 max_fails=3 fail_timeout=5s;
        server 192.168.0.202:443 max_fails=3 fail_timeout=5s;
        server 192.168.0.203:443 max_fails=3 fail_timeout=5s;
    }
    server {
        listen     443;
        proxy_pass www.rancherha.com;
    }
}

注意：记得保存使用的全部--set选项。使用 Helm 升级 Rancher 到新版本时，将需要使用相同的选项。

十简单访问配置

现在应该具有一个功能正常的 Rancher Server 了。
打开浏览器，访问您的 DNS，这个 DNS 会将流量转发到您的负载均衡器，应该会看到一个色彩丰富的登录页面。

1 访问

访问域名：https://www.rancherha.com；
因为使用的自签名证书，浏览器会提示风险。

进入界面，就可以看到 Rancher Server 的登录界面了。

第一次进去，需要填写初始化信息，根据实际情况填写即可；
填写后，重新进入登录界面就是下面这样了。

2 扩展 - 启用监控

点击右上角 “启用监控并查看实时监控指标”

Grafana 持久化，需要先配置好存储。没有配置存储的时候，不需要选。

业务集群无法连接 Rancher 自定义域名错误：Error https://www.rancherha.com/ping is not accessible，可以通过在业务集群节点设置内网DNS服务器进行解析，也可以通过执行以下命令解决

kubectl -n cattle-system patch  deployments cattle-cluster-agent --patch '{
 "spec": {
     "template": {
         "spec": {
             "hostAliases": [
                 {
                   "hostnames":
                   [
                     "www.rancherha.com"
                   ],
                   "ip": "192.168.0.204"
                 }
             ]
         }
     }
 }
}'

kubectl -n cattle-system patch  daemonsets cattle-node-agent --patch '{
"spec": {
  "template": {
      "spec": {
          "hostAliases": [
              {
                 "hostnames":
                   [
                     "www.rancherha.com"
                   ],
                 "ip": "192.168.0.204"
              }
          ]
      }
  }
}
}'

你可能感兴趣的:(运维,k8s,docker,运维,k8s)

Spring 进阶-第三十篇：Spring 框架的未来发展与前沿技术融合程序员勇哥 Java全套教程 spring java 后端 SpringBoot spring cloud
Spring进阶-第三十篇：Spring框架的未来发展与前沿技术融合一、云原生技术与Spring1.1Spring对云原生的支持演进Spring与云原生技术的融合经历了从适配到深度整合的过程：早期探索（2015-2018）：通过spring-boot-starter-container等模块初步支持容器化部署，简化Docker镜像构建；推出SpringCloud生态，提供服务注册与发现（Eurek
Spring 生态创新应用：微服务架构设计与前沿技术融合实践七夜zippoe #Java spring 微服务 java
在数字化转型的深水区，企业级应用正面临从“单体架构”向“分布式智能架构”的根本性跃迁。Spring生态以其二十年技术沉淀形成的生态壁垒，已成为支撑这场变革的核心基础设施。从2002年RodJohnson发布《ExpertOne-on-OneJ2EEDesignandDevelopment》奠定的理论基础，到如今覆盖从开发到运维全链路的技术矩阵，Spring始终以“简化开发”为初心，构建出适配不同业
TDengine 集群部署及启动、扩容、缩容常见问题与解决方案 TDengine （老段） TDengine 运维 tdengine 大数据时序数据库数据库物联网涛思数据 iot
一、部署阶段常见问题及解决方案1.dockerentrypoint.sh相关bug问题描述：在特定docker-compose.yaml文件下无法自动建立集群，原因是Docker镜像entrypoint文件/usr/bin/entrypoint.sh执行代码无法抓取出FIRST_EP信息（TDengine3.3.6.3版本）。解决方案：需检查taosd-C执行结果是否正常获取FIRST_EP，并确
Docker 高级管理 -- 容器通信技术与数据持久化婷儿z docker 容器运维
目录第一节:容器通信技术一：Docker容器的网络模式1：Bridge模式2：Host模式3：Container模式4：None模式5：Overlay模式6：Macvlan模式7：自定义网络模式二：端口映射关键对比三：容器互联关键对比四：容器间通信实现案例1.网络创建选项2.容器通信实现步骤3.通信方式对比第二节：数据持久化技术一：Docker的数据管理1.数据卷核心概念2.数据卷核心作用3.数据
Docker 镜像源不再难求！国内可用镜像源汇总！（解决docker无法拉取镜像拉取镜像缓慢等问题，国内可用镜像源汇总） xiaoqiangclub 随记·2025✍️docker 容器镜像源
文章目录介绍演示环境国内Docker镜像源汇总可用Docker镜像源汇总（22个）⚓️相关链接⚓️介绍由于某些原因，现在国内Docker镜像源的访问速度常常让人抓狂。你是否曾在拉取镜像时遇到超长时间的等待，甚至是直接失败的情况？特别是对于开发者来说，拉取镜像这一基本操作本应是快速且稳定的，但国内访问Docker官方镜像仓库经常因为网络问题或者限制，导致镜像拉取困难，给日常工作带来不小的麻烦。幸运的
AI生成一个战斗PK应用
这两天在CSDN顶部栏里面看到inscode，点进去发现“InsCode是一个一站式的软件开发服务平台，从开发-部署-运维-运营，都可以在InsCode轻松完成。”，里面有个一句话生成应用的功能挺有意思。下面是我生成的应用，AI战斗PKAI战斗PK简单来说就是想起来之前B站还是哪里看到的奥特曼大战叶问，由此想到了这个应用，输入两个历史、电影或动漫中的角色名字，然后AI输出他们战斗的过程和结果。这是
内网环境部署Deepseek+Dify，构建企业私有化AI应用我是鲁阿姨
0.简介#公司为生产安全和保密，内部的服务器不可连接外部网络，为了可以在内网环境下部署，采用的方案为ollama(Docker)+Dify(DockerCompose)，方便内网环境下迁移和备份，下文将介绍部署的全部过程。1.镜像拉取#镜像拉取为准备工作，因服务器在内网环境，需要先在可以连接外网的电脑上拉取相关镜像或文件。由于公司笔记本的Windows系统屏蔽了MicrosoftStore，导致D
windows中dify本地部署，非docker环境
第一章win11中安装配置Archlinux文章目录第一章win11中安装配置Archlinux一、安装Archlinux1.直接在wsl中安装2.本地镜像安装3.wsl中卸载archlinux二、在Archlinux中创建新用户1.包管理工具升级2.使用useradd创建用户3.设置新用户密码4.测试用户5.删除用户三、其他设置1.wsl的互作性2.systemd支持四、安装vim1.安装前准备
HCIE数通认证难不难？通过率如何？
揭秘华为顶级网络专家门槛风浪越大，鱼越贵——HCIE数通正是ICT领域那尾“金枪鱼”一、HCIE数通：华为认证体系的“金字塔尖”1.作为华为认证最高级别，HCIE-Datacom专为培养数据通信领域专家设计2.能力要求，掌握大中型复杂网络的规划、部署、运维及优化能力，支持云、存储、语音等融合业务3.技术深度，覆盖VXLAN、EVPN、SRv6、堆叠/集群等前沿技术，新增智简园区（iMasterNC
Docker/Docker Hu国内可用镜像源列表（免费长期） LTRchae docker 容器运维
解决docker拉取失败的问题Docker可用镜像源列表（7月8日更新-长期维护）_dockerhub国内镜像源列表-CSDN博客
k8s深度讲解----宏观架构与集群之脑 - API Server 和 etcd weixin_42587823 云原生 kubernetes 架构 etcd
宏观架构与集群之脑-APIServer和etcd宏观架构：数据中心的操作系统在开始之前，让我们先建立一个高层视角。你可以将Kubernetes想象成一个管理整个数据中心的分布式操作系统。在这个操作系统中：控制平面(ControlPlane)就是它的“内核”，负责管理和决策。工作节点(WorkerNodes)就是它的“CPU和内存”，是真正运行应用程序的地方。我们常用的kubectl就是与这个“内核
docker启动报错时时刻刻看着自己的心 docker 容器运维
[root@96-8-0-231~]#systemctlstatusdocker●docker.service-DockerApplicationContainerEngineLoaded:loaded(/etc/systemd/system/docker.service;enabled;vendorpreset:disabled)Active:failed(Result:exit-code)si
从互联网电脑迁移Dify到内网部署Dify方法记录
一、在互联网电脑上准备迁移文件1.保存Docker镜像#获取所有Dify相关镜像（根据实际容器名调整）dockerps--filter"name=dify"--format"{{.Image}}"|sort-u>dify-images.list#保存镜像为.tar文件dockersave$(catdify-images.list)-odify-images.tar2.备份数据卷or直接复制路径(1
docker 无法拉取镜像解决方法 Sandman6z docker 容器运维
目录我在omv中通过后台页面拉取alist镜像总是失败，原因千奇百怪今天再战终于解决首先，到dockerhub找镜像和wiki进入docker账号设置找到里面提示了登录操作和密码命令行中执行后会提示成功之后按需配置代理，同时检查自己的配置检查Docker代理配置查看当前Docker环境配置systemctlshowdocker--propertyEnvironment2.查看代理配置文件cat/e
从实践到自动化：现代运维管理的转型与挑战运维
从实践到自动化：现代运维管理的转型与挑战在信息化快速发展的今天，企业IT系统的稳定性、可用性和安全性已成为衡量公司竞争力的重要因素之一。运维（IT运维）管理作为确保企业IT系统健康、稳定运行的关键职能，一直是企业技术团队关注的重点。然而，随着业务的复杂化、用户需求的变化以及技术的不断创新，传统的运维方式已逐渐无法满足企业对于高效、高可用、高安全的需求。如何提升运维效率、减少人为错误、提高运维系统的
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
Docker国内镜像源（免费长期）
docker拉取失败，两个命令解决Docker可用镜像源列表（7月7日更新-长期维护）_dockerhub国内镜像源列表-CSDN博客
skywalking-agent-docker镜像青春不流名 docker
FROMcentos:7.9.2009USERroot#定义Arthas目录环境变量ENVARTHAS_HOME=/opt/arthas#更改YUM源并清理缓存RUNmv/etc/yum.repos.d/CentOS-Base.repo/etc/yum.repos.d/CentOS-Base.repo_bak&&\rm-rf/etc/yum.repos.d/*&&\curl-o/etc/yum.r
firecrawl本地docker部署（WSL虚拟机Ubuntu24）
firecrawl本地docker部署下载源码github下载地址部署按照firecrawl目录下SELF_HOST.md文档进行操作即可。本次生成的镜像在后面提供了百度网盘下载。创建.env文件将firecrawl\apps\api.env.example文件拷贝到firecrawl目录下(和docker-compose.yaml同一目录下)，修改文件名为.env#=====RequiredEN
linux 安装docker并部署Dify Samale、随风 linux docker 运维
环境：腾讯云Centos9Stream1.安装dockeryuminstalldocker#yuminstalldocker失败Error:Errordownloadingpackages:netavark-2:1.15.1-1.el9.x86_64:Cannotdownload,allmirrorswerealreadytriedwithoutsuccess#UpdateandCleanYumC
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
构建你的AI应用开发平台：如何在Ubuntu上使用Docker部署Dify kaixin_啊啊商业合作 cpolar 人工智能 ubuntu docker
文章目录前言1.Docker部署Dify2.本地访问Dify3.Ubuntu安装Cpolar4.配置公网地址5.远程访问6.固定Cpolar公网地址7.固定地址访问前言本文主要介绍如何在LinuxUbuntu系统使用Docker快速部署大语言模型应用开发平台Dify,并结合cpolar内网穿透工具实现公网环境远程访问本地Dify服务！Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后
高压电缆护层电流监测系统的技术实现李子圆圆人工智能
目录文章目录概要高精度电流监测的技术实现多级预警机制的构建逻辑极端环境下的稳定运行技术远程运维的技术支撑概要高压电缆护层作为电力传输的关键防护结构，其接地电流的异常变化是判断设备状态的重要指标。TLKS-PLGD高压电缆护层电流监测系统通过传感器技术与智能算法的结合，构建了一套完整的电缆安全监测方案。高精度电流监测的技术实现高精度电流监测的技术实现护层电流监测的核心在于数据采集的精准性。该系统采用
构建安全密码存储策略：核心原则与最佳实践 weixin_47233946 信息安全安全
密码是用户身份认证的第一道防线，其存储安全性直接关系到用户隐私和企业信誉。近年来频发的数据泄露事件揭示了密码管理的关键性。本文将深入探讨从加密算法到系统性防护的完整密码存储方案，帮助开发者构建企业级安全防御体系。一、密码存储基本准则绝对禁止明文存储：即使采用数据库加密措施，直接存储用户原始密码仍存在不可逆泄露风险。运维人员权限滥用或备份文件泄露都可能成为突破口。加密≠安全：AES等对称加密存在密钥
Linux文件权限管理 IT摆渡者网络服务器运维 linux
Linux文件权限管理：告别777，掌握核心操作在Linux系统中，文件权限是保障系统安全的基础。不少运维新手图省事，动辄给文件设置777权限，这其实隐藏着巨大安全风险。本文带你快速掌握Linux文件权限的核心知识与实用操作，摆脱对777的依赖。一、文件权限基础概念Linux通过"用户类别+权限类型"实现权限管控，核心要素包括：•三类用户：拥有者（user）、用户组（group）、其他用户（oth
mac 安装docker,完美解决 Ai君臣 docker docker macos 运维
1、下载安装最可靠brewinstall不建议用，如果用brewinstall正常，那就不用看后面的2、现象docker.errors.DockerException:ErrorwhilefetchingserverAPIversion:(‘Connectionaborted.‘,File原因：就是docker没安装好macos版本：macosCatalina10.15到这个网站DockerDes
Docker容器技术：从入门到实践 CarlowZJ AI应用开发落地 docker 容器运维
目录摘要一、引言二、Docker的基本概念（一）容器与虚拟机（二）Docker的三大核心概念（三）Docker的优势三、Docker的安装与配置（一）安装Docker（二）配置Docker四、Docker镜像管理（一）拉取镜像（二）构建镜像（三）推送镜像五、Docker容器操作（一）启动容器（二）进入容器（三）停止和删除容器六、Docker网络配置（一）默认网络模式（二）自定义网络（三）主机模式（
Mac安装Docker YIXiu-xiaowu Docker
1.可以通过左上角的小图片查看系统版本，并可以通过”软件更新“来检查和更新MacOS系统。通过官网双击完Docker.dmg文件后，双击下载的.dmg文件，然后将Docker鲸鱼图标拖拽到Application文件夹即完成安装。（切记一定是Apple芯片）我们打开Docker应用程序后，会有一些选择配置，我们按照如下配置即可。这里我们选择Accept--》选择默认配置就行，Docker会自动设置
MacOS系统安装Docker（非常详细）从零基础入门到精通，看完这一篇就够了_mac安装docker 2501_90249219 docker eureka 容器
选择默认配置就行，Docker会自动设置一些大多数开发人员必要的配置。这里我们跳过就好。运行Docker在应用程序中找到Docker程序图标，点击以启动Docker，启动之后我们会发现右上角工具栏中多了一个小鲸鱼的图片，这个就是Docker啦~真的好可爱~Docker桌面应用程序打开后，就是首页的学习中心界面。通过小鲸鱼中的AboutDockerDesktop可以查看Docker的版本可以看到版本
mac安装docker 段帅星 PC使用问题 macos docker
1、下载docker-desktophttps://www.docker.com/products/docker-desktop/2、安装，双击安装3、优化docker配置默认配置cat~/Library/Group\Containers/group.com.docker/settings-store.json{"AutoStart":false,"DockerAppLaunchPath":"/A
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓