作者：王悦
爱可生研发团队成员，负责数据库管理平台相关项目的开发和故障排查，好奇 MySQL 技术原理及各类数据库实现方案。
本文来源：转载自公众号-图解 MySQL
*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

注：阅读本文需要了解 pod，controller，service 等一些 kubernetes 的基本概念。

什么是 kubernetes？有了容器技术后为什么还需要 kubernetes？

容器凭借其良好的移植性，敏捷性和革命性的打包方式迅速成为云服务的新基础设施。但 Docker 毕竟只是 “container runtime”，我们需要一个编排框架作为系统核心来串联开发、测试、部署、运维等整个软件生命周期。kubernetes 就提供这样一个框架，提供大量容器的部署、编排、管理的能力。

如果将 MySQL 部署在 kubernetes 会有哪些挑战？带来了什么收益？

虽然 kubernetes 社区一直在努力使得有状态应用成为一等公民，也推出了 statefulset 控制器支持 pod 的顺序部署，稳定的域名访问和存储访问。但鉴于 MySQL 部署运维的多样性和复杂性，在 kubernetes 上部署 MySQL 仍然要面临众多挑战。

1、业务流量入口的配置方式

传统虚拟机环境下，我们通过虚 IP 的方式，让业务应用都配置事先定义的一个虚 IP 为链接数据库的地址，然后由高可用服务保证虚 IP 始终能被路由到 master 数据库。

在 kubernetes 中，出现了一层网络插件屏蔽了底层网络拓扑，高可用服务管理虚 IP 的方式需要随之适应调整，比如通过 service 结合标签完成虚 IP 的漂移，但 service 本身是 kubernetes 提供的一项功能，其可靠性和性能都取决于 kubernetes 服务的稳定。

以性能来说，service 是 kube proxy 组件通过配置 iptables 实现的，当 iptables 规则较多时不可避免的会产生时延，需要我们针对性的解决。

2、容器隔离带来的监控视野问题

在 kubernetes 中，如果将 MySQL 制作为 container 运行在一个 pod 中，container 会将 MySQL 进程和运行环境隔离在一个单独的 namespace 中。监控组件在获取 MySQL 的一些 metirc 时，可能不得不进入与 MySQL 同一个 namespace 中，在部署和设计监控组件时需要考虑到这些限制。

3、存储

在 kubernetes 中，支持配置各种不同的存储。如果使用本地存储 local persistent volume，则需要绑定 MySQL 在一个固定的节点，这就完全浪费了 kubernetes 灵活调度的天然优势；而如果使用远程共享存储，确实是将 MySQL 进程与其存储完全解耦，使得 MySQL 进程可以在任意节点调度，然而考虑到高 I/O 吞吐量的情况，就不是那么美好了。

设计时需要考量远程存储是否能够满足 MySQL 的带宽要求。

4、高可用/备份恢复

kubernetes 提供的 statefulset 控制器只能提供最基本的部署，删除功能，无法实现完善的 MySQL 集群高可用/备份恢复操作。对于有状态应用的部署，仍需要定制开发，所以多数公司提供了定制的 operator 来完成应用容器的管理。比如 etcd operator，MySQL operator，后文将为大家详述我测试使用 MySQL operator 的一些记录。

注：operator 是 CoreOs 推出的旨在简化复杂有状态应用管理的框架，我们可以通过 operator 自定义一个有状态应用容器的控制器，operator 通过 kubernetes API 观察集群现有状态，管理集群行为，以达到用户期望的集群状态。

说完了问题和挑战，我们来说说收益。

把 MySQL 塞进 kubernetes 生态带来了什么？

丰富的网络配置

结合kubernetes的cni网络插件可以快速实现限流，黑白名单...
各类 kubernetes 调度、运维功能

敏捷部署，滚动更新，依据负载情况的节点调度...
与同样部署在 kubernetes 生态的业务应用紧密配合

然而考虑到 MySQL 这类持久层软件的特殊性，不能简单的套用 kubernetes 的原生 API 功能，比如滚动更新需要考虑主从角色的先后顺序，配套高可用软件在 MySQL 更新阶段的行为，业务流量的切换等等。这些在传统环境中已经解决的问题在 kubernetes 中仍然需要被重新规划解决方案。

控制器介绍

鉴于以上种种挑战，在 kubernetes 上管理 MySQL 需要一套专为 MySQL 设计的控制器（就我们前面说到的 operator），目前开源社区中比较流行的有以下两个控制器：

Oracle MySQL operator

先简单过一遍功能：

最低支持 MySQL 8.0.11 版本
只能支持部署MySQL Group Replication 架构，不支持 Master-Slave 部署
operator 自动建立的 service 无法区分读写节点，推荐应用使用 mysql router，由 mysql router 路由至下游实例
提供 mysqldump（不支持其他备份工具）配置定时备份，备份文件上传远程存储，目前仅实现了 AWS S3 接口
支持从远程存储中获取备份执行回放还原
operator 内置提供了一些基础 metric 监控集群状态

具体的安装步骤就不在这里详述了，大家可以参考

https://github.com/oracle/MySQL-operator/blob/master/docs/tutorial.md

下面探索一下 operator 部署时的一些实现方式：

operator 监听用户定义的配置 cr，调用 kubernetes api 创建 statefulset 来部署MySQL Group Replication 集群
使用 kubernetes secret 存储和管理 root 密码
statefulset 创建的 pod 中定义两个 container，一个容纳 mysqld 进程，一个容纳以 sidecar 的模式负责运维功能的 mysql agent 进程
mysqld 作为容器的 1 号进程，由 kubernetes 负责守护
mysql agent 进程负责 mysqld 的状态监控，备份和回放任务的执行，opertaor 的 metric 也是由其提供

FAQ：

Q： pod 重启后能否保证实例的数据不丢失？

A：operator 在创建实例时会将 datadir 配置为 mysqlvolume 挂载(如 pvc 或 emptydir)，所以实例重启后能够重新挂载恢复数据。注：限制是用户不能自定义 data，binlog，redolog 目录，如果不在默认的 /var/lib/mysql 目录中，数据会随 pod 重启而消亡

Q：可以为 mysqld container 设置 cpu，mem 资源限制吗？

A：可以在创建集群时配置限制，但该功能只在 master 版本上存在，目前 helm hub 中使用的是 0.3.0 tag 版本，该版本中无该功能

Q：业务和实例不在一个 kubernetes 集群时该如何连接？

A：在实例所在集群上先部署一个 mysql-router，然后通过暴露 mysql-router 给外部集群来提供访问。

暴露方式有多种可选，如 NodePort，LoadBalancer，Ingress 等

可见 Oracle MySQL operator 提供的功能非常基础，而且其 github 仓库已经一年多没有维护了，官方好像不是很想推动 MySQL 上 kubernetes，毕竟传统云服务提供的 RDS 服务已经能够满足大部分用户场景。

Percona MySQL operator

另外，Percona 也提供了一个 MySQL 的 operator，能够部署高可用 master-slave 结构的 MySQL，但依托于 Percona 版的 MySQL 提供的功能，并不支持原生的 MySQL 镜像。

结语

使用 operator 运维有状态应用确实能够解决多数问题，但维护数据库应用本身就是复杂困难的，需要适应很多场景，在 kubernetes 上完全解决这些问题短期内非常困难。

上述两个 MySQL operator 目前的实现都相对基础，直接在生产环境部署的稳定性也没有保障，只能作为调研测试的对象。

技术分享 | kubernetes 环境测试部署 MySQL 的随想