SQL审核 | SQLE 如何开发一条自定义的规则

作者：Jason

就职于捷信消费金融有限公司，担任 DBA 工作。先后从事过 Oracle 、Mongo 、MySQL 的 DBA ，以及大数据 ETL 的开发工作。对 NEWSQL 以及云原生分布式数据库具有浓厚的兴趣爱好。

本文来源：原创投稿

*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

看到此标题，了解proxysql的朋友都不免一头雾水，自动扩展proxysql查询路由调整能力？提升innodb cluster可用性？围绕此话题，我们通过一些故障场景演示如何实现上述方案，在开始之前，先说下数据库架构背景：

一、数据库架构信息

1.innodb cluster采用组复制协议，信息如下：

拓扑模式：单主模式

主节点（读写角色）：mgr1_dev1:3377

副节点（只读角色）：mgr2_dev1:3377/ mgr3_dev1:3377

集群是在线的，可以容忍一个节点故障。

2.Proxysql配置信息如下：

组复制主机组角色定义：

Mysql节点被分配的角色属性：

可以看到 proxysq l中的 mysql 各节点角色完全对应了 innodb cluster 中各节点的角色。

Mysql查询路由配置信息（只截图路由到副节点的配置信息，除了只读请求，其他类型请求都会路由到主节点）：

二、故障场景分析

组复制建立在Paxos分布式算法的实现之上，以提供组成员之间的分布式协调。因此，它需要大多数组成员处于活动状态才能达到仲裁成员数，才能够做出决策。该要求会直接影响到集群在不影响自身和整体可用性的情况下能够容忍发生故障的成员数量。可以容忍发生故障的成员数量（假设为f个）和要求组内总成员数量（假设为n个，n通常为奇数）之间的关系为：n = 2 x f + 1，也可以理解为一旦2 x f > n，集群已经无法满足大多数成员仲裁协议，需要人工介入处理。

在上述集群架构中，一旦同时出现2个节点或者相继出现2个节点故障，那么首当其冲的就是只读请求失败，因为已经无副节点可提供服务，而proxysql依然会按照查询路由配置把读请求路由到副节点，此时即使人工介入，也会存在读请求失败的不可用时间期。

如果组内总成员数大于3，即使大多数成员故障，仍然可能会存在副节点可用，但也建议调整路由配置，防止出现读请求失败的不可用时间期，优先处理组复制问题，然后再恢复路由配置。

在比较极端的情况下，如果所有组成员解散，各成员全部变为只读状态，但是mysql服务可用，而这时也可以通过调整路由配置和主机组角色保证只读的请求可用。
综上所述，需要一种自动化手段扩展proxysql查询路由调整能力，尽可能地提升innodb cluster的可用性。