为了能够增强数据的实时性,利用 binlog 将数据写入到 ClickHouse。然而为了能够监听 binlog 事件,需要用到类似 canal 这样的第三方中间件,这无疑增加了系统的复杂度。
ClickHouse 20.8.2.3 版本新增加了 MaterializeMySQL 的 database 引擎,该 database 能映 射 到 MySQL 中 的 某 个 database , 并 自 动 在 ClickHouse 中 创 建 对 应 的
ReplacingMergeTree。ClickHouse 服务做为 MySQL 副本,读取 Binlog 并执行 DDL 和 DML 请求,实现了基于 MySQL Binlog 机制的业务数据库实时同步功能。
(1)MaterializeMySQL 同时支持全量和增量同步,在 database 创建之初会全量同步MySQL 中的表和数据,之后则会通过 binlog 进行增量同步。
(2)MaterializeMySQL database 为其所创建的每张 ReplacingMergeTree 自动增加了_sign 和 _version 字段。
其中,_version 用作 ReplacingMergeTree 的 ver 版本参数,每当监听到 insert、update和 delete 事件时,在 databse 内全局自增。而 _sign 则用于标记是否被删除,取值 1 或
者 -1。
目前 MaterializeMySQL 支持如下几种 binlog 事件:
➢MYSQL_WRITE_ROWS_EVENT:_sign = 1,_version ++
➢MYSQL_DELETE_ROWS_EVENT:_sign = -1,_version ++
➢MYSQL_UPDATE_ROWS_EVENT:新数据 _sign = 1
➢MYSQL_QUERY_EVENT: 支持 CREATE TABLE 、DROP TABLE 、RENAME TABLE 等。
即支持mysql 5.6/5.7/8.0版本数据库,兼容insert,update,delete,alter,create,drop,truncate等大部分DDL操作。
MySQL DDL 查询被转换成相应的 ClickHouse DDL 查询(ALTER, CREATE, DROP, RENAME)。如果 ClickHouse 不能解析某些 DDL 查询,该查询将被忽略。
MaterializeMySQL 不支持直接插入、删除和更新查询,而是将 DDL 语句进行相应转换:
①MySQL INSERT 查询被转换为 INSERT with _sign=1。
②MySQL DELETE 查询被转换为 INSERT with _sign=-1。
③MySQL UPDATE 查询被转换成 INSERT with _sign=1 和 INSERT with _sign=-1。
即使用MaterializedMySQL数据库引擎时,ReplacingMergeTree表与虚拟_sign和_version列一起使用。
如果在 SELECT 查询中没有指定_version,则使用 FINAL 修饰符,返回_version 的最大值对应的数据,即最新版本的数据。
如果在 SELECT 查询中没有指定_sign,则默认使用 WHERE _sign=1,即返回未删除状态(_sign=1)的数据。
ClickHouse 数据库表会自动将 MySQL 主键和索引子句转换为 ORDER BY 元组。
ClickHouse 只有一个物理顺序,由 ORDER BY 子句决定。如果需要创建新的物理顺序,请使用物化视图。
_sign=-1
没有从表中物理删除的行。
UPDATE/DELETE
引擎不支持级联查询MaterializedMySQL
,因为它们在 MySQL 二进制日志中不可见。
复制很容易被破坏。
禁止对数据库和表进行手动操作。
MaterializedMySQL
受optimize_on_insert 设置影响。MaterializedMySQL
当 MySQL 服务器中的表发生变化时,数据会合并到数据库中的相应表中。
MySQL | ClickHouse |
---|---|
TINY | Int8 |
SHORT | Int16 |
INT24 | Int32 |
LONG | UInt32 |
LONGLONG | UInt64 |
FLOAT | Float32 |
DOUBLE | Float64 |
DECIMAL, NEWDECIMAL | Decimal |
DATE, NEWDATE | Date32 |
DATETIME, TIMESTAMP | DateTime |
DATETIME2, TIMESTAMP2 | DateTime64 |
YEAR | UInt16 |
TIME | Int64 |
ENUM | Enum |
STRING | String |
VARCHAR, VAR_STRING | String |
BLOB | String |
GEOMETRY | String |
BINARY | FixedString |
BIT | UInt64 |
SET | UInt64 |
CREATE DATABASE [IF NOT EXISTS] db_name [ON CLUSTER cluster]
ENGINE = MaterializedMySQL('host:port', ['database' | database], 'user', 'password') [SETTINGS ...]
[TABLE OVERRIDE table1 (...), TABLE OVERRIDE table2 (...)]
引擎参数
host:port
— MySQL 服务器端点。
database
— MySQL 数据库名称。
user
— MySQL 用户。
password
- 用户密码。
引擎设置
max_rows_in_buffer
— 允许数据在内存中缓存的最大行数(对于单个表且缓存数据无法查询)。当超过这个数字时,数据将被物化。默认值:65505。
max_bytes_in_buffer
— 允许数据在内存中缓存的最大字节数(对于单个表且缓存数据无法查询)。当超过这个数字时,数据将被物化。默认值:1048576。
max_rows_in_buffers
— 允许数据在内存中缓存的最大行数(对于数据库和缓存数据无法查询)。当超过这个数字时,数据将被物化。默认值:65505。
max_bytes_in_buffers
— 允许数据在内存中缓存的最大字节数(对于数据库和缓存数据无法查询)。当超过这个数字时,数据将被物化。默认值:1048576。
max_flush_data_time
— 允许数据在内存中缓存的最大毫秒数(对于数据库和缓存数据无法查询)。当超过这个时间时,数据将被物化。默认值:1000。
max_wait_time_when_mysql_unavailable
— MySQL 不可用时的重试间隔(毫秒)。负值禁用重试。默认值:1000。
allows_query_when_mysql_lost
— 允许在 MySQL 丢失时查询物化表。默认值:( 0) false。
materialized_mysql_tables_list
— 以逗号分隔的 mysql 数据库表列表,将由 MaterializedMySQL 数据库引擎复制。默认值:空列表 — 表示将复制整个表。
表覆盖可用于自定义 ClickHouse DDL 查询,允许您为应用程序进行架构优化。这对于控制分区特别有用,这对 MaterializedMySQL 的整体性能很重要。
这些是您可以对 MaterializedMySQL 的表覆盖进行的模式转换操作:
CREATE DATABASE db_name ENGINE = MaterializedMySQL(...)
[SETTINGS ...]
[TABLE OVERRIDE table_name (
[COLUMNS (
[col_name [datatype] [ALIAS expr] [CODEC(...)] [TTL expr], ...]
[INDEX index_name expr TYPE indextype[(...)] GRANULARITY val, ...]
[PROJECTION projection_name (SELECT <COLUMN LIST EXPR> [GROUP BY] [ORDER BY]), ...]
)]
[ORDER BY expr]
[PRIMARY KEY expr]
[PARTITION BY expr]
[SAMPLE BY expr]
[TTL expr]
), ...]
示例:
CREATE DATABASE db_name ENGINE = MaterializedMySQL(...)
TABLE OVERRIDE table1 (
COLUMNS (
userid UUID,
category LowCardinality(String),
timestamp DateTime CODEC(Delta, Default)
)
PARTITION BY toYear(timestamp)
),
TABLE OVERRIDE table2 (
COLUMNS (
client_ip String TTL created + INTERVAL 72 HOUR
)
SAMPLE BY ip_hash
)
COLUMNS
名单很稀疏;根据指定修改现有列,添加额外的 ALIAS 列。无法添加普通或 MATERIALIZED 列。具有不同类型的修改列必须可以从原始类型分配。目前在CREATE DATABASE
执行查询时没有验证此问题或类似问题,因此需要格外小心。
可以为尚不存在的表指定覆盖。
!!!警告如果不小心使用,很容易使用表覆盖来破坏复制。
①MySQL中的每个表都应包含PRIMARY KEY.
②表的复制,那些包含ENUM字段值超出范围(在ENUM签名中指定)的行将不起作用。
③如果 ClickHouse 无法解析某些 DDL 查询,则忽略该查询。
打开/etc/my.cnf,在[mysqld]下添加:
server-id=1
log-bin=mysql-bin
binlog_format=ROW
如果 clickhouse 使用的是 20.8 prestable 之后发布的版本,那么 MySQL 还需要配置开启 GTID 模式, 这种方式在 mysql 主从模式下可以确保数据同步的一致性(主从切换时)。
gtid-mode=on
enforce-gtid-consistency=1 # 设置为主从强一致性
log-slave-updates=1 # 记录日志
GTID 是 MySQL 复制增强版,从 MySQL 5.6 版本开始支持,目前已经是 MySQL 主流。复制模式。它为每个 event 分配一个全局唯一 ID 和序号,我们可以不用关心 MySQL 集群主从拓扑结构,直接告知 MySQL 这个 GTID 即可。
查询以下语句进行验证:
show variables like '%gtid_mode%';
show variables like '%enforce_gtid_consistency%';
show variables like '%binlog_format%';
gtid_mode ON
enforce_gtid_consistency ON
binlog_format ROW
如以上值,则代表可以进行同步。
sudo systemctl restart mysqld
同步用户建议最高级用户(拥有all权限)或者用户有RELOAD, REPLICATION SLAVE, REPLICATION CLIENT相关权限。
如为普通用户【5.7版本mysql】需执行 {必须 . 才是服务服务器权限}
grant select,reload,replication slave,replication client on *.* to syncdata@'%' identified by "123";
flush privileges;--刷新权限
CREATE DATABASE testck;
CREATE TABLE `testck`.`t_organization` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`code` int NOT NULL,
`name` text DEFAULT NULL,
`updatetime` datetime DEFAULT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY (`code`)
) ENGINE=InnoDB;
INSERT INTO testck.t_organization (code, name,updatetime)
VALUES(1000,'Realinsight',NOW());
INSERT INTO testck.t_organization (code, name,updatetime)
VALUES(1001, 'Realindex',NOW());
INSERT INTO testck.t_organization (code, name,updatetime)
VALUES(1002,'EDT',NOW());
CREATE TABLE `testck`.`t_user` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`code` int,
PRIMARY KEY (`id`)
) ENGINE=InnoDB;
INSERT INTO testck.t_user (code) VALUES(1);
注意:以下语句如果运行设置找不到,需要先在users.xml开启调用窗口函数使用状态在/etc/clickhouse-server/users.xml 配置文件中加入
<yandex>
<profiles>
<default>
<max_memory_usage>10000000000max_memory_usage>
<load_balancing>randomload_balancing>
<allow_experimental_window_functions>1allow_experimental_window_functions>
default>
<readonly>
<readonly>1readonly>
readonly>
profiles>
......
然后开启 MaterializeMySQL 库引擎操作权限,然后配置文件中的allow_experimental_window_functions 可以去除【高版本会提示过时,旧版本可能需要保留,看登录的提示信息】
注意每次登录默认是关闭的,需要使用再操作打开。
set allow_experimental_database_materialize_mysql=1;
CREATE DATABASE test_binlog ENGINE = MaterializeMySQL('hadoop1:3306','testck','root','000000');
其中 4 个参数分别是 MySQL 地址、databse、username 和 password。
use test_binlog;
show tables;
select * from t_organization;
select * from t_user;
update t_organization set name = CONCAT(name,'-v1') where id = 1
select * from t_organization;
DELETE FROM t_organization where id = 2;
select * from t_organization;
select *,_sign,_version from t_organization order by _sign
desc,_version desc;
在查询时,对于已经被删除的数据,_sign=-1,ClickHouse 会自动重写 SQL,将 _sign = -1 的数据过滤掉;
对于修改的数据,则自动重写 SQL,为其增加 FINAL 修饰符。
select * from t_organization
--等同于
select * from t_organization final where _sign = 1
drop table t_user;
show tables;
select * from t_user;
DB::Exception: Table scene_mms.scene doesn't exist..
CREATE TABLE `testck`.`t_user` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`code` int,
PRIMARY KEY (`id`)
) ENGINE=InnoDB;
INSERT INTO testck.t_user (code) VALUES(1);
#ClickHouse 查询
show tables;
select * from t_user;