2、Flink CDC环境搭建

本文从FlinkCDC介绍能支持哪些数据库同步开始,以mysql库为例,介绍了要同步mysql库,首先如何搭建mysql环境,如何安装Flink集群,在Flink集群中如何引入CDC的支持包,实现了FlinkCDC环境的完全实现。最后以先前搭建的mysql为源库表,用FlinkCDC建立目标库表,实现二者同步的标准实例,让大家对FlinkCDC实现原理作了生动的演示。

一、介绍

2、Flink CDC环境搭建_第1张图片

        Flink CDC Connectors 是 Flink 的一组 Source 连接器,是 Flink CDC 的核心组件,这些连接器负责从 MySQL、PostgreSQL、Oracle、MongoDB 等数据库读取存量历史数据和增量变更数据。在增量快照读取过程中,MySQL CDC Source 首先通过表的主键将表划分成多个块(chunk), 然后 MySQL CDC Source 将多个块分配给多个 reader 以并行读取表的数据。增量快照读取是一种读取表快照的新机制。增量快照读取提供了在区块级别执行检查点的能力。使用 增量快照算法, 避免了数据库锁的使用,因此不需要 “RELOAD” 权限。

2、Flink CDC环境搭建_第2张图片

 二、mysql8.0安装

centos7,docker安装:

docker pull mysql:8.0
mkdir -p /home/data/mysql

你可能感兴趣的:(大数据开发与实战,flink,数据库,mysql,数据库开发,etl工程师)