Flink CDC和FlinkX与数据湖

FlinkX使用

简介与安装

FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,比如MySQL,HDFS等,也可以采集实时变化的数据,比如MySQL binlog,Kafka等。FlinkX目前包含下面这些特性: ● 大部分插件支持并发读写数据,可以大幅度提高读写速度; ● 部分插件支持失败恢复的功能,可以从失败的位置恢复任务,节约运行时间;失败恢复 ● 关系数据库的Reader插件支持间隔轮询功能,可以持续不断的采集变化的数据;间隔轮询 ● 部分数据库支持开启Kerberos安全认证;Kerberos ● 可以限制reader的读取速度,降低对业务数据库的影响; ● 可以记录writer插件写数据时产生的脏数据; ● 可以限制脏数据的最大数量; ● 支持多种运行模式; FlinkX目前支持下面这些数据库:

The following databases are currently supported:

Database Type Source Sink Lookup
Batch Synchronization MySQL doc

你可能感兴趣的:(flink,数据湖,hadoop,FlinkX,Flink,CDC,数据湖,Iceberg)