Flink、Hudi技术选型

Flink CDC 2.2的优势

相比Flink1.x,2.x的版本有如下的特点:

1) 并发读取,全量数据的读取性能可以水平扩展。

2) 全程无锁,不对线上业务产生锁的风险。

3) 断点续传,支持全量阶段的 Checkpoint。

Flink SQL的优势

1)Flink支持流批处理(支持有界数据和无界数据的处理)也就是流批一体。

2)支持轻量级快照机制,可以用于容错。

3)Flink是有状态的计算,相比storm无状态的计算来说很方便。

4)Flink是目前社区中唯一一款集高吞吐、低延迟、高性能于一体的流式计算框架

5)Flink支持Savepoint机制,可以方便用于运维,升级,扩容等。

6)FlinkSQL降低了开发门槛,可以更高效、快速开发流式任务。

Hudi的优势

目前市场上有三款主流的数据湖框架:Delta Lake,Iceberg、Hudi。Hudi相比其他两款而言,有如下优势:

1)行级别更新、删除操作。

2)变更流。解锁新的查询姿势。

3)借助于Hudi,构建湖仓一体架构。

Doris的优势

相比Clickhouse而言,Doris的优势如下:

1)海量数据下,多表join查询效率高

2)支持SQL标准,兼容MySQL协议

3)运维成本低,方便运维

相比Kylin、Druid而言,Doris的优势更明显。(支持存储明细数据+聚合后的数据)

Flink、Hudi技术选型_第1张图片

 

你可能感兴趣的:(flink,大数据,数据库)