初识Apache Flink - 数据流上的有状态计算

初识Apache Flink - 数据流上的有状态计算

| 做大数据实时(流)计算就应该学习Flink。

初识Flink


初识Apache Flink - 数据流上的有状态计算_第1张图片https://www.bilibili.com/video/av66770569/

点击播放视频

| 什么是Flink?

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。

初识Apache Flink - 数据流上的有状态计算_第2张图片

| 所有流式场景

  • 事件驱动应用
  • 流批分析
  • 数据管道 & ETL

| 正确性保证

  • Exactly-once 状态一致性
  • 事件时间处理
  • 成熟的迟到数据处理

| 分层 API

  • SQL on Stream & Batch Data
  • DataStream API & DataSet API
  • ProcessFunction (Time & State)

| 聚焦运维

  • 灵活部署
  • 高可用
  • 保存点

| 大规模计算

  • 水平扩展架构
  • 支持超大状态
  • 增量检查点机制

| 性能卓越

  • 低延迟
  • 高吞吐
  • 内存计算

扫码关注

【从入门到精通】系列

(微信扫一扫,关注该公众号)

你可能感兴趣的:(Flink)