Apache Flink 概览 - 有状态的流式计算

阅读更多

Apache Flink 概览 - 有状态的流式计算_第1张图片

 

Flink的主要特性如下:

 

一、所有的流式使用用例

 

  • 事件驱动的应用
  • 流式 & 批量分析
  • 数据 Pipelines & ETL

二、保证正确性

 

  • 严格一次(Exactly-once) 状态一致性
  • 基于消息时间(Event-time)的 处理
  • 复杂的后期数据处理(Sophisticated late data handling)

三、分层的API

 

  • 基于流和批量数据的SQL
  • DataStream API 和 DataSet API
  • 基于时间和状态的处理函数

四、操作重点(Operational Focus)

 

  • 灵活的部署
  • 高可用的设置
  • 保存点(SavePoint)

五、扩展至任何用例

 

  • 横向扩展的架构(Scale-out architecture)
  • 支持大量的状态
  • 增量的checkpointing

六、卓越的性能

 

  • 低延时
  • 高吞吐
  • 基于内存的计算

 

 

笔者水平有限,有些地方如有翻译不适,尽请指出。

 

如想对flink特性了解更多,请参考:http://flink.apache.org/

 

 

打个广告,个人网站:http://www.leaderanking.com/

你可能感兴趣的:(flink,架构)