Apache Flink DataStream 编程全集

概述

Flink是构建在数据流之上的有状态计算的流计算框架,通常被人们理解为是第三代大数据分析方案。

  • 第一代 - Hadoop的MapReduce计算(静态)、Storm流计算(2014.9) ;两套独立计算引擎,使用难度大
  • 第二代 - Spark RDD 静态批处理(2014.2)、DStream|Structured Streaming 流计算;统一计算引擎,难度系数小
  • 第三代 - Flink DataStream(2014 .12) 流计算框架、Flink Dataset 批处理;统一计算引擎,难度系数不低也不高

可以看出Spark和Flink几乎同时诞生,但是Flink之所以发展慢,是因为早期人们对大数据的分析的认知不够深刻或者当时业务场景大都局限在批处理领域,从而导致了Flink的发展相比较于Spark较为缓慢,直到2016年人们才开始慢慢的意识流计算的重要性。

流计算领域:系统监控、舆情监控、交通预测、国家电网、疾病预测、银行/金融风控等。

更多详细分析:https://blog.csdn.net/weixin_38231448/article/details/100062961

Spark VS Flink战略

你可能感兴趣的:(Flink实时计算)