flink的成熟引发的批处理架构到实时流处理架构的演变

背景:

本文从flink的演变成熟过程梳理下从批处理架构到实时流处理架构的演变过程

架构演变过程

Flink未出现时的批处理时代:
flink的成熟引发的批处理架构到实时流处理架构的演变_第1张图片
这个架构的最大的缺点是实时性差,从数据变更到最终体现在报表里至少需要几个小时,而且无法增量处理数据,每次都是全量的方式处理全部的数据

flink刚开始出现时的架构:
flink的成熟引发的批处理架构到实时流处理架构的演变_第2张图片
由于flink刚开始出现时,不提供事件事件处理语义,也不提供状态的一致性支持,所以结果的准确性完全取决于事件到达的顺序和时间,也就是flink只能提供近实时的非准确的计算结果,所以为了同时得到近实时性和结果的准确性,采用了上面的lambda架构处理数据

flink成熟期
随着flink提供了内置的状态一致性以及事件事件处理语义,flink可以保证最终结果的实时性和准确性,所以批处理引擎不再是架构的一部分:
flink的成熟引发的批处理架构到实时流处理架构的演变_第3张图片
最终的架构只需要flink的参与就可以满足结果准确性和实时性的要求

你可能感兴趣的:(架构图,flink,flink,架构,大数据)