SparkStreaming, StructedStreaming, KafkaStream,Storm,Flink 几大常见实时流计算引擎的对比
目前开源大数据实时计算引擎有很多选择,我们可以对他们大致分为流处理和批处理第一类是流处理(NativeStreaming):这类引擎中所有的data在到来的时候就会被立即处理,一条接着一条(HINT:狭隘的来说是一条接着一条,但流引擎有时会为提高性能缓存一小部分data然后一次性处理),其中的代表就是Storm,Samza,Flink,KafkaStream第二类是批处理(micro-batch)