[tips]实时方案选型Flink/Storm/Samza/Spark streaming

【一点资讯】Spark在GrowingIO数据无埋点全量采集场景下的实践 www.yidianzixun.com
http://www.yidianzixun.com/home?page=article&id=0EXq2NT4&up=234

Paste_Image.png

我们的实时计算目前采用的是分钟级别的实时,没有精确到秒级,离线计算需要计算速度非常快,这两部分我们当初在考虑的时候就选用了Spark,因为Spark本身既支持实时,又支持离线,而且相对于其他的实时的方案来说,像Flink或者是Storm和Samza来说,我们不需要到秒级的这种实时,我们需要的是吞吐量,所以我们选择Spark。实时部分用的是Spark streaming,离线部分用的是Spark offline的方案。

你可能感兴趣的:([tips]实时方案选型Flink/Storm/Samza/Spark streaming)