jstorm了解—应用场景

JStorm处理数据的方式是基于消息的流水线处理, 因此特别适合无状态计算,也就是计算单元的依赖的数据全部在接受的消息中可以找到, 并且最好一个数据流不依赖另外一个数据流。

因此,常常用于:

  1. 日志分析,从日志中分析出特定的数据,并将分析的结果存入外部存储器如数据库。目前,主流日志分析技术就使用JStorm或Storm
  2. 管道系统, 将一个数据从一个系统传输到另外一个系统, 比如将数据库同步到Hadoop
  3. 消息转化器, 将接受到的消息按照某种格式进行转化,存储到另外一个系统如消息中间件
  4. 统计分析器, 从日志或消息中,提炼出某个字段,然后做count或sum计算,最后将统计值存入外部存储器。中间处理过程可能更复杂。

举例:

  1. 双十一直播间,交易数值的实时计算
  2. 大批量数据的迁移

参考文献

  • github/jstorm

你可能感兴趣的:(storm,数据)