storm + kafka + zookeeper



Storm是Twitter开源的分布式实时大数据处理框架, Storm 是流示数据处理,是不均匀的,通过kafka +zookeeper将消息处理后均匀返回给Storm

storm + kafka + zookeeper_第1张图片


kafka是一个分布式的,分区的消息(官方称之为commit log)服务。它提供一个消息系统应该具备的功能,但是确有着独特的设计。

首先,让我们来看一下基础的消息(Message)相关术语:

    Topic: Kafka按照Topic分类来维护消息

    Producer: 我们将发布(publish)消息到Topic的进程称之为生产者(producer)

    Consumer: 我们将订阅(subscribe)Topic并且处理Topic中消息的进程称之为消费者(consumer)

    Broker: Kafka以集群的方式运行,集群中的每一台服务器称之为一个代理(broker)。


                        storm + kafka + zookeeper_第2张图片



storm + kafka + zookeeper_第3张图片


因此,Storm的最佳数据源,实际上就是消息中间件。在本教程中,我们将使用阿里的RocketMq作为数据源进行讲解。不过,在刚开始时,我们会使用模拟的外部数据源,来帮忙我们理解Topology的工作流程。等到熟悉之后,再使用RocketMq作为外部数据源。


转载自:http://www.tianshouzhi.com/ 

原文博主写的很好 ,这里只是方便自己记忆 ,不做任何用处





你可能感兴趣的:(storm + kafka + zookeeper)