Flume+Kafka+Strom基于伪分布式环境的结合使用

目录：

　　一、Flume、Kafka、Storm是什么,如何安装?

　　二、Flume、Kafka、Storm如何结合使用？

　　　　1) 原理是什么？

　　　　2) Flume和Kafka的整合

　　　　3) Kafka和Storm的整合

　　　　4) Flume、Kafka、Storm的整合

　　一、Flume、Kafka、Storm是什么，如何安装?

　　Flume的介绍，请参考这篇文章《 Flume1.5.0的安装、部署、简单应用》

　　Kafka的介绍，请参考这篇文章《 kafka2.9.2的分布式集群安装和demo(java api)测试》

　　Storm的介绍，请参考这篇文章《 ubuntu12.04+storm0.9.2分布式集群的搭建》

　　在后面的例子中，我们也是使用以上三篇文章中的配置进行测试。

　　二、Flume、Kafka、Storm如何结合使用？

　　　　1) 原理是什么？

　　如何你仔细阅读过关于Flume、Kafka、Storm的介绍，就会知道，在他们各自之间对外交互发送消息的原理。

　　在后面的例子中，我们主要对Flume的sink进行重构，调用kafka的消费生产者(producer)发送消息;在Sotrm的spout中继承IRichSpout接口，调用kafka的消息消费者(Consumer)来接收消息，然后经过几个自定义的Bolt，将自定义的内容进行输出。

　　　　2) flume和kafka的整合

　　　　　#复制flume要用到的kafka相关jar到flume目录下的lib里面。

           root@m1:
           /home/hadoop
           # cp /home/hadoop/kafka_2.9.2-0.8.1.1/libs/kafka_2.9.2-0.8.1.1.jar /home/hadoop/flume-1.5.0-bin/lib
          

           root@m1:
           /home/hadoop
           # cp /home/hadoop/kafka_2.9.2-0.8.1.1/libs/scala-library-2.9.2.jar /home/hadoop/flume-1.5.0-bin/lib
          

           root@m1:
           /home/hadoop
           # cp /home/hadoop/kafka_2.9.2-0.8.1.1/libs/metrics-core-2.2.0.jar /home/hadoop/flume-1.5.0-bin/lib
          

　　　　　#编写sink.java文件,然后在eclipse导出jar包，放到flume-1.5.1-bin/lib目录中,项目中要引用flume-ng-configuration-1.5.0.jar,flume-ng-sdk-1.5.0.jar,flume-ng-core-1.5.0.jar,zkclient-0.3.jar,commons-logging-1.1.1.jar,在flume目录中，可以找到这几个jar文件，如果找不到就用find命令搜一下。

           package 
           idoall.cloud.flume.sink;
          
           import 
           java.util.Properties;
          
           import 
           kafka.javaapi.producer.Producer;
          
           import 
           kafka.producer.KeyedMessage;
          
           import 
           kafka.producer.ProducerConfig;
          
           import 
           org.apache.commons.logging.Log;
          
           import 
           org.apache.commons.logging.LogFactory;
          
           import 
           org.apache.flume.Channel;
          
           import 
           org.apache.flume.Context;
          
           import 
           org.apache.flume.Event;
          
           import 
           org.apache.flume.EventDeliveryException;
          
           import 
           org.apache.flume.Transaction;
          
           import 
           org.apache.flume.conf.Configurable;
          
           import 
           org.apache.flume.sink.AbstractSink;
          
           public 
           class 
           KafkaSink 
           extends 
           AbstractSink 
           implements 
           Configurable {
          
           private 
           static 
           final 
           Log logger = LogFactory.getLog(KafkaSink.
           class
           );
          
           private 
           String topic;
          
           private 
           Producer<String, String> producer;
          
           public 
           void 
           configure(Context context) {
          
           topic = 
           "idoall_testTopic"
           ;
          
           Properties props = 
           new 
           Properties();
          
           props.setProperty(
           "metadata.broker.list"
           , 
           "m1:9092,m2:9092,s1:9092,s2:9092"
           );
          
           props.setProperty(
           "serializer.class"
           , 
           "kafka.serializer.StringEncoder"
           );
          
           props.put(
           "partitioner.class"
           , 
           "idoall.cloud.kafka.Partitionertest"
           );
          
           props.put(
           "zookeeper.connect"
           , 
           "m1:2181,m2:2181,s1:2181,s2:2181/kafka"
           );
          
           props.setProperty(
           "num.partitions"
           , 
           "4"
           ); 
           // 
          
           props.put(
           "request.required.acks"
           , 
           "1"
           );
          
           ProducerConfig config = 
           new 
           ProducerConfig(props);
          
           producer = 
           new 
           Producer<String, String>(config);
          
           logger.info(
           "KafkaSink初始化完成."
           );
          
           }
          
           public 
           Status process() 
           throws 
           EventDeliveryException {
          
           Channel channel = getChannel();
          
           Transaction tx = channel.getTransaction();
          
           try 
           {
          
           tx.begin();
          
           Event e = channel.take();
          
           if 
           (e == 
           null
           ) {
          
           tx.rollback();
          
           return 
           Status.BACKOFF;
          
           }
          
           KeyedMessage<String, String> data = 
           new 
           KeyedMessage<String, String>(topic, 
           new 
           String(e.getBody()));
          
           producer.send(data);
          
           logger.info(
           "flume向kafka发送消息：" 
           + 
           new 
           String(e.getBody()));
          
           tx.commit();
          
           return 
           Status.READY;
          
           } 
           catch 
           (Exception e) {
          
           logger.error(
           "Flume KafkaSinkException:"
           , e);
          
           tx.rollback();
          
           return 
           Status.BACKOFF;
          
           } 
           finally 
           {
          
           tx.close();
          
           }
          
           }
          
           }

　　　　　#在m1上配置flume和kafka交互的agent

           root@m1:
           /home/hadoop/flume-1
           .5.0-bin
           # vi /home/hadoop/flume-1.5.0-bin/conf/kafka.conf
          
           a1.sources = r1
          
           a1.sinks = k1
          
           a1.channels = c1
          
           # Describe/configure the source
          
           a1.sources.r1.
           type 
           = syslogtcp
          
           a1.sources.r1.port = 5140
          
           a1.sources.r1.host = localhost
          
           a1.sources.r1.channels = c1
          
           # Describe the sink
          
           a1.sinks.k1.
           type 
           = idoall.cloud.flume.sink.KafkaSink
          
           # Use a channel which buffers events in memory
          
           a1.channels.c1.
           type 
           = memory
          
           a1.channels.c1.capacity = 1000
          
           a1.channels.c1.transactionCapacity = 100
          
           # Bind the source and sink to the channel
          
           a1.sources.r1.channels = c1
          
           a1.sinks.k1.channel = c1

　　　　　#在m1,m2,s1,s2的机器上,分别启动kafka（如果不会请参考这篇文章介绍了kafka的安装、配置和启动《 kafka2.9.2的分布式集群安装和demo(java api)测试》），然后在s1机器上再启动一个消息消费者consumer

1	`root@m1:` `/home/hadoop` `# /home/hadoop/kafka_2.9.2-0.8.1.1/bin/kafka-server-start.sh /home/hadoop/kafka_2.9.2-0.8.1.1/config/server.properties &`

　　　　　#在m1启动flume

           root@m1:
           /home/hadoop
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/kafka.conf -n a1 -Dflume.root.logger=INFO,console
          

           #下面只截取部分日志信息
          

           14
           /08/19 
           11:36:34 INFO sink.KafkaSink: KafkaSink初始化完成.
          

           14
           /08/19 
           11:36:34 INFO node.AbstractConfigurationProvider: Channel c1 connected to [r1, k1]
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting new configuration:{ sourceRunners:{r1=EventDrivenSourceRunner: { 
           source
           :org.apache.flume.
           source
           .SyslogTcpSource{name:r1,state:IDLE} }} sinkRunners:{k1=SinkRunner: { policy:org.apache.flume.sink.DefaultSinkProcessor@2a9e3ba7 counterGroup:{ name:null counters:{} } }} channels:{c1=org.apache.flume.channel.MemoryChannel{name: c1}} }
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting Channel c1
          

           14
           /08/19 
           11:36:34 INFO instrumentation.MonitoredCounterGroup: Monitored counter group 
           for 
           type
           : CHANNEL, name: c1: Successfully registered new MBean.
          

           14
           /08/19 
           11:36:34 INFO instrumentation.MonitoredCounterGroup: Component 
           type
           : CHANNEL, name: c1 started
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting Sink k1
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting Source r1
          

           14
           /08/19 
           11:36:34 INFO 
           source
           .SyslogTcpSource: Syslog TCP Source starting...
          

　　　　　#在m1上再打开一个窗口，测试向flume中发送syslog

1	`root@m1:` `/home/hadoop` `# echo "hello idoall.org syslog" \| nc localhost 5140`

　　　　　#m1打开的flume窗口中看最后一行的信息，Flume已经向kafka发送了消息

           14
           /08/19 
           11:36:34 INFO sink.KafkaSink: KafkaSink初始化完成.
          

           14
           /08/19 
           11:36:34 INFO node.AbstractConfigurationProvider: Channel c1 connected to [r1, k1]
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting new configuration:{ sourceRunners:{r1=EventDrivenSourceRunner: { 
           source
           :org.apache.flume.
           source
           .SyslogTcpSource{name:r1,state:IDLE} }} sinkRunners:{k1=SinkRunner: { policy:org.apache.flume.sink.DefaultSinkProcessor@2a9e3ba7 counterGroup:{ name:null counters:{} } }} channels:{c1=org.apache.flume.channel.MemoryChannel{name: c1}} }
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting Channel c1
          

           14
           /08/19 
           11:36:34 INFO instrumentation.MonitoredCounterGroup: Monitored counter group 
           for 
           type
           : CHANNEL, name: c1: Successfully registered new MBean.
          

           14
           /08/19 
           11:36:34 INFO instrumentation.MonitoredCounterGroup: Component 
           type
           : CHANNEL, name: c1 started
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting Sink k1
          

           14
           /08/19 
           11:36:34 INFO node.Application: Starting Source r1
          

           14
           /08/19 
           11:36:34 INFO 
           source
           .SyslogTcpSource: Syslog TCP Source starting...
          

           14
           /08/19 
           11:38:05 WARN 
           source
           .SyslogUtils: Event created from Invalid Syslog data.
          

           14
           /08/19 
           11:38:05 INFO client.ClientUtils$: Fetching metadata from broker 
           id
           :3,host:s2,port:9092 with correlation 
           id 
           0 
           for 
           1 topic(s) Set(idoall_testTopic)
          

           14
           /08/19 
           11:38:05 INFO producer.SyncProducer: Connected to s2:9092 
           for 
           producing
          

           14
           /08/19 
           11:38:05 INFO producer.SyncProducer: Disconnecting from s2:9092
          

           14
           /08/19 
           11:38:05 INFO producer.SyncProducer: Connected to m1:9092 
           for 
           producing
          

           14
           /08/19 
           11:38:05 INFO sink.KafkaSink: flume向kafka发送消息：hello idoall.org syslog
          

　　　　　#在刚才s1机器上打开的kafka消费端，同样可以看到从Flume中发出的信息，说明flume和kafka已经调试成功了。

           root@s1:
           /home/hadoop
           # /home/hadoop/kafka_2.9.2-0.8.1.1/bin/kafka-console-consumer.sh --zookeeper m1:2181 --topic flume-kafka-storm-001 --from-beginning
          

           SLF4J: Failed to load class 
           "org.slf4j.impl.StaticLoggerBinder"
           .
          

           SLF4J: Defaulting to no-operation (NOP) logger implementation
          

           SLF4J: See http:
           //www
           .slf4j.org
           /codes
           .html
           #StaticLoggerBinder for further details.
          

           [2014-08-11 14:22:12,165] INFO [ReplicaFetcherManager on broker 3] Removed fetcher 
           for 
           partitions [flume-kafka-storm-001,1] (kafka.server.ReplicaFetcherManager)
          

           [2014-08-11 14:22:12,218] WARN [KafkaApi-3] Produce request with correlation 
           id 
           2 from client  on partition [flume-kafka-storm-001,1] failed due to Topic flume-kafka-storm-001 either doesn't exist or is 
           in 
           the process of being deleted (kafka.server.KafkaApis)
          

           [2014-08-11 14:22:12,223] INFO Completed load of log flume-kafka-storm-001-1 with log end offset 0 (kafka.log.Log)
          

           [2014-08-11 14:22:12,250] INFO Created log 
           for 
           partition [flume-kafka-storm-001,1] 
           in 
           /home/hadoop/kafka_2
           .9.2-0.8.1.1
           /kafka-logs 
           with properties {segment.index.bytes -> 10485760, 
           file
           .delete.delay.ms -> 60000, segment.bytes -> 536870912, flush.ms -> 9223372036854775807, delete.retention.ms -> 86400000, index.interval.bytes -> 4096, retention.bytes -> -1, cleanup.policy -> delete, segment.ms -> 604800000, max.message.bytes -> 1000012, flush.messages -> 9223372036854775807, min.cleanable.dirty.ratio -> 0.5, retention.ms -> 604800000}. (kafka.log.LogManager)
          

           [2014-08-11 14:22:12,267] WARN Partition [flume-kafka-storm-001,1] on broker 3: No checkpointed highwatermark is found 
           for 
           partition [flume-kafka-storm-001,1] (kafka.cluster.Partition)
          

           [2014-08-11 14:22:12,375] INFO Closing socket connection to 
           /192
           .168.1.50. (kafka.network.Processor)
          

           hello idoall.org syslog
          

　　　　3) kafka和storm的整合

　　　　　#我们先在eclipse中写代码，在写代码之前，我们要先对maven进行配置，pom.xml配置文件内容如下：

           <?
           xml 
           version
           =
           "1.0" 
           encoding
           =
           "utf-8"
           ?>
          

           <
           project 
           xmlns
           =
           "http://maven.apache.org/POM/4.0.0" 
           xmlns:xsi
           =
           "http://www.w3.org/2001/XMLSchema-instance" 
           xsi:schemaLocation
           =
           "http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"
           >  
          

             
           <
           modelVersion
           >4.0.0</
           modelVersion
           >  
          

             
           <
           groupId
           >idoall.cloud</
           groupId
           >  
          

             
           <
           artifactId
           >idoall.cloud</
           artifactId
           >  
          

             
           <
           version
           >0.0.1-SNAPSHOT</
           version
           >  
          

             
           <
           packaging
           >jar</
           packaging
           >  
          

             
           <
           name
           >idoall.cloud</
           name
           >  
          

             
           <
           url
           >http://maven.apache.org</
           url
           >  
          

             
           <
           properties
           > 
          

               
           <
           project.build.sourceEncoding
           >UTF-8</
           project.build.sourceEncoding
           > 
          

             
           </
           properties
           >  
          

             
           <
           repositories
           > 
          

               
           <
           repository
           > 
          

                 
           <
           id
           >github-releases</
           id
           >  
          

                 
           <
           url
           >http://oss.sonatype.org/content/repositories/github-releases/</
           url
           > 
          

               
           </
           repository
           >  
          

               
           <
           repository
           > 
          

                 
           <
           id
           >clojars.org</
           id
           >  
          

                 
           <
           url
           >http://clojars.org/repo</
           url
           > 
          

               
           </
           repository
           > 
          

             
           </
           repositories
           >  
          

             
           <
           dependencies
           > 
          

               
           <
           dependency
           > 
          

                 
           <
           groupId
           >junit</
           groupId
           >  
          

                 
           <
           artifactId
           >junit</
           artifactId
           >  
          

                 
           <
           version
           >4.11</
           version
           >  
          

                 
           <
           scope
           >test</
           scope
           > 
          

               
           </
           dependency
           >  
          

               
           <
           dependency
           > 
          

                 
           <
           groupId
           >com.sksamuel.kafka</
           groupId
           >  
          

                 
           <
           artifactId
           >kafka_2.10</
           artifactId
           >  
          

                 
           <
           version
           >0.8.0-beta1</
           version
           > 
          

               
           </
           dependency
           >  
          

               
           <
           dependency
           > 
          

                 
           <
           groupId
           >log4j</
           groupId
           >  
          

                 
           <
           artifactId
           >log4j</
           artifactId
           >  
          

                 
           <
           version
           >1.2.14</
           version
           > 
          

               
           </
           dependency
           >  
          

               
           <
           dependency
           > 
          

                 
           <
           groupId
           >storm</
           groupId
           >  
          

                 
           <
           artifactId
           >storm</
           artifactId
           >  
          

                 
           <
           version
           >0.9.0.1</
           version
           >  
          

                 
           <!-- keep storm out of the jar-with-dependencies --> 
          

                 
           <
           scope
           >provided</
           scope
           > 
          

               
           </
           dependency
           >  
          

               
           <
           dependency
           > 
          

                 
           <
           groupId
           >commons-collections</
           groupId
           >  
          

                 
           <
           artifactId
           >commons-collections</
           artifactId
           >  
          

                 
           <
           version
           >3.2.1</
           version
           > 
          

               
           </
           dependency
           > 
          

             
           </
           dependencies
           > 
          

           </
           project
           >
          

　　　　　#编写KafkaSpouttest.java文件

           package 
           idoall.cloud.storm;
          
           import 
           java.text.SimpleDateFormat;
          
           import 
           java.util.Date;
          
           import 
           java.util.HashMap;
          
           import 
           java.util.List;
          
           import 
           java.util.Map;
          
           import 
           java.util.Properties;
          
           import 
           kafka.consumer.ConsumerConfig;
          
           import 
           kafka.consumer.ConsumerIterator;
          
           import 
           kafka.consumer.KafkaStream;
          
           import 
           kafka.javaapi.consumer.ConsumerConnector;
          
           import 
           backtype.storm.spout.SpoutOutputCollector;
          
           import 
           backtype.storm.task.TopologyContext;
          
           import 
           backtype.storm.topology.IRichSpout;
          
           import 
           backtype.storm.topology.OutputFieldsDeclarer;
          
           import 
           backtype.storm.tuple.Fields;
          
           import 
           backtype.storm.tuple.Values;
          
           public 
           class 
           KafkaSpouttest 
           implements 
           IRichSpout {
          
           private 
           SpoutOutputCollector collector;
          
           private 
           ConsumerConnector consumer;
          
           private 
           String topic;
          
           public 
           KafkaSpouttest() {
          
           }
          
           public 
           KafkaSpouttest(String topic) {
          
           this
           .topic = topic;
          
           }
          
           public 
           void 
           nextTuple() {
          
           }
          
           public 
           void 
           open(Map conf, TopologyContext context, SpoutOutputCollector collector) {
          
           this
           .collector = collector;
          
           }
          
           public 
           void 
           ack(Object msgId) {
          
           }
          
           public 
           void 
           activate() {
          
           <span style=
           "font-size: 9pt; line-height: 25.2000007629395px;"
           >     </span>consumer =kafka.consumer.Consumer.createJavaConsumerConnector(createConsumerConfig());  
          
           <span style=
           "font-size: 9pt; line-height: 25.2000007629395px;"
           >     </span>Map<String,Integer> topickMap = 
           new 
           HashMap<String, Integer>();  
          
           topickMap.put(topic, 
           1
           );  
          
           System.out.println(
           "*********Results********topic:"
           +topic);  
          
           Map<String, List<KafkaStream<
           byte
           [],
           byte
           []>>>  streamMap=consumer.createMessageStreams(topickMap);  
          
           KafkaStream<
           byte
           [],
           byte
           []>stream = streamMap.get(topic).get(
           0
           );  
          
           ConsumerIterator<
           byte
           [],
           byte
           []> it =stream.iterator();   
          
           while
           (it.hasNext()){  
          
           String value =
           new 
           String(it.next().message());
          
           SimpleDateFormat formatter = 
           new 
           SimpleDateFormat   (
           "yyyy年MM月dd日 HH:mm:ss SSS"
           );  
          
           Date curDate = 
           new 
           Date(System.currentTimeMillis());
           //获取当前时间       
          
           String str = formatter.format(curDate);   
          
           System.out.println(
           "storm接收到来自kafka的消息------->" 
           + value);
          
           collector.emit(
           new 
           Values(value,
           1
           ,str), value);
          
           }  
          
           }
          
           private 
           static 
           ConsumerConfig createConsumerConfig() {  
          
           Properties props = 
           new 
           Properties();  
          
           // 设置zookeeper的链接地址
          
           props.put(
           "zookeeper.connect"
           ,
           "m1:2181,m2:2181,s1:2181,s2:2181"
           );  
          
           // 设置group id
          
           props.put(
           "group.id"
           , 
           "1"
           );  
          
           // kafka的group 消费记录是保存在zookeeper上的, 但这个信息在zookeeper上不是实时更新的, 需要有个间隔时间更新
          
           props.put(
           "auto.commit.interval.ms"
           , 
           "1000"
           );
          
           props.put(
           "zookeeper.session.timeout.ms"
           ,
           "10000"
           );  
          
           return 
           new 
           ConsumerConfig(props);  
          
           }  
          
           public 
           void 
           close() {
          
           }
          
           public 
           void 
           deactivate() {
          
           }
          
           public 
           void 
           fail(Object msgId) {
          
           }
          
           public 
           void 
           declareOutputFields(OutputFieldsDeclarer declarer) {
          
           declarer.declare(
           new 
           Fields(
           "word"
           ,
           "id"
           ,
           "time"
           ));
          
           }
          
           public 
           Map<String, Object> getComponentConfiguration() {
          
           System.out.println(
           "getComponentConfiguration被调用"
           );
          
           topic=
           "idoall_testTopic"
           ;
          
           return 
           null
           ;
          
           }
          
           }

　　　　　#编写KafkaTopologytest.java文件

           package 
           idoall.cloud.storm;
          
           import 
           java.util.HashMap;
          
           import 
           java.util.Map;
          
           import 
           backtype.storm.Config;
          
           import 
           backtype.storm.LocalCluster;
          
           import 
           backtype.storm.topology.BasicOutputCollector;
          
           import 
           backtype.storm.topology.OutputFieldsDeclarer;
          
           import 
           backtype.storm.topology.TopologyBuilder;
          
           import 
           backtype.storm.topology.base.BaseBasicBolt;
          
           import 
           backtype.storm.tuple.Fields;
          
           import 
           backtype.storm.tuple.Tuple;
          
           import 
           backtype.storm.tuple.Values;
          
           import 
           backtype.storm.utils.Utils;
          
           public 
           class 
           KafkaTopologytest {
          
           public 
           static 
           void 
           main(String[] args) {
          
           TopologyBuilder builder = 
           new 
           TopologyBuilder();
          
           builder.setSpout(
           "spout"
           , 
           new 
           KafkaSpouttest(
           ""
           ), 
           1
           );
          
           builder.setBolt(
           "bolt1"
           , 
           new 
           Bolt1(), 
           2
           ).shuffleGrouping(
           "spout"
           );
          
           builder.setBolt(
           "bolt2"
           , 
           new 
           Bolt2(), 
           2
           ).fieldsGrouping(
           "bolt1"
           ,
           new 
           Fields(
           "word"
           ));
          
           Map conf = 
           new 
           HashMap();
          
           conf.put(Config.TOPOLOGY_WORKERS, 
           1
           );
          
           conf.put(Config.TOPOLOGY_DEBUG, 
           true
           );
          
           LocalCluster cluster = 
           new 
           LocalCluster();
          
           cluster.submitTopology(
           "my-flume-kafka-storm-topology-integration"
           , conf, builder.createTopology());
          
           Utils.sleep(
           1000
           *
           60
           *
           5
           ); 
           // local cluster test ...
          
           cluster.shutdown();
          
           }
          
           public 
           static 
           class 
           Bolt1 
           extends 
           BaseBasicBolt {
          
           public 
           void 
           execute(Tuple input, BasicOutputCollector collector) {
          
           try 
           {
          
           String msg = input.getString(
           0
           );
          
           int 
           id = input.getInteger(
           1
           );
          
           String time = input.getString(
           2
           );
          
           msg = msg+
           "bolt1"
           ;
          
           System.out.println(
           "对消息加工第1次-------[arg0]:"
           + msg +
           "---[arg1]:"
           +id+
           "---[arg2]:"
           +time+
           "------->"
           +msg);
          
           if 
           (msg != 
           null
           ) {
          
           collector.emit(
           new 
           Values(msg));
          
           }
          
           } 
           catch 
           (Exception e) {
          
           e.printStackTrace();
          
           }
          
           }
          
           public 
           void 
           declareOutputFields(OutputFieldsDeclarer declarer) {
          
           declarer.declare(
           new 
           Fields(
           "word"
           ));
          
           }
          
           }
          
           public 
           static 
           class 
           Bolt2 
           extends 
           BaseBasicBolt {
          
           Map<String, Integer> counts = 
           new 
           HashMap<String, Integer>();
          
           public 
           void 
           execute(Tuple tuple, BasicOutputCollector collector) {
          
           String msg = tuple.getString(
           0
           );
          
           msg = msg + 
           "bolt2"
           ;
          
           System.out.println(
           "对消息加工第2次---------->"
           +msg);
          
           collector.emit(
           new 
           Values(msg,
           1
           ));
          
           }
          
           public 
           void 
           declareOutputFields(OutputFieldsDeclarer declarer) {
          
           declarer.declare(
           new 
           Fields(
           "word"
           , 
           "count"
           ));
          
           }
          
           }
          
           }

　　　　　#测试kafka和storm的结合

　　打开两个窗口(也可以在两台机器上分别打开，下面的例子中，我会打开m2和s1机器 )，分别m2上运行kafka的producer，在s1上运行kafka的consumer(如果刚才打开了就不用再打开),先测试kafka自运行是否正常。

　　如下所示，我在m2上运行producer，输入“hello welcome idoall.org”，在s1的机器上consumer同样收到了消息。说明kafka已经运行正常，并且消息通讯也没有问题。

　　m2机器输出的消息：

           root@m2:
           /home/hadoop
           # /home/hadoop/kafka_2.9.2-0.8.1.1/bin/kafka-console-producer.sh --broker-st m1:9092 --sync --topic idoall_testTopic
          

           SLF4J: Failed to load class 
           "org.slf4j.impl.StaticLoggerBinder"
           .
          

           SLF4J: Defaulting to no-operation (NOP) logger implementation
          

           SLF4J: See http:
           //www
           .slf4j.org
           /codes
           .html
           #StaticLoggerBinder for further details.
          

           hello welcome idoall.org
          

　　s1机器接收的消息：

           root@s1:
           /home/hadoop
           # /home/hadoop/kafka_2.9.2-0.8.1.1/bin/kafka-console-consumer.sh --zookeeper m1:2181 --topic idoall_testTopic --from-beginning
          

           SLF4J: Failed to load class 
           "org.slf4j.impl.StaticLoggerBinder"
           .
          

           SLF4J: Defaulting to no-operation (NOP) logger implementation
          

           SLF4J: See http:
           //www
           .slf4j.org
           /codes
           .html
           #StaticLoggerBinder for further details.
          

           hello welcome idoall.org
          

　　　　　#我们再在Eclipse中运行KafkaTopologytest.java，可以看到在控制台，同样收到了刚才在m2上kafka发送的消息。说明kafka和storm也打通了。

           #信息太多，我只截取重要部分：
          
           *********Results********topic:idoall_testTopic
          
           storm接收到来自kafka的消息------->hello welcome idoall.org
          
           5268 [Thread-24-spout] INFO backtype.storm.daemon.task - Emitting: spout default [hello welcome idoall.org, 1, 2014年08月19日 11:21:15 051]
          
           对消息加工第1次-------[arg0]:hello welcome idoall.orgbolt1---[arg1]:1---[arg2]:2014年08月19日 11:21:15 051------->hello welcome idoall.orgbolt1
          
           5269 [Thread-18-bolt1] INFO backtype.storm.daemon.executor - Processing received message 
           source
           : spout:6, stream: default, 
           id
           : {-2000523200413433507=6673316475127546409}, [hello welcome idoall.org, 1, 2014年08月19日 11:21:15 051]
          
           5269 [Thread-18-bolt1] INFO backtype.storm.daemon.task - Emitting: bolt1 default [hello welcome idoall.orgbolt1]
          
           5269 [Thread-18-bolt1] INFO backtype.storm.daemon.task - Emitting: bolt1 __ack_ack [-2000523200413433507 4983764025617316501]
          
           5269 [Thread-20-bolt2] INFO backtype.storm.daemon.executor - Processing received message 
           source
           : bolt1:3, stream: default, 
           id
           : {-2000523200413433507=1852530874180384956}, [hello welcome idoall.orgbolt1]
          
           对消息加工第2次---------->hello welcome idoall.orgbolt1bolt2
          
           5270 [Thread-20-bolt2] INFO backtype.storm.daemon.task - Emitting: bolt2 default [hello welcome idoall.orgbolt1bolt2, 1]

　　　　3) flume、kafka、storm的整合

　　从上面两个例子我们可以看到，flume和kafka之前已经完成了通讯和部署，kafka和storm之间可以正常通讯，只差把storm的相关文件打包成jar部署到storm中即可完成三者的通讯。

　　Storm的安装、配置、部署，如果不了解，可以参考这篇文章《 ubuntu12.04+storm0.9.2分布式集群的搭建》

　　　　　#复制kafka相关的jar包到storm的lib里面。（因为在上面我们已经说过，kafka和storm的整合，主要是重写storm的spout，调用kafka的Consumer来接收消息并打印，所在需要用到这些jar包）

           root@m1:
           /home/hadoop
           # cp /home/hadoop/kafka_2.9.2-0.8.1.1/libs/kafka_2.9.2-0.8.1.1.jar /home/hadoop/storm-0.9.2-incubating/lib
          

           root@m1:
           /home/hadoop
           # cp /home/hadoop/kafka_2.9.2-0.8.1.1/libs/scala-library-2.9.2.jar /home/hadoop/storm-0.9.2-incubating/lib
          

           root@m1:
           /home/hadoop
           # cp /home/hadoop/kafka_2.9.2-0.8.1.1/libs/metrics-core-2.2.0.jar /home/hadoop/storm-0.9.2-incubating/lib
          

           root@m1:
           /home/hadoop
           # cp /home/hadoop/zookeeper-3.4.5/dist-maven/zookeeper-3.4.5.jar /home/hadoop/storm-0.9.2-incubating/lib
          

           root@m1:
           /home/hadoop
           # cp /home/hadoop/kafka_2.9.2-0.8.1.1/libs/zkclient-0.3.jar /home/hadoop/storm-0.9.2-incubating/lib
          

　　　　　#在m1上启动storm nimbus

1	`root@m1:` `/home/hadoop` `# /home/hadoop/storm-0.9.2-incubating/bin/storm nimbus &`

　　　　　#在s1,s2上启动storm supervisor

1	`root@s1:` `/home/hadoop` `# /home/hadoop/storm-0.9.2-incubating/bin/storm supervisor &`

　　　　　#在m1上启动storm ui

1	`root@m1:` `/home/hadoop` `# /home/hadoop/storm-0.9.2-incubating/bin/storm ui &`

　　　　　#将Eclipse中的文件打包成jar复制到做任意目录，然后用storm来运行

           root@m1:
           /home/hadoop/storm-0
           .9.2-incubating
           # ll
          
           总用量 25768
          
           drwxr-xr-x 11 root   root       4096 Aug 19 11:53 ./
          
           drwxr-xr-x 46 hadoop hadoop     4096 Aug 17 15:06 ../
          
           drwxr-xr-x  2 root   root       4096 Aug  1 14:38 bin/
          
           -rw-r--r--  1    502 staff     34239 Jun 13 08:46 CHANGELOG.md
          
           drwxr-xr-x  2 root   root       4096 Aug  2 12:31 conf/
          
           -rw-r--r--  1    502 staff       538 Mar 13 11:17 DISCLAIMER
          
           drwxr-xr-x  3    502 staff      4096 May  6 03:13 examples/
          
           drwxr-xr-x  3 root   root       4096 Aug  1 14:38 external/
          
           -rw-r--r--  1 root   root   26252342 Aug 19 11:36 idoall.cloud.jar
          
           drwxr-xr-x  3 root   root       4096 Aug  2 12:51 ldir/
          
           drwxr-xr-x  2 root   root       4096 Aug 19 11:53 lib/
          
           -rw-r--r--  1    502 staff     22822 Jun 12 04:07 LICENSE
          
           drwxr-xr-x  2 root   root       4096 Aug  1 14:38 logback/
          
           drwxr-xr-x  2 root   root       4096 Aug  1 15:07 logs/
          
           -rw-r--r--  1    502 staff       981 Jun 11 01:10 NOTICE
          
           drwxr-xr-x  5 root   root       4096 Aug  1 14:38 public/
          
           -rw-r--r--  1    502 staff      7445 Jun 10 02:24 README.markdown
          
           -rw-r--r--  1    502 staff        17 Jun 17 00:22 RELEASE
          
           -rw-r--r--  1    502 staff      3581 May 30 00:20 SECURITY.md
          
           root@m1:
           /home/hadoop/storm-0
           .9.2-incubating
           # /home/hadoop/storm-0.9.2-incubating/bin/storm jar idoall.cloud.jar idoall.cloud.storm.KafkaTopologytest

　　　　　#在flume中发消息，在storm中看是否有接收到

　　　在flume中发送的消息：

1 2	`root@m1:` `/home/hadoop` `# echo "flume->kafka->storm message" \| nc localhost 5140` `root@m1:` `/home/hadoop` `#`

　　　storm中显示的内容：

           #内容太多，只截取重要部分
          
           storm接收到来自kafka的消息------->flume->kafka->storm message
          
           174218 [Thread-16-spout] INFO  backtype.storm.daemon.task - Emitting: spout default [flume->kafka->storm message, 1, 2014年08月19日 12:06:39 360]
          
           174220 [Thread-10-bolt1] INFO  backtype.storm.daemon.executor - Processing received message 
           source
           : spout:6, stream: default, 
           id
           : {-2345821945306343027=-7738131487327750388}, [flume->kafka->storm message, 1, 2014年08月19日 12:06:39 360]
          
           对消息加工第1次-------[arg0]:flume->kafka->storm messagebolt1---[arg1]:1---[arg2]:2014年08月19日 12:06:39 360------->flume->kafka->storm messagebolt1
          
           174221 [Thread-10-bolt1] INFO  backtype.storm.daemon.task - Emitting: bolt1 default [flume->kafka->storm messagebolt1]
          
           174221 [Thread-10-bolt1] INFO  backtype.storm.daemon.task - Emitting: bolt1 __ack_ack [-2345821945306343027 -2191137958679040397]
          
           174222 [Thread-20-__acker] INFO  backtype.storm.daemon.executor - Processing received message 
           source
           : bolt1:3, stream: __ack_ack, 
           id
           : {}, [-2345821945306343027 -2191137958679040397]
          
           174222 [Thread-12-bolt2] INFO  backtype.storm.daemon.executor - Processing received message 
           source
           : bolt1:3, stream: default, 
           id
           : {-2345821945306343027=8433871885621516671}, [flume->kafka->storm messagebolt1]
          
           对消息加工第2次---------->flume->kafka->storm messagebolt1bolt2
          
           174223 [Thread-12-bolt2] INFO  backtype.storm.daemon.task - Emitting: bolt2 default [flume->kafka->storm messagebolt1bolt2, 1]
          
           174223 [Thread-12-bolt2] INFO  backtype.storm.daemon.task - Emitting: bolt2 __ack_ack [-2345821945306343027 8433871885621516671]
          
           174224 [Thread-20-__acker] INFO  backtype.storm.daemon.executor - Processing received message 
           source
           : bolt2:4, stream: __ack_ack, 
           id
           : {}, [-2345821945306343027 8433871885621516671]
          
           174228 [Thread-16-spout] INFO  backtype.storm.daemon.task - Emitting: spout __ack_init [-2345821945306343027 -7738131487327750388 6]
          
           174228 [Thread-20-__acker] INFO  backtype.storm.daemon.executor - Processing received message 
           source
           : spout:6, stream: __ack_init, 
           id
           : {}, [-2345821945306343027 -7738131487327750388 6]
          
           174228 [Thread-20-__acker] INFO  backtype.storm.daemon.task - Emitting direct: 6; __acker __ack_ack [-2345821945306343027]

　　　通过以上实例，我们完成了flume、kafka、storm之间的通讯，结合之前介绍的《Flume1.5.0的安装、部署、简单应用(含分布式、与hadoop2.2.0、hbase0.96的案例)》和《Golang、Php、Python、Java基于Thrift0.9.1实现跨语言调用》.如果相互结合，相信在基于大数据实时计算，以及多语言之间的相互调用，能够解决你在项目中的大部分问题。希望最近一系列的文章能够对你有帮助。

---------------------------------------

博文作者：迦壹

博客地址： Flume+Kafka+Strom基于分布式环境的结合使用

---------------------------------------

Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
全面指南：用户行为从前端数据采集到实时处理的最佳实践数字沉思营销流量运营系统架构前端内容运营大数据
引言在当今的数据驱动世界，实时数据采集和处理已经成为企业做出及时决策的重要手段。本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过Flink实时处理数据的完整流程。无论你是想提升产品体验还是做用户行为分析，这篇文章都将为你提供全面的解决方案。设计一个通用的ClickHouse表来存储用户事件时，需要考虑多种因素，包括事件类型、时间戳、用户信
Docker安装Kafka和Kafka-Manager 阿靖哦
本文介绍如何通过Docker安装kafka与kafka界面管理界面一、拉取zookeeper由于kafka需要依赖于zookeeper，因此这里先运行zookeeper1、拉取镜像dockerpullwurstmeister/zookeeper2、启动dockerrun-d--namezookeeper-p2181:2181-eTZ="Asia/Shanghai"--restartalwayswu
主流行架构 rainbowcheng 架构架构
nexus，gitlab,svn,jenkins,sonar,docker，apollo，catteambition，axure，蓝湖，禅道,WCP；redis，kafka，es，zookeeper，dubbo，shardingjdbc，mysql，InfluxDB，Telegraf，Grafana，Nginx，xxl-job，Neo4j,NebulaGraph是一个高性能的,NOSQL图形数据库
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
分布式消息队列Kafka 叶域大数据分布式 kafka scala spark
分布式消息队列Kafka简介：Kafka是一个分布式消息队列系统，用于处理实时数据流。消息按照主题（Topic）进行分类存储，发送消息的实体称为Producer，接收消息的实体称为Consumer。Kafka集群由多个Kafka实例（Server）组成，每个实例称为Broker。主要用途：广泛应用于构建实时数据管道和流应用程序，适用于需要高吞吐量和低延迟的数据处理场景依赖：Kafka集群和消费者依
K8S学习之PV&&PVC david161
部署mysql之前我们需要先了解一个概念有状态服务。这是一种特殊的服务，简单的归纳下就是会产生需要持久化的数据，并且有很强的I/O需求，且重启需要依赖上次存储到磁盘的数据。如典型的mysql，kafka，zookeeper等等。在我们有比较优秀的商业存储的前提下，非常推荐使用有状态服务进行部署，计算和存储分离那是相当的爽的。在实际生产中如果没有这种存储，localPV也是不错的选择，当然local
Kafka系列之：kafka命令详细总结快乐骑行^_^ 日常分享专栏 Kafka Kafka系列 kafka命令详细总结
Kafka系列之：kafka命令详细总结一、添加和删除topic二、修改topic三、平衡领导者四、检查消费者位置五、管理消费者群体一、添加和删除topicbin/kafka-topics.sh--bootstrap-serverbroker_host:port--create--topicmy_topic_name\--partitions20--replication-factor3--con
搭建Kafka+zookeeper集群调度 krb___ kafka 分布式
前言硬件环境172.18.0.5kafkazk1Kafka+zookeeperKafkaBroker集群172.18.0.6kafkazk2Kafka+zookeeperKafkaBroker集群172.18.0.7kafkazk3Kafka+zookeeperKafkaBroker集群软件环境zookeeper3.5.9资源调度、写作Kafka2.8.0消息通信中间件安装JDK1.8安装搭建zo
Kafka和Pulsar深入解析 jasen91 大数据开发 kafka 分布式
Kafka多租户：单租户系统数据迁移：依赖MirrorMaker，需要额外维护。市场上也有ConfluentReplicator等供应商工具。分层存储：由供应商提供商业使用。组件依赖：KafkaRaft（KRaft）从Kafka2.8开始处于早期访问模式，允许Kafka在没有ZooKeeper的情况下工作。这对Kafka来说是一个显著的优势，因为它简化了Kafka的体系结构并降低了学习成本。云原生
Linux系统部署Kafka教学情书学长 linux 学习笔记 kafka
第一步：Zookeeper安装（准备工作）1、解压安装将安装包上传到/opt/software目录下，解压并修改名称tar-zxvfapache-zookeeper-3.5.7-bin.tar.gz-C/opt/module/mvapache-zookeeper-3.5.7-bin/zookeeper2、配置服务器编号1)在/opt/module/zookeeper-3.5.7/这个目录下创建zk
数仓开发之DWD层完整使用 (第五章) 小坏讲微服务数据仓库 hadoop scala kafka
数仓开发之DWD层完整使用一、流量域未精加工的事务事实表1、主要任务1）数据清洗（ETL）2）新老访客状态标记修复3）分流2、思路1）数据清洗（ETL）2）新老访客状态标记修复（1）前端埋点新老访客状态标记设置规则（2）新老访客状态标记修复思路3）利用侧输出流实现数据拆分（1）埋点日志结构分析（2）分流日志分类（3）分流思路3、图解4、代码1）在KafkaUtil工具类中补充getKafkaPro
Kafka 应用场景 zinuxer kafka 分布式
数据流处理：Kafka支持实时数据流处理，能够在数据流动时进行处理和分析，确保应用程序与最新信息保持同步！日志聚合：可以将来自不同来源的日志集中和聚合，简化应用程序的调试和监控！消息队列：Kafka充当高性能的消息队列，确保不同系统组件之间可靠且可扩展的通信！网络活动追踪：Kafka可以追踪网络活动，改进用户体验和推动业务增长！数据复制：Kafka允许在多个集群之间实现无缝数据复制，确保高可用性和
Kafka的ack机制香山上的麻雀
ack=0/1/-1的不同情况：0：producer不等待broker的ack，broker一接收到还没有写入磁盘就已经返回，当broker故障时有可能丢失数据；1：producer等待broker的ack，partition的leader落盘成功后返回ack，如果在follower同步成功之前leader故障，那么将会丢失数据；-1：producer等待broker的ack，partition的
Kafka 实战 - Kafka分区和副本机制理解用心去追梦 kafka 分布式
ApacheKafka的分区（Partition）和副本（Replica）机制是其核心架构和可靠性保证的关键组成部分。以下是对其理解的详细解释：分区（Partition）分区概念：在Kafka中，每个主题（Topic）可以被划分为多个分区。分区是一个有序的、不可变的消息序列。这意味着消息在分区中按生成顺序存储，每个消息都有一个唯一的偏移量（Offset）。目的：分区的主要目的是为了水平扩展和并行处
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
zookeeper+kafka消息队列部署 TBF610218 zookeeper kafka 分布式
消息队列的概念什么是消息队列消息是指在应用间传送的数据消息队列是一种应用间的通信方式解决方法，确保消息的可靠传递专门为消息做缓存的消息队列的特征存储将消息存储在某个类型的缓冲区中，指导目标进读取这些消息或者将其从消息队列中显示移除为止异步消息队列通过缓冲消息可以在应用程序当中公开一定程度的异步性，允许源进程发送消息并在队列当中累积消息，而且目标进程可以挑选消息并进行处理为什么需要消息队列解耦冗余扩
分布式中间件-几个常用的消息中间件问道飞鱼分布式技术分布式中间件
文章目录常见消息中间件1.RabbitMQ2.ApacheKafka3.RedisPub/Sub4.ActiveMQ5.AmazonSimpleNotificationService(SNS)和SimpleQueueService(SQS)6.RocketMQ差异总结消息协议1.AMQP(AdvancedMessageQueuingProtocol)2.STOMP(SimpleTextOrient
kafka php 教程,php 使用kafka weixin_39713841 kafka php 教程
准备工作gitclonehttps://github.com/edenhill/librdkafka.git./configuremakesudomakeinstall$gitclonehttps://github.com/arnaud-lb/php-rdkafka.git#生成configure文件$/Users/shiyibo/LNMP/php/bin/phpize#编译安装$./config
Kafka快速入门 G丶AEOM 速成学习区 kafka linq 分布式
讲一下什么是Kafka首先引入这样一个场景：A服务可以发送200qps（QueriesPerSecond，是指每秒查询率），而B服务可以处理100qps。很显然，B服务很可能会被A服务压垮掉。怎么为了保证B不被压垮的同时还能处理A消息，没有什么是不能通过一层中间件解决的，如果有，那就再加一层。开始很容易想到，可以在B服务中增加一个队列，其实就是个链表，B服务根据自己的消费能力，消费链表中的消息。每
【Python系列】异步任务的终止 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
老版本kafka查询topic消费情况(python查询) 代码是谁 kafka python 分布式
由于老版本的kafka缺少shell，导致无法通过命令直接进行查询，所以通过python代码，实现消费情况查询安装必须的包#pyhon2.5pipinstallkafka-python==1.4.7python脚本#!/usr/bin/envpythonimportsysfromkafkaimportKafkaConsumer,TopicPartitioniflen(sys.argv)!=2:pr
【Python系列】使用切片移动元素位置 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
字节架构师：来说说 Kafka 的消费者客户端详解，你都搞懂了吗？ 2401_84049200 程序员 kafka linq 分布式
点对点模式基于队列，类似于同一个消费者组中的数据，由生产者发送数据到分区，然后消费者拉取分区的消息进行消费，此时消息只能被同一个消费者组的消费者消费一次。发布订阅模式模式就是kafka中的分区消息可以被不同消费者组的消费者消费。这就是一对多的广播模式应用。当然，消费者组是一个逻辑的概念，通过客户端参数group.id来配置，默认值为空字符串。而消费者并不是逻辑的概念，它是真正消费数据的实体，可以是
Java Kafka生产者实现 stormsha Java web java kafka linq
欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：「stormsha的主页」，「stormsha的知识库」持续学习，不断总结，共同进步，为了踏实，做好当下事儿~专栏导航Python系列:Python面试题合集，剑指大厂Git系列:Git操作技巧GO系列:记录博主学习GO语言的笔记，该笔记专栏
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

Flume+Kafka+Strom基于伪分布式环境的结合使用

你可能感兴趣的:(kafka)