编程之路-java

kafka 0.10 client使用例子

一.前言

在理解本篇内容前请先读kafka特征介绍。
由于个人理解有限，在遇到特殊问题时请参考kafka官方文档。欢迎指出本篇内容的错误。
本篇内容会持续更新，请关注。

二.topic,group规范

为增强topic,group名称所代表的含义，约定如下规则：
topic的名称里只体现生产者。定义：环境_生产者_业务含义。例如：prod_sync_order_snapshot.
每个group代表代表一个独立的consumer，虽然client支持一个group对应多个topic，但是为区分业务意思，我们还是约定为每个topic创建独立group。定义:环境_group_消费者_业务含义.例如：prod_group_mind_order_snapshot.
为了整个系统消费者相互隔离，日后的监控。请希望大家遵守名称规范。

三.思考

producer怎么选择发送到某一个partition,producer是怎样的一个推送模式。
offset是对所有partition，还是某一个partiton。
consumer是怎样选择从多个partition获取数据的。
怎么构建具有有序性的业务消费消息流。
上面几个问题是我们在解决业务需求应该理解的问题。

四.10.0后新client

1.生产者

    public static Properties getProducerProperties() {
        // create instance for properties to access producer configs
        Properties props = new Properties();
        //Assign localhost id
        // props.put("bootstrap.servers", "172.16.1.248:9092,172.16.1.248:9093");
        /**
         *1.这里指定server的所有节点
         *2. product客户端支持动态broke节点扩展，metadata.max.age.ms是在一段时间后更新metadata。
         *
         */
        //  props.put("bootstrap.servers", "172.16.30.13:9093");
        //开发测试环境
        props.put("bootstrap.servers", "172.16.30.13:9095,172.16.30.13:9096");
        //  props.put("bootstrap.servers", "dev.kafka1.cnhz.shishike.com:9092");

        /**
         * Set acknowledgements for producer requests.
         * acks=0：意思server不会返回任何确认信息，不保证server是否收到，因为没有返回retires重试机制不会起效。
         * acks=1：意思是partition leader已确认写record到日志中，但是不保证record是否被正确复制(建议设置1)。
         * acks=all：意思是leader将等待所有同步复制broker的ack信息后返回。
         */
        props.put("acks", "1");


        /**
         * 1.If the request fails, the producer can automatically retry,
         * 2.请设置大于0，这个重试机制与我们手动发起resend没有什么不同。
         */
        props.put("retries", 3);

        //
        /**
         * 1.Specify buffer size in config
         * 2. 10.0后product完全支持批量发送给broker，不乱你指定不同parititon，product都是批量自动发送指定parition上。
         * 3. 当batch.size达到最大值就会触发dosend机制。
         */
        props.put("batch.size", 16384);

        /**
         * Reduce the no of requests less than 0;意思在指定batch.size数量没有达到情况下，在5s内也回推送数据
         */
        props.put("linger.ms", 60000);

        /**
         * 1. The buffer.memory controls the total amount of memory available to the producer for buffering.
         * 2. 生产者总内存被应用缓存，压缩，及其它运算。
         *
         */
        props.put("buffer.memory", 33554432);


        /**
         * 可以采用的压缩方式：gzip，snappy
         */
        //  props.put("compression.type", gzip);


        /**
         * 1.请保持producer，consumer 序列化方式一样，如果序列化不一样，将报错。
         */
        props.put("key.serializer",
                "org.apache.kafka.common.serialization.StringSerializer");

        props.put("value.serializer",
                "org.apache.kafka.common.serialization.StringSerializer");
        return props;
    }

 @Test
    public void check_CallBack() throws Exception {
        try {
            CountDownLatch latch = new CountDownLatch(1);
            //Assign topicName to string variable
            String topicName = "page_visits8";
            Producer producer = ProductUtils.getProducer();
            Future result = producer.send(new ProducerRecord(topicName,
                    "1", "ddddddddd洪10002" + 5), new Callback() {
                @Override
                public void onCompletion(RecordMetadata metadata, Exception exception) {

                    if (exception != null) {
                        exception.printStackTrace();
                        logger.error("find send exception:", exception);
                    }

                    logger.info("callback completion:" + metadata);
                    latch.countDown();
                }

            });
            logger.info("have send info");
            Thread.sleep(10000);
            logger.info("wait 10s");
            producer.flush();
            logger.info(" flush");
            latch.await();
            logger.info(" callback");
            //   RecordMetadata data=result.get();

            //data.

            System.out.println("Message sent successfully");
            producer.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

为了更好的实现负载均衡和消息的顺序性，Kafka Producer可以通过分发策略发送给指定的Partition。Kafka只保证在partition中的消息是有序的。分发策略依赖于Partitioner接口的实现。
查看kafka默认的策略类DefaultPartitioner，我知道分发策略提供轮询，根据key的hash值选择，或者直接指定partition。请参考下面代码

/**
 * The default partitioning strategy:
 * 
 * If a partition is specified in the record, use it
 * 
If no partition is specified but a key is present choose a partition based on a hash of the key
 * If no partition or key is present choose a partition in a round-robin fashion
 */

public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        List partitions = cluster.partitionsForTopic(topic);
        int numPartitions = partitions.size();
        if (keyBytes == null) {
            int nextValue = counter.getAndIncrement();
            List availablePartitions = cluster.availablePartitionsForTopic(topic);
            if (availablePartitions.size() > 0) {
                int part = DefaultPartitioner.toPositive(nextValue) % availablePartitions.size();
                return availablePartitions.get(part).partition();
            } else {
                // no partitions are available, give a non-available partition
                return DefaultPartitioner.toPositive(nextValue) % numPartitions;
            }
        } else {
            // hash the keyBytes to choose a partition
            return DefaultPartitioner.toPositive(Utils.murmur2(keyBytes)) % numPartitions;
        }
    }

2.生产者有序性

我通过如下测试实验，topic page_visits5有两个partition。producer通过key的hash指定partition。构建两个consumer指定读取不同的partition。通过实验可以知道offset是对某一个partition成自增长。
testCustomerByPartitionOne的日志

ConsumerRecord(topic = page_visits5, partition = 0, offset = 605, CreateTime = 1499752027859, checksum = 2595474072, serialized key size = 1, serialized value size = 19, key = 0, value = ddddddddd洪1000245)
ConsumerRecord(topic = page_visits5, partition = 0, offset = 606, CreateTime = 1499752027859, checksum = 62561058, serialized key size = 1, serialized value size = 19, key = 0, value = ddddddddd洪1000246)
ConsumerRecord(topic = page_visits5, partition = 0, offset = 607, CreateTime = 1499752027859, checksum = 1958587316, serialized key size = 1, serialized value size = 19, key = 0, value = ddddddddd洪1000247)
ConsumerRecord(topic = page_visits5, partition = 0, offset = 608, CreateTime = 1499752027859, checksum = 3825382949, serialized key size = 1, serialized value size = 19, key = 0, value = ddddddddd洪1000248)
ConsumerRecord(topic = page_visits5, partition = 0, offset = 609, CreateTime = 1499752027860, checksum = 1633914638, serialized key size = 1, serialized value size = 19, key = 0, value = ddddddddd洪1000249)

testCustomerByPartitionTwo的日志

ConsumerRecord(topic = page_visits5, partition = 1, offset = 604, CreateTime = 1499752027859, checksum = 1821482793, serialized key size = 1, serialized value size = 19, key = 1, value = ddddddddd洪1000244)
ConsumerRecord(topic = page_visits5, partition = 1, offset = 605, CreateTime = 1499752027859, checksum = 462860223, serialized key size = 1, serialized value size = 19, key = 1, value = ddddddddd洪1000245)
ConsumerRecord(topic = page_visits5, partition = 1, offset = 606, CreateTime = 1499752027859, checksum = 2191523333, serialized key size = 1, serialized value size = 19, key = 1, value = ddddddddd洪1000246)
ConsumerRecord(topic = page_visits5, partition = 1, offset = 607, CreateTime = 1499752027859, checksum = 4120432275, serialized key size = 1, serialized value size = 19, key = 1, value = ddddddddd洪1000247)
ConsumerRecord(topic = page_visits5, partition = 1, offset = 608, CreateTime = 1499752027860, checksum = 2537675455, serialized key size = 1, serialized value size = 19, key = 1, value = ddddddddd洪1000248)
ConsumerRecord(topic = page_visits5, partition = 1, offset = 609, CreateTime = 1499752027860, checksum = 3762743849, serialized key size = 1, serialized value size = 19, key = 1, value = ddddddddd洪1000249)

product代码

@Test
    public  void assignPartitionByKey() throws Exception {
        try {

            //Assign topicName to string variable
            String topicName = "page_visits5";
            Producer producer = getProducer();


            for (int i = 0; i < 50; i++) {
                for(int j=0;j<2;j++) {
                    producer.send(new ProducerRecord(topicName,
                            Integer.toString(j), "ddddddddd洪10002" + i));

                    System.out.println("Message sent successfully");
                }
            }
            producer.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

两个producer指定partition的发送消息

 @Test
    public void testCustomerByPartitionOne() throws Exception {
        //Kafka consumer configuration settings
        String topicName = "page_visits5";
        Properties props = new Properties();
        KafkaConsumer<String, String> consumer = getKafkaConsumer(props);
        //Kafka Consumer subscribes list of topics here.
        //这里支持配置多个topic

        TopicPartition partition0 = new TopicPartition(topicName, 0);
        consumer.assign(Arrays.asList(partition0));

        //print the topic name
        System.out.println("Subscribed to topic " + topicName);
        int i = 0;
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(100);
            if (!records.isEmpty()) {
                System.out.println("======one===================");
            }
            for (ConsumerRecord<String, String> record : records) {
                System.out.println(record);
            }
            //    readPartition(consumer, records);


        }
    }

    @Test
    public void testCustomerByPartitionTwo() throws Exception {
        //Kafka consumer configuration settings
        //  String topicName = "page_visits4";
        Properties props = new Properties();
        KafkaConsumer<String, String> consumer = getKafkaConsumer(props);
        //Kafka Consumer subscribes list of topics here.
        //这里支持配置多个topic
        String topic = "page_visits5";
        TopicPartition partition1 = new TopicPartition(topic, 1);
        consumer.assign(Arrays.asList(partition1));

        //print the topic name
        System.out.println("Subscribed to topic " + topic);
        int i = 0;
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(100);
            if (!records.isEmpty()) {
                System.out.println("======two===================");
            }
            for (ConsumerRecord<String, String> record : records) {
                System.out.println(record);
            }
            //    readPartition(consumer, records);


        }
    }

更多使用请参考官方：http://kafka.apache.org/0100/javadoc/org/apache/kafka/clients/producer/KafkaProducer.html

3.消费者

10.0的kafka的consumer比老版本的提供手动确认Manual Offset Control功能。
介绍一下Consumer Rebalance的概念。在多个app实例前提下，Kafka保证同一consumer group中只有一个consumerApp实例会消费某一条消息。实际上，Kafka保证的是稳定状态下每一个consumer实例只会消费某一个或多个特定 partition的数据，而某个partition的数据只会被某一个特定的consumer实例所消费。这样设计的劣势是无法让同一个 consumer group里的consumer均匀消费数据，优势是每个consumer不用都跟大量的broker通信，减少通信开销，同时也降低了分配难度，实现也更简单。另外，因为同一个partition里的数据是有序的，这种设计可以保证每个partition里的数据也是有序被消费。
如果某consumer group中consumer数量少于partition数量，则至少有一个consumer会消费多个partition的数据，如果consumer 的数量与partition数量相同，则正好一个consumer消费一个partition的数据，而如果consumer的数量多于 partition的数量时，会有部分consumer无法消费该topic下任何一条消息。 partition.assignment.strategy = [org.apache.kafka.clients.consumer.RangeAssignor]
参考文档：http://www.cnblogs.com/coprince/p/5893066.html ，
官网还提供指定partition消费，重置consumer消费的offset位置，KafkaConsumer api及例子

 /**
     * http://www.tutorialspoint.com/apache_kafka/apache_kafka_simple_producer_example.htm
     *
     * @throws Exception
     */
    // @Test
    public void testCustomer() throws Exception {


        //Kafka consumer configuration settings
        String topicName = "page_visits5";
        Properties props = new Properties();
        KafkaConsumer consumer = getKafkaConsumer(props);
        //Kafka Consumer subscribes list of topics here.
        //这里支持配置多个topic
        consumer.subscribe(Arrays.asList(topicName, "page_visits5"));
        //print the topic name
        System.out.println("Subscribed to topic " + topicName);
        int i = 0;
        while (true) {
            ConsumerRecords records = consumer.poll(100);
            if (!records.isEmpty()) {
                System.out.println("=========================");
            }
            for (ConsumerRecord record : records) {
                System.out.println(record);
            }
            //     readPartition(consumer, records);


        }
    }

    private KafkaConsumer getKafkaConsumer(Properties props) {
        props.put("bootstrap.servers", "172.16.1.248:9092,172.16.1.248:9093");
        //  props.put("bootstrap.servers", "172.16.30.13:9095,172.16.30.13:9096");

        props.put("group.id", "group-2");

        props.put("enable.auto.commit", "true");
        props.put("auto.commit.interval.ms", "1000");
        //每次poll方法调用都是client与server的一次心跳
        props.put("session.timeout.ms", "30000");
        //so it's natural to want to set a limit on the number of records handled at once. This setting provides that
        // . By default, there is essentially no limit.
       // props.put("max.poll.records", "2");
        props.put("key.deserializer",
                "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer",
                "org.apache.kafka.common.serialization.StringDeserializer");
        return new KafkaConsumer(props);
    }

4.手动确认消息

kafka 9.0以后提供手动控制offset。通过下面的实验明白可以控制。
需要把enable.auto.commit=false，关闭自动提交。可以按其partition批量提交，也一条一条提交。
目前生产场景还没实例验证其稳定性，实践注意相关测试。
consumer code

 @Test
    public void testCustomerByOneByOne() throws Exception {
        //Kafka consumer configuration settings
        //  String topicName = "page_visits4";
        Properties props = new Properties();
        KafkaConsumer<String, String> consumer = getKafkaConsumer(props, false);
        //Kafka Consumer subscribes list of topics here.
        //这里支持配置多个topic
        String topic = "page_visits5";
//        TopicPartition partition1 = new TopicPartition(topic, 1);
//        consumer.assign(Arrays.asList(partition1));
        consumer.subscribe(Arrays.asList(topic));
        //print the topic name
        System.out.println("Subscribed to topic " + topic);
        int i = 0;

        try {
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(1000);
                for (TopicPartition partition : records.partitions()) {
                    List<ConsumerRecord<String, String>> partitionRecords = records.records(partition);
                    for (ConsumerRecord<String, String> record : partitionRecords) {
                        // System.out.println(record.offset() + ": " + record.value());
                        System.out.println(record);
                         // one by one 提交
                        long lastOffset=record.offset();
                        consumer.commitSync(Collections.singletonMap(partition, new OffsetAndMetadata(lastOffset + 1)));
                    }

                      // 批量
//                    long lastOffset = partitionRecords.get(partitionRecords.size() - 1).offset();/
//                    // 这个提交数量 与 max.poll.records取的数量有关，
//                    consumer.commitSync(Collections.singletonMap(partition, new OffsetAndMetadata(lastOffset + 1)));
                }
            }
        }catch(Exception e){
            e.printStackTrace();
        } finally {
            consumer.close();
        }

    }

批量监控offset


[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ ./bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --zookeeper 172.16.30.13:2181 --group group-new --topic page_visits5
[2017-07-12 10:32:25,130] WARN WARNING: ConsumerOffsetChecker is deprecated and will be dropped in releases following 0.9.0. Use ConsumerGroupCommand instead. (kafka.tools.ConsumerOffsetChecker$)
Group           Topic                          Pid Offset          logSize         Lag             Owner
group-new       page_visits5                   0   300             400             100             none
[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ 
[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ ./bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --zookeeper 172.16.30.13:2181 --group group-new --topic page_visits5
[2017-07-12 10:33:02,699] WARN WARNING: ConsumerOffsetChecker is deprecated and will be dropped in releases following 0.9.0. Use ConsumerGroupCommand instead. (kafka.tools.ConsumerOffsetChecker$)
Group           Topic                          Pid Offset          logSize         Lag             Owner
group-new       page_visits5                   0   300             400             100             none
[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ 
[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ 
[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ ./bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --zookeeper 172.16.30.13:2181 --group group-new --topic page_visits5
[2017-07-12 10:35:10,992] WARN WARNING: ConsumerOffsetChecker is deprecated and will be dropped in releases following 0.9.0. Use ConsumerGroupCommand instead. (kafka.tools.ConsumerOffsetChecker$)
Group           Topic                          Pid Offset          logSize         Lag             Owner
group-new       page_visits5                   0   310             400             90              none

one by one监控


[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ ./bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --zookeeper 172.16.30.13:2181 --group group-new --topic page_visits5
[2017-07-12 11:01:30,047] WARN WARNING: ConsumerOffsetChecker is deprecated and will be dropped in releases following 0.9.0. Use ConsumerGroupCommand instead. (kafka.tools.ConsumerOffsetChecker$)
Group           Topic                          Pid Offset          logSize         Lag             Owner
group-new       page_visits5                   0   311             500             189             none
[work@iZbp14iiauukqckkhyphv9Z kafka_2.10-0.10.0.1]$ ./bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --zookeeper 172.16.30.13:2181 --group group-new --topic page_visits5
[2017-07-12 11:01:46,404] WARN WARNING: ConsumerOffsetChecker is deprecated and will be dropped in releases following 0.9.0. Use ConsumerGroupCommand instead. (kafka.tools.ConsumerOffsetChecker$)
Group           Topic                          Pid Offset          logSize         Lag             Owner
group-new       page_visits5                   0   315             500             185             none

五.8.0 旧client

kafka 8.0 client api代码在10.0版本依然保留了。但是client的version必须升级10.0才能与其server通讯。
在10.0版本，老api与新api的producer，consumer是互通的。
老版本producer生产者有序性实践参考新版本的producer。

1.生产者

import kafka.javaapi.producer.Producer;
import kafka.producer.KeyedMessage;
import kafka.producer.ProducerConfig;

import java.util.Properties;


public abstract class ProducerUtil {
    private static Properties props = new Properties();// 配置文件
    private static Producer producer = null;// 生产者

    private static Producer oldProducer = null;// 生产者


    static {
        if (producer == null) {
            // props.put("metadata.broker.list", "localhost:9092,");
            props.put("metadata.broker.list", "172.16.1.248:9092,172.16.1.248:9093");
            // ce
            //    props.put("metadata.broker.list", "172.16.1.248:9095");

            props.put("serializer.class", "kafka.serializer.StringEncoder");
            props.put("key.serializer.class", "kafka.serializer.StringEncoder");

            // key.serializer.class默认为serializer.class
            // props.put("partitioner.class", "com.magic.cd.test.PartitionerDemo");
            // 可选配置，如果不配置，则使用默认的partitioner
            props.put("request.required.acks", "1");
            producer = new Producer(new ProducerConfig(props));
        }
    }


   // 普通测试
    @Test
    public void testProducer2() throws Exception {
        try {
            //  ProducerUtil.sendMsg("page_visits4", "bbk", "你好一般测试！");
            long b1 = System.currentTimeMillis();
            for (int i = 0; i < 10; i++) {
                ProducerUtil.sendMsg("page_visits4", "bbk", "你好一般测试！" + i);

            }
            long b2 = System.currentTimeMillis();
            System.out.println("时间：" + (b2 - b1));
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

2.消费者

下面的例子是consumer生产的多线程消费版本。结合上面提到consumer线程数与partition的关系，结合生产app实例数。在设置topicCountMap.put(KafkaConfigUtils.ORDER_TOPIC_NAME, topicCount); 请注意。如果是单app ，topicCount应该大于等于partition数。


    private static Properties props = new Properties();// 配置文件
    private static Producer producer = null;// 生产者

    private static int topicCount = 3;
    /**
     * 消费者，消费线程池
     */
    private ExecutorService executor = Executors.newFixedThreadPool(topicCount);

   * 初始化消费者,8-5暂停该类的xiao
     */
    @PostConstruct
    public void initCustomer() {
        logger.debug("=======System  start init consumer client.===================");
        if (!KafkaConfigUtils.IS_START_CONSUMER) {
            logger.debug("System do not start consumer client.");
            return;
        }
        new Thread(new CustomerKafka()).start();
    }


    /**
     * 消费者启动线程
     *
     * @author my
     * @Date 2016年3月30日 上午11:09:11
     */
    public class CustomerKafka implements Runnable {
        public void run() {
            logger.debug("system starting listern kafka message.");
            ConsumerConnector consumer = ConsumerConnector();
            while (consumer == null) {
                try {
                    Thread.sleep(600000); // 60 second
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                consumer = ConsumerConnector(); // reconnect
            }

            logger.debug(" kafka connector success.");

            snapshotService.initSnapshotRule();
            logger.debug(" snapshot rule init success ");

            // 3.通过消费者获取流
            Map topicCountMap = new HashMap();
            topicCountMap.put(KafkaConfigUtils.ORDER_TOPIC_NAME, topicCount);// 数字表示通过几个流执行
            Mapbyte[], byte[]>>> consumerMap = consumer.createMessageStreams(topicCountMap);
            final Listbyte[], byte[]>> streams = consumerMap.get(KafkaConfigUtils.ORDER_TOPIC_NAME);


            logger.debug("read streams ");
            // 4.读取消息
            for (int i = 0; i < streams.size(); i++) {
                final KafkaStream stream = streams.get(i);
                executor.execute(new Runnable() {
                    public void run() {
                        ConsumerIterator<byte[], byte[]> it = stream.iterator();
                        while (it.hasNext()) {
                            byte[] each = it.next().message();
                            String message = new String(each);
                            logger.info("receive order message:" + StringUtils.substring(message, 0, 500) + "........");
                            // logger.debug("receive order message:" + message);
                            //  saveOrderMessageTwo(message);

                            saveOrderMessageThree(message);
                        }
                    }
                });
            }
        }



public static Map getKafkaConsumer(boolean commintFlag) {
        Map props = new HashMap<>();
        //  props.put("bootstrap.servers", "172.16.1.248:9092,172.16.1.248:9093");

        // props.put("bootstrap.servers", "172.16.30.13:9093");
        //开发测试环境
        props.put("bootstrap.servers", "172.16.30.13:9095,172.16.30.13:9096");

        props.put("group.id", "group-new");
        /**
         * 1.
         *
         */
        props.put("enable.auto.commit", String.valueOf(commintFlag));

        /**
         * 1.自动提交offset间隔时间，•可以这样理解：第二次poll调用的时候，提交上一次poll的offset和心跳发送。
         * 2. 而且是交付一个DelayedTaskQueue 来完成的
         */
        props.put("auto.commit.interval.ms", "1000");


        /**
         * 意思每次心跳间隔时间，要求不高于session.timeout.ms时间1/3
         */
        //  props.put("heartbeat.interval.ms", "1000");

        props.put("session.timeout.ms", "30000");

        /**
         * auto.offset.reset 默认值为largest，那么auto.offset.reset 有什么作用呢？auto.offset
         * .reset定义了Consumer在ZooKeeper中发现没有初始的offset时或者发现offset非法时定义Comsumer的行为，常见的配置有：
         *1.smallest : 自动把offset设为最小的offset；
         *2.largest : 自动把offset设为最大的offset；
         *3.anything else: 抛出异常；
         *
         *遇到过这种情况：先produce一些数据，然后停止produce数据的线程——〉
         * 然后再用consumer 新的group上面的代码消费数据，发现无数据可消费！
         *
         *其原因在于：初始的offset默认是非法的，而auto.offset.reset 默认值为largest，表示自动把offset设为最大的offset，由于此时没有生产者向kafka
         * push数据，当然没有数据可以消费了。如果此时有生产者向kafka push数据，那么该代码可以从最新位置消费数据。
         */
        props.put("auto.offset.reset", "earliest");
        /**
         * so it's natural to want to set a limit on the number of records handled at once. This setting provides that
         * . By default, there is essentially no limit.
         * 1.我发现offset的每次确认与心跳都是在调用poll方法的时候触发，建议max.poll.records设置为100-400的数量，如果你处理速度慢建议低些。
         *
         */
        props.put("max.poll.records", "10");


        props.put("key.deserializer",
                "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer",
                "org.apache.kafka.common.serialization.StringDeserializer");
        // return new KafkaConsumer(props);
        return props;
    }

六升级兼容使用

如果你的app中有老kafka0.8的client代码依赖，请直接使用下面新的clients与老api完全隔离，不相冲突。
如果你producer也添加新依赖，重新构建producer来实现新业务。
如果你是consumer，如果老topic还有大量message未消费。则让新老consumer获取同时调用你业务处理逻辑来完成上线老client没有获取的message。

<dependency>
            <groupId>org.apache.kafkagroupId>
            <artifactId>kafka-clientsartifactId>
            <version>0.10.0.0version>
 dependency>

请不使用如下dependency来构建新的kafka client。

<dependency>
            <groupId>org.apache.kafkagroupId>           
            <artifactId>kafka_2.10artifactId>
            <version>0.10.0.0version>
dependency>

七.问题反馈

1.producer采用什么发送模式。

producer采用异步批量的发送模式，由单独sender线程来完成发送，发送机制根据batch.size （批量累积的大小），linger.ms（发送间隔时间）来触发发送。我们通过指定key或者 partition也是批量异步发送。请关注上面producer参数描述。
在KafkaProducer在构造方法里初始化RecordAccumulator，Sender两个组件。
RecordAccumulator是一个record缓存器，它按照不同的TopicPartition有序的存储RecordBatch。
Sender是一个独立发送线程，在不断的轮询读取RecordAccumulator。按max.request.size读RecordBatch组装request发送给broker
更多细节参考代码与文档 http://www.cnblogs.com/byrhuangqiang/p/6392532.html

2.一个队列最重要的就是消息丢失问题，kafka是如何处理的？

kafka producer都是异步发送。每次发送数据时，Producer都是send()之后就认为已经发送出去了，但其实大多数情况下消息还在内存的RecordAccumulator当中。这时候如果Producer挂掉，那就会出现丢数据的情况。或者发送失败，客服端不能明确知道消息是否成功。
解决办法： ack机制，一般设置为acks=1，消息只需要被Leader接受并确认即可，这样同时保证了可靠性和效率。对于我们想明确指定消息是否成功，请在producer.send 实现其callback方法，callback方法是在明确server返回后的回调机制。请用单独日志文件打印来跟踪丢失的消息。

3.producer是怎么更新Metadata信息的？

Metadata指topic的partition的leader，follower信息，及broker节点信息。producer在每次发送时候都会检查Metadata的有效性。有周期性，及失效后更新。更多关注http://www.cnblogs.com/byrhuangqiang/p/6377961.html
由于Metadata支持更新，所以动态水平的扩展broker是没有问题的。

4. kafka consumer的rebalance机制

rebalance机制的意思，kafka怎么样根据group的实例数量来动态的分配topic的partition数量，来提高并发效率。每次poll方法的时候都会与broker保持心跳，更新server信息及consumer的信息。
举一个例子描述consumer rebalance机制：


    1. 我通过测试例子来观察，2个partition的topic。只有一个consomer a instance的时候，两个partition都会由a实例轮询消费。
    2. 再添加第2个消费 b instance后，partition会立即自动重新分配，由a,b应用各自负责一个partition消费。
    3. 再关掉b 实例后，partition又会立即自动重新分配，由a 实例轮询消费partition。

5. Consumer消费者的工作过程

在consumer启动时或者coordinator节点故障转移时，consumer发送ConsumerMetadataRequest（请求topic的partition等信息）给任意一个brokers。在ConsumerMetadataResponse中，它接收对应的Consumer Group所属的Coordinator的位置信息。
Consumer连接Coordinator节点，并发送HeartbeatRequest。如果返回的HeartbeatResponse中返回IllegalGeneration错误码，说明协调节点已经在初始化平衡。消费者就会停止抓取数据，提交offsets，发送JoinGroupRequest给协调节点。在JoinGroupResponse，它接收消费者应该拥有的topic-partitions列表以及当前Consumer Group的新的generation编号。这个时候Consumer Group管理已经完成，Consumer就可以开始fetch数据，并为它拥有的partitions提交offsets。
如果HeartbeatResponse没有错误返回，Consumer会从它上次拥有的partitions列表继续抓取数据，这个过程是不会被中断的。
这些通讯步骤都在poll函数中异步完成。参考http://www.cnblogs.com/byrhuangqiang/p/6372600.html

你可能感兴趣的:(kafka)

Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
全面指南：用户行为从前端数据采集到实时处理的最佳实践数字沉思营销流量运营系统架构前端内容运营大数据
引言在当今的数据驱动世界，实时数据采集和处理已经成为企业做出及时决策的重要手段。本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过Flink实时处理数据的完整流程。无论你是想提升产品体验还是做用户行为分析，这篇文章都将为你提供全面的解决方案。设计一个通用的ClickHouse表来存储用户事件时，需要考虑多种因素，包括事件类型、时间戳、用户信
Docker安装Kafka和Kafka-Manager 阿靖哦
本文介绍如何通过Docker安装kafka与kafka界面管理界面一、拉取zookeeper由于kafka需要依赖于zookeeper，因此这里先运行zookeeper1、拉取镜像dockerpullwurstmeister/zookeeper2、启动dockerrun-d--namezookeeper-p2181:2181-eTZ="Asia/Shanghai"--restartalwayswu
主流行架构 rainbowcheng 架构架构
nexus，gitlab,svn,jenkins,sonar,docker，apollo，catteambition，axure，蓝湖，禅道,WCP；redis，kafka，es，zookeeper，dubbo，shardingjdbc，mysql，InfluxDB，Telegraf，Grafana，Nginx，xxl-job，Neo4j,NebulaGraph是一个高性能的,NOSQL图形数据库
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
分布式消息队列Kafka 叶域大数据分布式 kafka scala spark
分布式消息队列Kafka简介：Kafka是一个分布式消息队列系统，用于处理实时数据流。消息按照主题（Topic）进行分类存储，发送消息的实体称为Producer，接收消息的实体称为Consumer。Kafka集群由多个Kafka实例（Server）组成，每个实例称为Broker。主要用途：广泛应用于构建实时数据管道和流应用程序，适用于需要高吞吐量和低延迟的数据处理场景依赖：Kafka集群和消费者依
K8S学习之PV&&PVC david161
部署mysql之前我们需要先了解一个概念有状态服务。这是一种特殊的服务，简单的归纳下就是会产生需要持久化的数据，并且有很强的I/O需求，且重启需要依赖上次存储到磁盘的数据。如典型的mysql，kafka，zookeeper等等。在我们有比较优秀的商业存储的前提下，非常推荐使用有状态服务进行部署，计算和存储分离那是相当的爽的。在实际生产中如果没有这种存储，localPV也是不错的选择，当然local
Kafka系列之：kafka命令详细总结快乐骑行^_^ 日常分享专栏 Kafka Kafka系列 kafka命令详细总结
Kafka系列之：kafka命令详细总结一、添加和删除topic二、修改topic三、平衡领导者四、检查消费者位置五、管理消费者群体一、添加和删除topicbin/kafka-topics.sh--bootstrap-serverbroker_host:port--create--topicmy_topic_name\--partitions20--replication-factor3--con
搭建Kafka+zookeeper集群调度 krb___ kafka 分布式
前言硬件环境172.18.0.5kafkazk1Kafka+zookeeperKafkaBroker集群172.18.0.6kafkazk2Kafka+zookeeperKafkaBroker集群172.18.0.7kafkazk3Kafka+zookeeperKafkaBroker集群软件环境zookeeper3.5.9资源调度、写作Kafka2.8.0消息通信中间件安装JDK1.8安装搭建zo
Kafka和Pulsar深入解析 jasen91 大数据开发 kafka 分布式
Kafka多租户：单租户系统数据迁移：依赖MirrorMaker，需要额外维护。市场上也有ConfluentReplicator等供应商工具。分层存储：由供应商提供商业使用。组件依赖：KafkaRaft（KRaft）从Kafka2.8开始处于早期访问模式，允许Kafka在没有ZooKeeper的情况下工作。这对Kafka来说是一个显著的优势，因为它简化了Kafka的体系结构并降低了学习成本。云原生
Linux系统部署Kafka教学情书学长 linux 学习笔记 kafka
第一步：Zookeeper安装（准备工作）1、解压安装将安装包上传到/opt/software目录下，解压并修改名称tar-zxvfapache-zookeeper-3.5.7-bin.tar.gz-C/opt/module/mvapache-zookeeper-3.5.7-bin/zookeeper2、配置服务器编号1)在/opt/module/zookeeper-3.5.7/这个目录下创建zk
数仓开发之DWD层完整使用 (第五章) 小坏讲微服务数据仓库 hadoop scala kafka
数仓开发之DWD层完整使用一、流量域未精加工的事务事实表1、主要任务1）数据清洗（ETL）2）新老访客状态标记修复3）分流2、思路1）数据清洗（ETL）2）新老访客状态标记修复（1）前端埋点新老访客状态标记设置规则（2）新老访客状态标记修复思路3）利用侧输出流实现数据拆分（1）埋点日志结构分析（2）分流日志分类（3）分流思路3、图解4、代码1）在KafkaUtil工具类中补充getKafkaPro
Kafka 应用场景 zinuxer kafka 分布式
数据流处理：Kafka支持实时数据流处理，能够在数据流动时进行处理和分析，确保应用程序与最新信息保持同步！日志聚合：可以将来自不同来源的日志集中和聚合，简化应用程序的调试和监控！消息队列：Kafka充当高性能的消息队列，确保不同系统组件之间可靠且可扩展的通信！网络活动追踪：Kafka可以追踪网络活动，改进用户体验和推动业务增长！数据复制：Kafka允许在多个集群之间实现无缝数据复制，确保高可用性和
Kafka的ack机制香山上的麻雀
ack=0/1/-1的不同情况：0：producer不等待broker的ack，broker一接收到还没有写入磁盘就已经返回，当broker故障时有可能丢失数据；1：producer等待broker的ack，partition的leader落盘成功后返回ack，如果在follower同步成功之前leader故障，那么将会丢失数据；-1：producer等待broker的ack，partition的
Kafka 实战 - Kafka分区和副本机制理解用心去追梦 kafka 分布式
ApacheKafka的分区（Partition）和副本（Replica）机制是其核心架构和可靠性保证的关键组成部分。以下是对其理解的详细解释：分区（Partition）分区概念：在Kafka中，每个主题（Topic）可以被划分为多个分区。分区是一个有序的、不可变的消息序列。这意味着消息在分区中按生成顺序存储，每个消息都有一个唯一的偏移量（Offset）。目的：分区的主要目的是为了水平扩展和并行处
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
zookeeper+kafka消息队列部署 TBF610218 zookeeper kafka 分布式
消息队列的概念什么是消息队列消息是指在应用间传送的数据消息队列是一种应用间的通信方式解决方法，确保消息的可靠传递专门为消息做缓存的消息队列的特征存储将消息存储在某个类型的缓冲区中，指导目标进读取这些消息或者将其从消息队列中显示移除为止异步消息队列通过缓冲消息可以在应用程序当中公开一定程度的异步性，允许源进程发送消息并在队列当中累积消息，而且目标进程可以挑选消息并进行处理为什么需要消息队列解耦冗余扩
分布式中间件-几个常用的消息中间件问道飞鱼分布式技术分布式中间件
文章目录常见消息中间件1.RabbitMQ2.ApacheKafka3.RedisPub/Sub4.ActiveMQ5.AmazonSimpleNotificationService(SNS)和SimpleQueueService(SQS)6.RocketMQ差异总结消息协议1.AMQP(AdvancedMessageQueuingProtocol)2.STOMP(SimpleTextOrient
kafka php 教程,php 使用kafka weixin_39713841 kafka php 教程
准备工作gitclonehttps://github.com/edenhill/librdkafka.git./configuremakesudomakeinstall$gitclonehttps://github.com/arnaud-lb/php-rdkafka.git#生成configure文件$/Users/shiyibo/LNMP/php/bin/phpize#编译安装$./config
Kafka快速入门 G丶AEOM 速成学习区 kafka linq 分布式
讲一下什么是Kafka首先引入这样一个场景：A服务可以发送200qps（QueriesPerSecond，是指每秒查询率），而B服务可以处理100qps。很显然，B服务很可能会被A服务压垮掉。怎么为了保证B不被压垮的同时还能处理A消息，没有什么是不能通过一层中间件解决的，如果有，那就再加一层。开始很容易想到，可以在B服务中增加一个队列，其实就是个链表，B服务根据自己的消费能力，消费链表中的消息。每
【Python系列】异步任务的终止 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
老版本kafka查询topic消费情况(python查询) 代码是谁 kafka python 分布式
由于老版本的kafka缺少shell，导致无法通过命令直接进行查询，所以通过python代码，实现消费情况查询安装必须的包#pyhon2.5pipinstallkafka-python==1.4.7python脚本#!/usr/bin/envpythonimportsysfromkafkaimportKafkaConsumer,TopicPartitioniflen(sys.argv)!=2:pr
【Python系列】使用切片移动元素位置 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
字节架构师：来说说 Kafka 的消费者客户端详解，你都搞懂了吗？ 2401_84049200 程序员 kafka linq 分布式
点对点模式基于队列，类似于同一个消费者组中的数据，由生产者发送数据到分区，然后消费者拉取分区的消息进行消费，此时消息只能被同一个消费者组的消费者消费一次。发布订阅模式模式就是kafka中的分区消息可以被不同消费者组的消费者消费。这就是一对多的广播模式应用。当然，消费者组是一个逻辑的概念，通过客户端参数group.id来配置，默认值为空字符串。而消费者并不是逻辑的概念，它是真正消费数据的实体，可以是
Java Kafka生产者实现 stormsha Java web java kafka linq
欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：「stormsha的主页」，「stormsha的知识库」持续学习，不断总结，共同进步，为了踏实，做好当下事儿~专栏导航Python系列:Python面试题合集，剑指大厂Git系列:Git操作技巧GO系列:记录博主学习GO语言的笔记，该笔记专栏
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

kafka 0.10 client使用例子

一.前言

二.topic,group规范

三.思考

四.10.0后新client

1.生产者

2.生产者有序性

3.消费者

4.手动确认消息

五.8.0 旧client

1.生产者

2.消费者

六 升级兼容使用

七.问题反馈

1.producer采用什么发送模式。

2.一个队列最重要的就是消息丢失问题，kafka是如何处理的？

3.producer是怎么更新Metadata信息的？

4. kafka consumer的rebalance机制

5. Consumer消费者的工作过程

你可能感兴趣的:(kafka)

六升级兼容使用