水木渔樵

Kafka消费者客户端详解

文章目录

- 引言
- 1. 消费组
- - - 消费组(Consumer Group)与分区(Partition)
    - 消费组中只有一个消费者
    - 消费组中消费者数量与分区数量相同
    - 消费组中消费者数量少于分区数
    - 消费组中消费者数量大于分区数
    - 多个消费组订阅相同的主题
- 2. 分区分配策略
- - 2.1 RangeAssignor分区分配策略
  - - 4个分区两个消费者
  - 2.2 RoundRobinAssignor分区分配策略
  - - 消费组内每个消费者都订阅了两个主题
    - 消费组内消费者订阅的主题不同
  - 2.3 StickAssignor分区分配策略
- 3. 两种消息投递模式
- - 3.1 点对点模式
  - 3.2 发布/订阅模式
- 4. 消费者Java客户端
- - - 必备参数配置
  - 4.1 订阅主题
  - 4.2 订阅分区
  - 4.3 取消订阅
- 5. 再均衡
- - 5.1 再均衡监听器
- 6. 消息消费
- - 6.1 poll消费
  - 6.2 指定位移消费
  - 6.3 控制或关闭消费
- 7. 位移提交
- - 7.1 位移提交时机
  - - 拉取完消息立即提交
    - 消费完所有消息后才提交
    - 自动提交-定期提交
    - 手动提交
- 8. 反序列化器
- - 8.1 自定义反序列化器
- 9. 拦截器
- 10. 多线程
- 参考文献

引言

消费者（Consumer）负责订阅Kafka中的主题，并且从订阅的主题上拉取消息。
与其他一些消息中间件不同，在Kafka的消费理念中还有一层消费组（Consumer Group）的概念;

1. 消费组

一个消费组(Group)内有一个到多个消费者(Consumer)；
一个消费者(Consumer)只属于一个消费组；
一个消费组可以同时订阅多个主题；
不同的消费组可以订阅相同的主题；
一个消费组内的不同消费者可以订阅不同的主题；当然也可以订阅相同的主题；
当消息发布到主题后，只会被投递到订阅它的每个消费组中的一个消费者；

消费组(Consumer Group)与分区(Partition)

消费组实际上是和主题相对应的，消费组里的消费者根据分区分配策略会把主题下的分区给分配了，每个消费者可以消费分配的分区里的消息；
主题下包含多个分区，向主题发送消息时，消息会发往其中一个分区；
- 具体是将消息发送到哪一个分区，与消息的key和partition属性有关；
消费组订阅主题时，消费组中的一个消费者会接收到发往该主题的消息；
- 具体是哪一个消费者接收到消息，与分区分配策略有关；
- 当消费组中只有一个消费者时，它接收所有分区的消息，当消费者个数与分区个数相同时，一个消费者接收一个分区的消息；更普通的情况是一个消费者接收多个分区的消息，并且尽量使分配均匀

消费组中只有一个消费者

如果一个消费组(Group)里只有一个消费者(Consumer)，那么这个消费者(Consumer)可以消费发送到所有分区里的消息；

消费组中消费者数量与分区数量相同

如果Group中的Consumer数量与分区数相同，则每个Consumer分配一个分区，当消息发送到一个分区时，分配对应分区的Consumer可以消费消息；

消费组中消费者数量少于分区数

如果Group中Consumer数量少于分区数，则按照分区分配策略将分区尽可能均匀的分配给各个Consumer，每个Consumer可以消费发送给对应分区的消息

消费组中消费者数量大于分区数

如果Group中Consumer数量大于分区数，那么会有一部分Consumer分配不到分区，其他Consumer一对一分配分区；

多个消费组订阅相同的主题

多个消费组订阅相同的主题时，消费组之间互不影响，发往主题的消息会同时被两个消费组接收到，具体是消费组内哪个Consumer接收到消息由分区分配策略决定；

2. 分区分配策略

Kafka提供了消费者客户端参数partition.assignment.strategy来设置消费者与订阅主题之间的分区分配策略。
Kafka提供了三种分区分配策略：RangeAssignor、RoundRobinAssignor、StickyAssignor；
partition.assignment.strategy的默认参数是org.apache.kafka.clients.consumer.RangeAssignor，即默认使用RangeAssignor分区分配策略；

2.1 RangeAssignor分区分配策略

RangeAssignor分区分配策略的原理是：按照消费者总数和分区总数进行整除运算来获得一个跨度，然后将分区按照跨度进行平均分配，以保证分区尽可能均匀地分配给所有的消费组；
RangeAssignor会将消费组内所有订阅这个主题的消费者按名称的字典顺序排序，然后为每个消费者划分固定的分区范围，如果不够平均分配，那么字典靠前的消费者会被多分配一个分区；

4个分区两个消费者

假设主题T0有4个分区：P0、P1、P2、P3，消费组内有两个消费者:C0、C1，则RangeAssinger策略分区分配方案是：

T0: P0   P1   P2  P3
    |    |    |   |
    C0   C0   C1  C1

假设主题T1有3个分区：P0、P1、P2 ，消费者内有两个消费者:C0、C1，则RangeAssigner策略的分区分配方案是：

T1: P0  P1  P2
    |   |   |
    C0  C0  C1

可见，分区是按范围分配给每个消费者的；

2.2 RoundRobinAssignor分区分配策略

RoundRobinAssignor分区分配策略的原理是：将消费组内所有消费者及消费组订阅的所有主题的分区按照字典序排序，然后通过轮询方式逐个将分区依次分配给每个消费者；
注意，RoundRobinAssignor会把消费组订阅的所有主题的所有分区排序；

消费组内每个消费者都订阅了两个主题

假设消费组中有两个消费者:C0、C1；
每个消费者都订阅了主题T0和T1；
每个主题中都有3个分区；
则最终的分配结果是：

TO: P0  P1  P2
T1: P1  P1  P2

消费者排序： C0  C1
所有分区排序： T0P0  T0P1  T0P2  T1P0  T1P1  T1P2

轮询分配：T0P0  T0P1  T0P2  T1P0  T1P1  T1P2
            |     |     |     |     |     |
           C0    C1    C0    C1    C0    C1

最终分配结果：
   消费者C0: T0P0、T0P2、T1P1
   消费者C1: T0P1、T1P0、T1P2

可见，分区是轮询着分配给各个消费者的；

消费组内消费者订阅的主题不同

假设消费组中有3个消费者:C0、C1、C2；
共订阅了三个主题T0、T1、T2，这三个主题分别有1、2、3个分区；
并不是三个消费者都订阅了这三个主题；
- C0只订阅了主题T0；
- C1同时订阅了主题T0和T1；
- C2同时订阅了主题T0、T1和T2;

消费组： C0、C1、C2

主题T0:  P0           <-订阅--C0  <-订阅--C1    <-订阅--C2
主题T1:  P0  P1                   <-订阅--C1    <-订阅--C2
主题T2:  P0  P1  P2                             <-订阅--C2

轮询分配： T0P0  T1P0  T1P1  T2P0  T2P1  T2P2
             |     |     |     |     |     |
            C0    C1    C2    C2    C2    C2

最终分配结果：
   消费者C0: T0P0
   消费者C1: T1P0
   消费者C2: T1P1、T2P0、T2P1、T2P2

可见，在这种情况下RoundRobinAssignor策略分配的并不均匀，这样分配其实并不是最优解；

2.3 StickAssignor分区分配策略

StickAssignor分配策略又叫粘性分配策略，它有两个目标：

(1) 分区的分配要尽可能均匀；
(2) 分区的分配尽可能与上次分配的保持相同；

当两者发生冲突时，第一个目标优先于第二个目标；

StickAssignor分配策略的实现比较复杂(书上并没有讲解，只给出了分配结果，网络上也没有找到好的讲解)，根据分配结果可以有以下推测：

当消费组中的所有消费者订阅的主题相同时，初始分配结果与RoundRobinAssignor分配策略的分配结果相同；
当消费组中的消费者订阅的主题不相同时，初始分配结果与RoundRobinAssignor不同，分配结果更加均匀；
当有一个消费者退出消费组时，RoundRobinAssignor会重新分配所有的分区，而StickAssignor会将退出的消费者分配的分区分配给其他消费者，未退出的消费者之前分配的分区尽量不会变化(粘性)；

3. 两种消息投递模式

对于消息中间件而言，一般有两种消息投递模式：点对点模式(P2P)和发布/订阅模式(Pub/Sub)

3.1 点对点模式

点对点模式中，生产者将消息发送到队列中，消费者从队列中取出并消费消息，消息被消费后队列不再存储，队列支持多个消费者。该模式有以下特点：

消息不可重复消费；
一个消息只会有一个消费者可以消费；

Kafak不是一种典型的点对点模式，但是通过合理的使用消费组(Consumer Group)，可以实现点对点模式：

如果订阅主题的所有的消费者(Consumer)都隶属于同一个消费组(Group)，那么发送给主题的所有消息都只会投递给其中一个消费者(Consumer)，即每条消息只会被一个消费者处理，这就相当于点对点模式的应用；

3.2 发布/订阅模式

发布订阅模式中，生产者将消息发布到topic中，同时有多个消费者可以消费到该消息。该模式的特点是：

消息可以重复消费；
一个消息会被所有订阅者消费；

Kafka是典型的发布/订阅模式，但是要实现发布/订阅模式还需要正确使用消费组的概念：

如果订阅主题的所有消费者(Consumer)都隶属于不同的消费组(Consumer Group)，那么发送给主题的所有消息都会被广播给所有的消费者(Consumer)，即每条消息会被所有的消费者处理，这就相当于发布/订阅模式的应用；

4. 消费者Java客户端



    org.apache.kafka
    kafka-clients
    2.0.0

public class ConsumerFastStart {
    public static final String brokerList = "localhost:9092";
    public static final String topic = "topic-learn";
    public static final String groupId = "group.demo";

    public static final AtomicBoolean isRunning = new AtomicBoolean(true);

    public static Properties initProperties() {
        Properties proper = new Properties();
        proper.put("bootstrap.servers", brokerList);
        proper.put("key.deserializer", StringDeserializer.class.getName());
        proper.put("value.deserializer",StringDeserializer.class.getName());
        proper.put("client.id", "consumer.client.id.demo");

        // 设置消费者所属的消费组的名称
        proper.put("group.id", groupId);

        return proper;
    }

    public static void main(String[] args) {
        Properties proper = initProperties();
        // 创建一个消费者客户端实例
        KafkaConsumer consumer = new KafkaConsumer<>(proper);
        // 订阅主题
        consumer.subscribe(Collections.singletonList(topic));

        // 循环消费消息
        System.out.println("====== 接收消息 ======");
        // 使用 AtomicBoolean来作为while循环，可以通过 isRunning.set(false)来结束下一轮循环
        while (isRunning.get()) {
            ConsumerRecords records = consumer.poll(Duration.ofMillis(1000));
            for (ConsumerRecord record : records) {
                System.out.println(record.value());
            }
        }
    }
}

bootstrap.servers、group.id、key.deserializer、value.deserializer是消费者客户端必填的参数；
为了防止参数名记错，可以使用ConsumerConfig里的常量；
消费者和生产者使用的常量不同，生产者使用的常量是ProducerConfig；

必备参数配置

bootstrap.servers：释义和生产者客户端KafkaProducer中的相同，指定连接kafka集群所需的broker地址清单；
group.id：消费者隶属的消费组，默认值为’’，这个是必填值，如果设置为空，会报异常；
key.deserializer和value.deserializer：用来指定消息中key和value所需的反序列化器，参数无默认值；需要和生产者客户端KafkaProducer中配置的key.serializer和value.serializer相对应；
client.id：用来设定KafkaConsumer对应的客户端id，默认值为’’，如果客户端不设置，则KafkaConsumer会自动生成一个非空字符串；
注意：这个参数不是必备参数；

4.1 订阅主题

KafkaConsumer订阅主题的方法有以下几个：

/**
 * KafkaConsumer订阅主题的方法
 */
public void subscribe(Collection topics);
public void subscribe(Collection topics, ConsumerRebalanceListener listener)

public void subscribe(Pattern pattern);
public void subscribe(Pattern pattern, ConsumerRebalanceListener listener);

消费者可以使用集合的方式同时订阅多个主题；但是如果是多次调用订阅方法，则会以最后一次订阅的为准；
消费者还可以使用正则表达式的方式订阅主题；
在订阅方法中可以传递一个再均衡监听器；再均衡监听器用来设定发生再均衡动作前后的一些准备或收尾动作；

4.2 订阅分区

KafkaConsumer还可以通过assign方法直接订阅分区

/**
 * KafkaConsumer的 assign方法
 */
public void assign(Collection partitions);

可以同时订阅多个分区；
订阅分区时，没有传递再均衡监听器（订阅主题时才会有再均衡）；

其中，TopicPartition对象代表主题的分区

/**
 * 主题分区对象
 */
 public final class TopicPartition implements Serializable {

    private int hash = 0;
    private final int partition;
    private final String topic;
    
    // ... 省略内部方法
}

4.3 取消订阅

KafkaConsumer中的unsubscribe方法可以用来取消订阅，既可以取消通过subscribe订阅的主题，也可以取消通过assign方法直接订阅的分区；

/**
 * KafkaConsumer的unsubscribe方法
 */
 public void unsubscribe();

5. 再均衡

再均衡是指分区的所属权从一个消费者移动到另一个消费者的行为；
在多个消费者的情况下，根据分区分配策略来自动分配消费者与分区的关系；
当消费组内的消费者增加或减少时，分区分配关系会自动调整，以实现消费负载均衡及故障自动转移；
通过subscribe方法订阅主题具有消费者自动再均衡的功能；而通过assign方法订阅分区时，是不具备消费者自动均衡功能的；
再均衡为消费组具备高可用性和伸缩性提供保障，使我们可以既方便又安全地删除消费组内的消费者或往消费组内添加消费者；
不过，在发生再均衡期间，消费组内的消费者是无法读取消息的，即在发生再均衡期间，消费组会变得不可用；
另外，当一个分区被重新分配给另一个消费者时，消费者当时的状态也会丢失，即还没有来得及提交的消费位移会丢失，新的消费者会重新消费还未提交消费位移的消息；

5.1 再均衡监听器

再均衡监听器接口

/**
 * 再均衡监听器接口
 */
public interface ConsumerRebalanceListener {
     
    void onPartitionsRevoked(Collection<TopicPartition> partitions);
    
void onPartitionsAssigned(Collection<TopicPartition> partitions);
}

再均衡监听器用来设定发生再均衡动作前后的一些准备或收尾动作；
onPartitionsRevoked方法：在再均衡开始之前和消费者停止读取消息之后被调用，参数partitions表示再均衡前所分配的分区；
onPartitionsAssigned方法：在重新分配分区之后和消费者开始读取消费之前被调用。参数partitions表示再均衡后所分配的分区；

6. 消息消费

消息的消费一般有两种模式：推模式和拉模式：

推模式：服务端主动将消息推送给消费者；
拉模式：消费者主动向服务器发起请求来拉取消息；

6.1 poll消费

Kafka中的消费是基于拉模式的；

Kafka中的消息消费是一个不断轮询的过程，消费者所要做的就是重复地调用poll()方法，而poll方法返回的是所订阅的主题（分区）上的一组消息；

/**
 * KafkaConsumer的poll方法
 */
@Deprecated
public ConsumerRecords poll(final long timeout);

public ConsumerRecords poll(final Duration timeout);

// 内部调用的方法
private ConsumerRecords poll(final long timeoutMs, final boolean includeMetadataInTimeout);

KafkaConsumer对外提供的poll方法有两个：poll(final long timeout)和poll(final Duration timeout)，参数传递一个超时时间，用来控制poll方法阻塞的时间，在消费者的缓冲区里没有可用数据时，会发生阻塞；
其中第一个已经标记为Deprecated，被第二个替代；因为第一个方法的时间单位固定为毫秒，第二个方法可以根据Duration中的ofMillis()、ofSeconds、ofHours等多种不同的方法指定不同的时间单位；
Duration是从jdk1.8开始添加的时间内，在包java.time包下；
poll方法内部会进行分区分配的逻辑，如果将参数设置为0，则该方法会立刻返回，内部的分区分配逻辑会来不及实施；
poll方法返回的是ConsumerRecords，它用来表示一次拉取操作所获得的消息集，内部包含了若干ConsumerRecord(不带s)；

/**
 * 消息集 ConsumerRecords 内部的方法
 */
 public class ConsumerRecords implements Iterable> {
    
    // 提取消息集中指定分区的消息
    public List> records(TopicPartition partition);

    // 提取消息集中指定主题的消息
    public Iterable> records(String topic);

    // 查看拉取的消息集中的分区列表
    public Set partitions();

    // 循环遍历消息集中的消息
    public Iterator> iterator();

    // 返回消息集中消息的个数
    public int count();
    
    // 判断消息集是否为空
    public boolean isEmpty();

    // ...
}

消费者拉取的消息ConsumerRecord:

/**
 * 消费者客户端拉取的消息 ConsumerRecord
 */
 public class ConsumerRecord {
    public static final long NO_TIMESTAMP = RecordBatch.NO_TIMESTAMP;
    public static final int NULL_SIZE = -1;
    public static final int NULL_CHECKSUM = -1;

    private final String topic;
    private final int partition;
    private final long offset;
    private final long timestamp;
    private final TimestampType timestampType;
    private final int serializedKeySize;
    private final int serializedValueSize;
    private final Headers headers;
    private final K key;
    private final V value;

    private volatile Long checksum;
    
    // ... 省略内部方法
}

泛型K代表key的类型；
泛型V代表value的类型；

6.2 指定位移消费

消费者消费完消息后会进行消费位移提交，Kafka将消费位移持久化，有了消费位移的持久化，才能使消费者在关闭、崩溃、再均衡时，能够让接替的消费者根据存储的消费位移继续进行消费；
但是当消费者找不到所记录的消费位移时（比如，新的消费组建立，或者一个新的消费者订阅了新的主题后），就会根据消费者客户端参数auto.offset.reset的配置来决定从何处开始进行消费；

auto.offset.reset参数取值：

latest，默认参数，会从分区末尾开始消费消息；
earlist，会从起始处开始消费；
none，表示出现查不到消费位移的时候，既不从最新的消息位置处开始消费，也不从最早的消息位置处开始消费，而是会报出NoOffsetForPartitionException异常；
说明：除了查找不到消费位移，位移越界也会触发auto.offset.reset参数的执行；

KafkaConsumer的seek方法提供可以从特定的位移处开始拉取消息：

/**
 * KafkaConsumer的seek方法
 */
public void seek(TopicPartition partition, long offset);

public void seekToBeginning(Collection partitions);

public void seekToEnd(Collection partitions);

seek方法的参数partitions表示分区，offset参数用来指定从分区的哪个位置开始消费；
seek方法只能重置消费者分配到的分区的消费位置，而消费者的分区分配是在poll方法调用过程中实现的，所以在执行seek方法之前需要先执行一次poll方法，等到分配到分区之后才可以重置消费位移；
注意：如果poll方法的时间参数设置为0，则会立刻返回，那么方法内部的分区分配逻辑会来不及实施；

代码：使用seek()方法从分区末尾消费

/**
 * 使用seek()方法从分区末尾消费
 */

public static void seekTest() {
    Properties proper = initProperties();
    KafkaConsumer consumer = new KafkaConsumer<>(proper);
    consumer.subscribe(Arrays.asList(topic));
    Set assignment = new HashSet<>();
    while (assignment.size() == 0) {
        consumer.poll(Duration.ofMillis(100));
        
        // KafkaConsumer的 assignment 方法获取消费者所分配到的分区信息
        assignment = consumer.assignment();
    }
    
    // KafkaConsumer的 endOffsets 方法用来获取指定分区的末尾的消息位置，返回一个 Map
    Map offsets = consumer.endOffsets(assignment);
    for (TopicPartition tp : assignment) {
        consumer.seek(tp, offsets.get(tp));
    }
}

KafkaConsumer的assignment方法获取消费者所分配到的分区信息；
KafkaConsumer的endOffsets方法用来获取指定分区的末尾的消息位置，返回一个 Map；
endOffsets方法还可以接收一个时间参数Duration timeout，指定等待获取的超时时间，如果没有指定timeout，那么等待时间由客户端参数request.timout.ms来设置，默认是30000；
KafkaConsumer里与endOffsets方法对应的还有beginningOffsets方法；
KafkaConsumer还直接提供了seekToBeginning和seekToEnd方法来实现直接从分区的开头或末尾开始消费；

6.3 控制或关闭消费

KafkaConsumer提供了对消费速度进行控制的方法，可以暂停某些分区的消费而先消费其他分区，当达到一定条件时再恢复这些分区的消费；
KafkaConsumer中使用pause()和resume()方法来分别实现：暂停某些分区在拉取操作时返回数据给客户端；恢复某些分区在向客户端返回数据；

/**
 * KafkaConsumer的pause()和resume()方法
 */
public void pause(Collection partitions);

public void resume(Collection partitions);

KafkaConsumer是线程不安全的，但是有一个wakeup()方法可以从其他线程里安全调用，调用wakeup()方法可以退出poll()方法的逻辑，并抛出WakeupException异常，我们不需要处理该异常，它只是一种跳出循环的方式；

跳出循环后一定要显式的执行关闭动作以释放运行过程中占用的各种系统资源，包括内存资源、Socket连接等，KafkaConsumer提供了close()方法来实现关闭；

/**
 * KafkaConsumer的wakeup()方法和close()方法
 */
public void wakeup();
 
public void close();
public void close(Duration timeout);
@Deprecated
public void close(long timeout, TimeUnit timeUnit)

7. 位移提交

对于Kafka的分区而言，分区中的每条消息都有唯一的offset，用来标识消息在分区中对应的位置；
对于消费者而言，也有一个offset，表示当前消费到分区中的某个消息所在的位置；
KafkaConsumer每次调用poll()方法时，返回的是还没有消费过的消息集，要做到这一点就要记录上一次消费时的消费位移；并且这个消费位移必须做持久化保存，而不是单单保存在内存中；这样在消费者重启、新的消费者加入、再均衡发生时，都能够知晓之前的消费位移，然后继续消费后续的消息；
在旧版消费者客户端中，消费位移是存储在Zookeeper中的，而在新消费者客户端中，消费位移存储在Kafka内部的主题__consumer_offsets中；
消费者在消费完消息之后，需要执行消费位移的提交，提交的是下一条需要拉取的消息的位置；
ConsumerRecord消息中有属性offset记录本次消息在分区的偏移量，KafkaConsumer的committed()方法获取提交的消费位移，比获取的消息的最大偏移量大1；

7.1 位移提交时机

位移提交时机的把握也很讲究，不同的提交时机可能造成重复消费或消息丢失的现象；

拉取完消息立即提交

如果拉取完消息还未做消息处理前，就立即提交消费位移，有可能造成消息丢失现象：

例如：当前poll()操作拉取的消息集为[x+2,x+7]其中x+2代表上一次提交的消费位移，如果拉取到消息之后就进行了位移提交，即提交了x+8（下一次需要消费的消息位移）,那么假如当前消费到了x+5时，消费者遇到了异常，在故障恢复后，消费者重新拉取消息，因为已经提交了消费位移x+8，所以重新拉取的消息是从x+8开始的，这样会导致x+5到x+7之间的消息未被处理，如此便发生了消息丢失现象；
即，消费者拉取了消息，然后提交消费位移，但是在处理消息过程中遇到了异常，在故障恢复后再拉取消息就会拉取提交位移后的消息，上次拉取的消息存在部分未处理的情况；

消费完所有消息后才提交

如果位移提交动作是在消费完所有拉取的消息后才执行，有可能造成重复消费现象：

例如：当前poll()操作拉取的消息集为[x+2,x+7]其中x+2代表上一次提交的消费位移，当消费到x+5时遇到了异常，在故障恢复后，重新拉取消息，因为本次消费位移还未提交，则重新拉取的消息是从x+2开始的，也就是说x+2到x+4的消息又重新消费了一遍，故而发生了重新消费的现象；

自动提交-定期提交

Kafka中默认的消费位移的提交方式是自动提交，这个由消费者客户端参数enable.auto.commit配置，默认值为true;
默认的自动提交是定期提交：消费者每隔5秒（由参数auto.commit.interval.ms控制）会将拉取的每个分区中最大的消息位移进行提交。自动位移提交的动作是在poll()方法的逻辑里完成的，在每次真正向服务器发起拉取请求之前会检查是否可以进行位移提交，如果可以，那么就会提交上一次轮询的位移；
自动位移提交仍会带来重复消费和消息丢失现象；

手动提交

手动提交分为：同步提交和异步提交；

同步提交

对应KafkaConsumer中的commitSync()方法;
commitSync()提交消费位移时，会阻塞消费者线程直至位移提交完成；

/**
 * KafkaConsumer 同步位移提交方法 commitSync
 */
public void commitSync();
public void commitSync(Duration timeout);
public void commitSync(final Map offsets);
public void commitSync(final Map offsets, final Duration timeout);

异步提交

对应KafkaConsumer中的commitAsync()方法；
commitAsync()执行时，消费者线程不会被阻塞，可能在提交消费位移的结果还未返回之前就开始了新一次的拉取操作；
异步提交可以使消费者的性能得到一定的增强；

/**
 * KafkaConsumer 异步位移提交方法 commitAsync
 */
public void commitAsync();
public void commitAsync(OffsetCommitCallback callback);
public void commitAsync(final Map offsets, OffsetCommitCallback callback);

commitAsync()中可以传递一个异步提交的回调方法，OffsetCommitCallback接口中有一个方法onComplete()，在提交完成时调用

public interface OffsetCommitCallback {
    void onComplete(Map offsets, Exception exception);
}

8. 反序列化器

生产者KafkaProducer发送消息时会调用序列化器将消息转换成字节数组byte[]，消费者KafkaConsumer在接收消息时，会调用对应的反序列化器将字节数组反序列化为消息对象；

反序列化器需要实现接口Deserializer:

/**
 * 反序列化器接口
 */
public interface Deserializer extends Closeable {

    void configure(Map configs, boolean isKey);

    T deserialize(String topic, byte[] data);

    @Override
    void close();
}

configure()方法用来配置当前类；
deserialize()方法用来执行反序列化，如果data为null，那么处理的时候直接返回null，而不是抛出一个异常；
void() 用来关闭当前序列化器；

Kafka提供的反序列化器有：ByteBufferDeserializer、ByteArrayDeserializer、BytesDeserializer、DoubleDeserializer、FloatDeserializer、IntegerDeserializer、LongDeserializer、ShortDeserializer、StringDeserializer，分别用于ByteBuffer、ByteArray、Bytes、Double、Float、Integer、Long、Short及String类型的反序列化；

8.1 自定义反序列化器

如果Kafka提供的反序列化器满足不了需求时，可以自定义实现反序列化器，推荐使用通用的序列化工具，如JSON、ProtoBuf或Protostuff等，并且自定义的反序列化器需要与序列化器配套;

public class ProtoStuffDeserializer implements Deserializer {
    @Override
    public void configure(Map configs, boolean isKey) {

    }

    @Override
    public Object deserialize(String topic, byte[] data) {
        Schema schema;
        String result="";
        try {
            schema = RuntimeSchema.createFrom(result.getClass());
            ProtostuffIOUtil.mergeFrom(data, result, schema);
        } catch (Exception e) {
            throw new IllegalStateException(e);
        }
        return result;
    }

    @Override
    public void close() {

    }
}

要使用自定义的反序列化器，需要在key.deserializer或value.deserializer参数中指定使用的类；

9. 拦截器

生产者在发送消息时，可以使用生产者拦截器在消息发送前和发送回调逻辑前做一些定制化的需求；
消息者也可以在消息消息时，使用消费者拦截器在消费到消息时或提交消费位移之后做一些定制化需求；
生产者拦截器的接口是ProducerInterceptor，消费者拦截器的接口是ConsumerInterceptor

/**
 * 消费者拦截器接口 ConsumerInterceptor
 */
public interface ConsumerInterceptor extends Configurable {
    public ConsumerRecords onConsume(ConsumerRecords records);
    
    public void onCommit(Map offsets);
    
    public void close();
}

onConsume()方法：KafkaConsumer会在poll()方法返回之前调用onConsume()方法来对消息进行定制化操作，如果onConsume()方法中抛出异常，那么会被捕获并记录到日志中，但是异常不会再向上传递；
onCommit()方法：KafkaConsumer会在提交完消费位移之后调用拦截器的onCommit()方法；
要使自定义的消费者拦截器生效，需要在参数interceptor.classes参数中配置，该参数的默认值为""，即默认不使用消费组拦截器；

10. 多线程

生产者KafkaProducer是线程安全的，然而消费者KafkaConsumer是非线程安全的，KafkaConsumer中定义了一个acquire()方法，用来检测当前是否只有一个线程在操作，若有其他线程正在操作则抛出ConcurrentModifcationException异常；

KafkaConsumer中的每个公用方法（public方法），在执行所要执行的动作之前都会调用这个acquire()方法，只有wakeup()方法是个例外；

acquire()方法可通常所说的锁（synchronized、Lock等）不同，它不会造成阻塞等待，仅通过线程操作计数标记的方式来检测线程是否发生了并发操作，以此保证只有一个线程在操作；

参考文献

《深入理解Kafka核心设计与实践原理》朱忠华著，电子工业出版社.

你可能感兴趣的:(Kafka,kafka)

filebeat改造支持rocketmq 余很多之很多 go Java rocketmq
继续分享下以前在gitchat上发布的文章：filebeat改造支持rocketmq1.概述1.1问题概述现在越来越多的日志采集使用FileBeat，FileBeat是个轻量型日志采集器，采用Go语言实现，性能稳健，占用资源少。FileBeat现在支持采集的日志内容发送到Redis、Elasticsearch、Kafka、Logstash。那么我们如果想通过FileBeat采集日志到RocketM
Apache Kafka 学习笔记
一、Kafka简介1.1Kafka是什么？Kafka是一个高吞吐、可扩展、分布式的消息发布-订阅系统，主要用于：日志收集与处理流式数据处理事件驱动架构实时分析管道最初由LinkedIn开发，后捐赠给Apache基金会。1.2Kafka的核心特性特性描述高吞吐每秒百万级消息处理能力，依赖顺序写磁盘、批量处理分布式支持水平扩展，多个Broker组成集群持久化消息写入磁盘（通过segmentfiles+
Kafka 集群架构与高可用方案设计（一）计算机毕设定制辅导-无忧 #Kafka kafka 架构分布式
Kafka集群架构与高可用方案设计的重要性在大数据和分布式系统的广阔领域中，Kafka已然成为了一个中流砥柱般的存在。它最初由LinkedIn开发，后捐赠给Apache软件基金会并成为顶级项目，凭借其卓越的高吞吐量、可扩展性以及持久性，被广泛应用于日志收集、实时数据处理、流计算、数据集成等诸多关键领域。在日志收集场景下，以大型互联网公司为例，每天都会产生海量的日志数据，如用户的访问记录、系统操作日
Kafka 集群架构与高可用方案设计（二）计算机毕设定制辅导-无忧 #Kafka kafka 架构分布式
Kafka集群架构与高可用方案的优化策略合理配置参数在Kafka集群的配置中，参数的合理设置对于系统的高可用性和性能表现起着关键作用。例如，min.insync.replicas参数定义了ISR（In-SyncReplicas，同步副本）集合中的最少副本数，它直接关系到数据的持久性和一致性。当acks设置为all或-1时，生产者需要等待ISR中的所有副本都确认写操作后才认为成功，此时min.ins
大数据集成方案对比：Kafka vs Flume vs Sqoop AI天才研究院计算 AI大模型应用入门实战与进阶 Agentic AI 实战大数据 kafka flume ai
大数据集成方案对比：KafkavsFlumevsSqoop关键词：大数据集成、Kafka、Flume、Sqoop、流处理、批量迁移、日志收集摘要：在大数据生态中，数据集成是连接数据源与数据处理平台的关键环节。本文深度对比Kafka、Flume、Sqoop三大主流集成工具，从核心架构、技术原理、适用场景到实战案例展开系统性分析。通过数学模型量化性能差异，结合实际项目经验总结选型策略，帮助开发者根据业
【Hadoop】onekey_install脚本菜萝卜子 Linux hadoop 大数据分布式
hosts[root@kafka01hadoop-script]#cat/etc/hosts127.0.0.1localhostlocalhost.localdomainlocalhost4localhost4.localdomain4::1localhostlocalhost.localdomainlocalhost6localhost6.localdomain6192.168.100.150k
flink sql读hive catalog数据，将string类型的时间戳数据排序后写入kafka，如何保障写入kafka的数据是有序的 fzip Flink flink sql hive
在FlinkSQL中，要确保从Hive读取的STRING类型时间戳数据排序后有序写入Kafka，需要结合批处理模式、时间类型转换、单分区写入和Kafka生产者配置。以下是完整解决方案：一、核心解决方案1.批处理模式+全局排序将作业设置为批处理模式，并对字符串时间戳进行类型转换后排序：--设置为批处理模式（关键！）SET'execution.runtime-mode'='batch';--从Hive
Kafka面试问题1 小小少年Boy
1请说明什么是ApacheKafka?Kafka是分布式发布-订阅消息系统。Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。它可以同时用于在线消息数据处理，和离线的数据文件处理。2、请说明什么是传统的消息传递方法?传统的消息传递方法包括两种：排队：在队列中，一组用户可以从服务器中读取消息，每条消息都发送给其中一个人。发布-订阅：在这个模型中，消息被广播
分布式定时器：原理设计与技术挑战你一身傲骨怎能输架构设计分布式
文章摘要分布式定时器用于在分布式系统中可靠、准确地触发定时任务，常见实现方案包括：基于数据库/消息队列的定时扫描、分布式任务调度框架（如Quartz集群、xxl-job）、时间轮/延迟队列（如Redis/Kafka）以及Zookeeper/Etcd协调服务。主要技术挑战包括时钟同步、任务幂等、高可用、负载均衡和故障恢复等。核心难点在于保证任务唯一性、调度精度与分布式一致性，技术选型需权衡轻量级（R
Filebeat + Logstash + ES进行Nginx日志采集一个只会喊666的菜比
简易架构图service.png架构图比较简单，日志收集大同小异，这次不添加任何中间服务比如：rediskafka后端只是存储进ES使用的版本jdk-8u161-linux-x64.rpmelasticsearch-6.7.2.rpmlogstash-6.7.2.rpmfilebeat-6.7.2-x86_64.rpm安装比较简单，只用进行rpm-ivh即可，接下来直接贴配置文件：Elastics
伽卡他卡电子教室：技术原理、功能解析与教育场景实践
一、术语澄清与技术定位“伽卡他卡”（Gakataka）在计算机科学领域的核心实体为伽卡他卡电子教室软件。需注意其与无关技术的区别：❌与分布式流处理平台ApacheKafka无技术关联；❌与AI模型GauGAN、半导体技术GAA等“G”开头术语无关。核心定位：一款专为教育场景设计的局域网教学管理软件，由伽卡他卡公司开发。二、核心功能与应用场景1.核心模块屏幕广播：实时传输教师端操作画面；远程控制：教
kafka的基本使用柔弱的富po kafka kafka zookeeper 分布式
kafka3.0的基本使用一、kafka基本使用1.启动kafka服务zookeeper+kafka的使用进入kafka/bin目录下./kafka-server-start.sh-daemon../config/server.properties验证是否启动成功：进入到zk中的节点看id是0的broker有没有存在（上线）ls/brokers/idsserver.properties核心配置详解
Kafka入门使用教程
1.前言1.1.什么是消息队列消息队列（MQ）是消息传递中间件解决方案的一个组件，旨在支持独立的应用和服务之间的信息交换。消息队列按发送顺序存储“消息”（由应用所创建、供其他应用使用的数据包），直到使用方应用能够处理它们为止。这些消息安全地等待接收方应用做好准备，因此，即使网络或接收方应用出现问题，消息队列中的消息也不会丢失。1.2.为什么用消息队列1.2.1.解耦生产者（客户端）发送消息到MQ中
Paimon对比基于消息队列（如Kafka）的传统实时数仓方案的优势 lifallen Paimon 大数据数据库数据结构 java 分布式 apache 数据仓库
弊端：数据重复->优势：Paimon主键表原生去重原方案弊端(Kafka)问题:消息队列（Kafka）是仅支持追加（Append-Only）的日志流。当Flink作业发生故障恢复（Failover）或业务逻辑迭代重跑数据时，同样的数据会被再次写入消息队列，形成重复数据。影响:下游应用（如DWS层、ADS层或直接对接的BI报表）必须自己实现复杂的去重逻辑，这不仅消耗大量计算资源（“资源消耗至少增加一
Java大厂面试实录：从电商场景到AIGC的深度技术拷问 remCoding Java场景面试宝典 Java面试 Spring Boot Kafka AI 大厂面试微服务
第一轮提问：电商场景与微服务基础面试官：小曾，请描述一个典型的电商秒杀场景，你会如何设计系统架构？涉及哪些关键技术？小曾：秒杀嘛，主要是高并发，我一般会用SpringBoot搭后端，数据库用Redis做缓存，消息队列用Kafka异步处理订单。具体技术细节……呃，好像没细想。面试官（微笑）：“不错，Redis和Kafka选得对。那如果用户请求量超10万/QPS，你会如何扩容？SpringCloud的
Java大厂面试实录：从Spring Boot到AI微服务架构的深度拷问 remCoding Java场景面试宝典 Java面试 Spring Boot Jakarta EE AI微服务 Kafka Spring Cloud AI面试
第一轮提问：电商场景下的高并发架构面试官：小曾，我们公司电商业务面临“双十一”秒杀场景，需要支持百万级并发，你会如何设计系统架构？请结合SpringCloud和消息队列谈谈方案。小曾：（搓手）额……我会用SpringCloudAlibaba，搞个Nacos做服务注册，网关用Zuul，然后订单服务用SpringBoot+Redis缓存，秒杀请求走消息队列，比如Kafka吧，异步处理，降低峰值压力……
Java大厂面试实录：从Spring Boot到AI微服务架构的层层递进 remCoding Java场景面试宝典 Java Spring Boot Spring Cloud AI Kafka Redis Microservices
场景：互联网大厂Java后端面试面试官（严肃）：请简单介绍下你参与过的项目，主要使用哪些技术栈？小曾（自信）：我参与过电商平台的订单系统，用了SpringBoot+SpringCloudAlibaba，数据库是MySQL+Redis缓存，消息队列用Kafka处理异步任务。面试官（点头）：不错，能具体说说订单系统如何应对高并发场景的吗？小曾：我们用了HikariCP优化数据库连接池，Redis集群做
Java大厂面试实录：从Spring Boot到AI微服务架构的深度技术挑战 remCoding Java场景面试宝典 Java Spring Boot Spring Cloud AI Kafka Redis Docker
场景：互联网大厂Java后端开发面试面试官（严肃）：小曾，请简单介绍下你过往的项目经验，特别是你在微服务架构中解决过哪些技术难题？小曾（自信）：我之前参与过电商平台的订单系统重构，将单体应用拆分为SpringCloud微服务架构。我们使用了SpringCloudGateway做网关路由，服务间通过Kafka异步通信，并引入Redis缓存热点数据。面试官：很好，能具体说说你们如何解决订单超卖问题的吗
分布式系统中优化ELK日志采集性能 Alex艾力的IT数字空间 elk 微服务中间件架构 ux 安全性测试可用性测试
架构设计、组件调优、资源分配等多维度入手一、架构优化：分布式与解耦设计分层采集与缓冲Filebeat轻量级采集：在每台服务器部署Filebeat替代Logstash作为日志收集器，降低资源占用（CPU/内存减少70%以上）。引入缓冲队列：通过Redis或Kafka作为日志缓冲池，缓解Logstash或Elasticsearch的突发流量压力，避免数据丢失（如Logstash异常时Redis暂存数据
kafka--基础知识点--0 Chasing__Dreams kafka kafka 分布式
kafka架构https://cloud.tencent.com/developer/article/230789219张图生产者架构消息的磁盘存储文件结构https://cloud.tencent.com/developer/article/230789219张图produce消息分区策略kafka–基础知识点–5–生产者分区策略ISR、OSR、AR是什么？ISR：ISR，全称in-syncre
Kafka 时间轮深度解析：如何O(1)处理定时任务 lifallen Kafka Java kafka linq 分布式 java 数据库数据结构 apache
TimingWheel（时间轮）TimingWheel是一种高效的、用于实现大量定时任务调度的算法结构。相比于传统的基于优先队列（PriorityQueue）的定时器（其添加/删除操作的时间复杂度为O(logn)），时间轮可以实现近乎O(1)的添加和删除操作，这在需要管理成千上万个定时任务的场景下（例如Kafka中的请求超时、延迟操作等）具有巨大的性能优势。可以把一个TimingWheel想象成一
Kafka深度解析：架构、原理与应用实践 JouJz kafka 架构 linq
Kafka深度解析：架构、原理与应用实践引言在现代分布式系统架构中，消息队列作为系统解耦、异步通信的核心组件发挥着至关重要的作用。而在众多消息队列解决方案中，ApacheKafka凭借其卓越的性能、高吞吐量和可靠性，已成为企业级数据管道的首选技术。本文将深入剖析Kafka的核心架构、工作原理以及实践应用，帮助开发者全面掌握这一强大的分布式消息系统。一、Kafka概述与核心概念1.1Kafka的诞生
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
Kafka系列之：Dead Letter Queue死信队列DLQ 快乐骑行^_^ Kafka Kafka系列 Dead Letter Queue 死信队列 DLQ
Kafka系列之：DeadLetterQueue死信队列DLQ一、死信队列二、参数errors.tolerance三、创建死信队列主题四、在启用安全性的情况下使用死信队列更多内容请阅读博主这篇博客：Kafka系列之：KafkaConnect深入探讨-错误处理和死信队列一、死信队列死信队列（DLQ）仅适用于接收器连接器。当一条记录以JSON格式到达接收器连接器时，但接收器连接器配置期望另一种格式，如
消息中间件巡检搬砖小常消息中间件运维笔记 RocketMQ kafka 中间件巡检运维
除资源使用情况外，消息中间件RocketMQ、kafka还可以巡检哪些？一、RocketMQ巡检1、检查broker写入耗时是否有压力2、检查brokerbusy的数量与频率3、主题发送TPS、发送错误率巡检4、从节点消费情况检查5、集群各broker消息流转情况巡检二、Kafka巡检1、检查是否有分区发生ISR频繁扩张收缩2、检查分区leader选举值是否处于正常水平3、检查controller
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》