Kafka元数据拉取流程

文章目录

元数据采用的数据结构
KafkaProducer初始化时的拉取流程
消息发送时如何拉取元数据
- 1.更新拉取标志位
- 2.唤醒Sender线程，异步拉取
- 3.同步阻塞，等待拉取结果
总结

元数据采用的数据结构

public final class Cluster {

    private final boolean isBootstrapConfigured;
    // 一个Node就代表一个Broker
    private final List<Node> nodes;
    // 尚未被授权访问的Kafka列表，Kafka是支持权限访问的
    private final Set<String> unauthorizedTopics;
    // 映射关系为：“某个Topic下的某个Partition:Partition的详细信息”
    // TopicPartition指的是Topic1中的Partition1，PartitionInfo为具体某个Partition的详细信息
    private final Map<TopicPartition, PartitionInfo> partitionsByTopicPartition;
    // 映射关系为：“某个Topic:这个Topic下的Partition列表”
    private final Map<String, List<PartitionInfo>> partitionsByTopic;
    // 映射关系为：“某个Topic:这个Topic下的可用的Partition列表”
    private final Map<String, List<PartitionInfo>> availablePartitionsByTopic;
    // 映射关系为：“某个Broker ID:这个Broker上的所有Partition”
    // 某个Broker上有哪些Partition（可能来自不同的Topic）
    private final Map<Integer, List<PartitionInfo>> partitionsByNode;
    // broker.id映射到Node的数据结构，映射关系为：“broker.id：Node”
    private final Map<Integer, Node> nodesById;
}

KafkaProducer初始化时的拉取流程

在KafkaProducer初始化时，会构造出集群元数据组件Metadata，且在初始化方法里有一次Metadata#update()方法调用。

// 构造核心组件：Metadata；用于去Broker集群拉取元数据（有哪些Topic，对应哪些Partition，其中哪个是leader、哪个是follower）
// 想往Broker发送一条ProducerRecord，就必须知道目标Topic，有哪几个Partition，其中Partition Leader在哪个Broker上
// 在KafkaProducer初始化时拉取一次元数据；后面每隔一段时间（metadata.max.age.ms，默认：5min）会刷新元数据；发送消息时如果元数不在本地，还得通过Metadata发送请求
this.metadata = new Metadata(retryBackoffMs, config.getLong(ProducerConfig.METADATA_MAX_AGE_CONFIG));

// 省略部分代码......

// 会把我们配置的Kafka Broker地址作为参数传入
this.metadata.update(Cluster.bootstrap(addresses), time.milliseconds());

在方法调用中，会传递2个参数，分别是Cluster实例对象和当前时间戳。对于Cluster实例的创建，是利用我们配置的Broker地址，将其包装成Node，并add到List< Node >中。最后利用List< Node >构造出Cluster实例对象。

public static Cluster bootstrap(List<InetSocketAddress> addresses) {
    List<Node> nodes = new ArrayList<>();
    int nodeId = -1;
    // 遍历传进来的Kafka Broker地址
    for (InetSocketAddress address : addresses)
        // 将Broker地址包装成Node后，添加到List集合中
        nodes.add(new Node(nodeId--, address.getHostString(), address.getPort()));
    // 利用List包装Cluster实例并返回
    return new Cluster(true, nodes, new ArrayList<PartitionInfo>(0), Collections.<String>emptySet());
}

之后再执行update()方法时，会将构造好的Cluster实例和当前时间戳传入。

/**
 * KafkaProducer初始化时，只是将将配置的Broker地址包装成Node后，添加到List集合中，利用List集合创建Cluster实例。
 * 传进来的参数就是Cluster实例。
 * 在KafkaProducer初始化时，并没有真正的去某个Broker上拉取元数据，只是将配置的Broker地址转换成了Node，
 * 以List的形式存到了Cluster实例中
 *
 * 后面拉取元数据成功后处理响应时再调用该方法，就是更新Cluster了！
 */
public synchronized void update(Cluster cluster, long now) {
    // 将“是否需要update元数据”的标记设为false，即不需要update
    this.needUpdate = false;
    // 将“最近的刷新时间”和“成功刷新时间”都设为now
    this.lastRefreshMs = now;
    this.lastSuccessfulRefreshMs = now;
    // 每次成功update元数据后，就会对version加1
    this.version += 1;

    // 拉取元数据使用的监听器
    for (Listener listener: listeners)
        listener.onMetadataUpdate(cluster);

    // Do this after notifying listeners as subscribed topics' list can be changed by listeners
    // needMetadataForAllTopics（默认false）表示：将所有Topic的元数据都刷新一次
    // 于是将刚刚包装好的Cluster实例赋值给this.cluster
    this.cluster = this.needMetadataForAllTopics ? getClusterForCurrentTopics(cluster) : cluster;

    // 由于本方法由synchronized修饰，是线程安全的，所以Thread-1抢到了锁，执行该方法，Thread-2就得wait进入休眠状态
    // 此时调用notifyAll()方法就会唤醒（处于休眠状态的）Thread-2，Thread-2就又能争抢锁了
    notifyAll();
    log.debug("Updated cluster metadata version {} to {}", this.version, this.cluster);
}

可以看出，用来标记元数据是否需要拉取的标志位默认为false，还把管理元数据的版本号自增，此时很明显就不会去拉取元数据。
由于update()方法由synchronized修饰，所以在多线程并发执行时，同一时刻只会有一个线程抢占到锁（其他线程进入休眠等待状态），进而执行“更新元数据”操作。等本方法执行完毕后，就会通过notifyAll()唤醒其他处于休眠状态的线程。

消息发送时如何拉取元数据

在调用Kafka API的doSend()方法生产消息时，会（按需、以同步阻塞的方式）拉取元数据

// 以同步阻塞等待的方式（传参：同步阻塞的最大时间），去连接Broker拉取元数据：如果想往Topic发送消息，必须知道元数据，这样才能通过Partitioner选择一个Partition，
// 然后才能跟这个Partition对应的Leader建立连接、发送消息。其中调用本方法最多能够阻塞等待时间是：max.block.ms
// 返回的是“为了拉取元数据，总共花费的时间” = 元数据拉取的时间 + 一些边边角角
long waitedOnMetadataMs = waitOnMetadata(record.topic(), this.maxBlockTimeMs);

得到的就是元数据拉取流程所花费的时间

private long waitOnMetadata(String topic, long maxWaitMs) throws InterruptedException {
    // Metadata组件中已经缓存、加载过元数据的Topic，会放到Set集合中。
    // 第一次发送消息到某个Topic，Set集合没有这个Topic，那就准备拉取
    if (!this.metadata.containsTopic(topic))
        this.metadata.add(topic);

    // metadata.fetch()得到的就是Cluster实例，这里是判断Cluster中的Map>是否有这个Topic
    // 说明这个Topic的元数据信息在Cluster Map中能查到（已经被缓存了），无需等待拉取
    if (metadata.fetch().partitionsForTopic(topic) != null)
        // 元数据拉取过程中的阻塞等待时间 = 0
        return 0;

    long begin = time.milliseconds();
    // 最多能阻塞等待的时间，默认：60s
    long remainingWaitMs = maxWaitMs;
    // 只要Cluster实例中的Map>集合中没有这个Topic，就得触发“元数据拉取操作”
    while (metadata.fetch().partitionsForTopic(topic) == null) {
        log.trace("Requesting metadata update for topic {}.", topic);
        // step 1:将Sender线程拉取元数据的标志位，设为true
        int version = metadata.requestUpdate();
        // step 2:唤醒Sender线程，底层就是唤醒NetworkClient（让它不要阻塞等待了），准备异步拉取元数据
        sender.wakeup();
        // step 3：Metadata准备以同步阻塞的方式，等待元数据的拉取结果
        metadata.awaitUpdate(version, remainingWaitMs);
        // 整个“元数据异步拉取而同步等待”所花费的时间 = 当前时间戳 - 元数据拉取前夕的时间戳
        long elapsed = time.milliseconds() - begin;
        // 如果等待元数据拉取所花费的时间大于默认的60s，抛出超时异常
        if (elapsed >= maxWaitMs)
            throw new TimeoutException("Failed to update metadata after " + maxWaitMs + " ms.");
        // 某个Topic尚未被授权访问，抛异常
        if (metadata.fetch().unauthorizedTopics().contains(topic))
            throw new TopicAuthorizationException(topic);
        // 剩余等待时间 = 默认的60s - 同步阻塞所花费的时间
        remainingWaitMs = maxWaitMs - elapsed;
    }
    // 以同步阻塞的方式等待元数据拉取成功所花费的时间 = 元数据拉取所花费的时间 + 一些边边角角
    return time.milliseconds() - begin;
}

首先要判断目标Topic的元数据是否已经缓存，如果没有，那就准备拉取。

1.更新拉取标志位

首先将Metadata组件中是否需要拉取元数据的标志位，设为true，表示现在需要拉取元数据。

public synchronized int requestUpdate() {
    // 是否需要拉取元数据的标志位，设为true
    this.needUpdate = true;
    // 返回“拉取元数据”过程中用到的版本号
    return this.version;
}

2.唤醒Sender线程，异步拉取

元数据拉取工作是由Sender负责完成的，底层就是唤醒NetworkClient，让它不要阻塞等待了，准备异步拉取元数据

当Sender线程运行时，会触发执行它的run()方法。

void run(long now) {

    // 如果某些做好发送准备的Partition的元数据都还没拉取到（不知道Leader是谁），就标识一下
    if (result.unknownLeadersExist)
        // 将“需要拉取元数据的标志位”更新为：true
        this.metadata.requestUpdate();

    
    // 省略部分代码...

    // 万能poll()方法
    this.client.poll(pollTimeout, now);
}

其中如果哪个Partition的Leader还不知道是谁，就强制刷新一次元数据。最后调用万能poll方法拉取元数据

public List<ClientResponse> poll(long timeout, long now) {
    // MetadataUpdater组件是专门用来更新元数据的，调用MetadataUpdater#maybeUpdate()拉取元数据
    // 内部会构建专门用于向Broker发送请求的MetadataRequest
    long metadataTimeout = metadataUpdater.maybeUpdate(now);
    
    // 省略部分代码...
    
    List<ClientResponse> responses = new ArrayList<>();
    handleCompletedSends(responses, updatedNow);
    // 发送出去的MetadataRequest，收到了响应，现在处理这些响应
    handleCompletedReceives(responses, updatedNow);
   
   // 省略部分代码...

    return responses;
}

底层通过MetadataUpdater组件完成拉取动作，本质就是创建拉取元数据的请求–MetadataRequest，将其封装成ClientRequest，最后由Selector将其发送出去

private void maybeUpdate(long now, Node node) {
    if (node == null) {
        log.debug("Give up sending metadata request since no node is available");
        this.lastNoNodeAvailableMs = now;
        return;
    }
    String nodeConnectionId = node.idString();

    if (canSendRequest(nodeConnectionId)) {
        this.metadataFetchInProgress = true;
        // 首先创建好拉取元数据要发送的请求：MetadataRequest
        MetadataRequest metadataRequest;
        if (metadata.needMetadataForAllTopics())
            metadataRequest = MetadataRequest.allTopics();
        else
            metadataRequest = new MetadataRequest(new ArrayList<>(metadata.topics()));
        // 将拉取元数据的请求，封装成ClientRequest
        ClientRequest clientRequest = request(now, nodeConnectionId, metadataRequest);
        log.debug("Sending metadata request {} to node {}", metadataRequest, node.id());
        // 核心：真正发送请求调用的是request()方法
        doSend(clientRequest, now);
    } else if (connectionStates.canConnect(nodeConnectionId, now)) {
        log.debug("Initialize connection to node {} for sending metadata request", node.id());
        initiateConnect(node, now);

    } else { 
        this.lastNoNodeAvailableMs = now;
    }
}

然后将这个请求发送出去，走的是基于Java NIO封装的KafkaChannel将其发送到

/**
 * 真正发送请求的方法
 */
private void doSend(ClientRequest request, long now) {
    request.setSendTimeMs(now);
    this.inFlightRequests.add(request);
    // 通过Selectable组件发起请求，该组件是Kafka中专用于网络I/O操作的
    selector.send(request.request());
}

万能poll()方法将“元数据拉取”的这个ClientRequest 发送出去后，总归是能接收到响应的。于是，调用handleCompletedReceives()方法处理响应

/**
 *  处理Broker对MetadataRequest的响应
 */
private void handleCompletedReceives(List<ClientResponse> responses, long now) {
    for (NetworkReceive receive : this.selector.completedReceives()) {
        String source = receive.source();
        ClientRequest req = inFlightRequests.completeNext(source);
        Struct body = parseResponse(receive.payload(), req.request().header());
        // 如果这个请求是一个metadata request，那就立即处理，并返回true
        if (!metadataUpdater.maybeHandleCompletedReceive(req, now, body))
            responses.add(new ClientResponse(req, now, false, body));
    }
}

@Override
public boolean maybeHandleCompletedReceive(ClientRequest req, long now, Struct body) {
    short apiKey = req.request().header().apiKey();
    if (apiKey == ApiKeys.METADATA.id && req.isInitiatedByNetworkClient()) {
        handleResponse(req.request().header(), body, now);
        return true;
    }
    return false;
}

/**
 * 处理响应
*/
private void handleResponse(RequestHeader header, Struct body, long now) {
    this.metadataFetchInProgress = false;
    MetadataResponse response = new MetadataResponse(body);
    // 从MetadataResponse中取出最新拉取到的元数据
    Cluster cluster = response.cluster();
    // check if any topics metadata failed to get updated
    Map<String, Errors> errors = response.errors();
    if (!errors.isEmpty())
        log.warn("Error while fetching metadata with correlation id {} : {}", header.correlationId(), errors);

    // don't update the cluster if there are no valid nodes...the topic we want may still be in the process of being
    // created which means we will get errors and no nodes until it exists
    if (cluster.nodes().size() > 0) {
        // 拉取元数据的请求，最终会得到响应。
        // 现在就是要将响应的Cluster交给Metadata更新，内部会调用notifyAll方法唤醒当初阻塞等待拉取结果的主线程
        this.metadata.update(cluster, now);
    } else {
        log.trace("Ignoring empty metadata response with correlation id {}.", header.correlationId());
        this.metadata.failedUpdate(now);
    }
}

从获取到的响应MetadataResponse 中，取出最新拉取到的元数据Cluster，将其更新到Metadata组件中去，最后notifyAll()唤醒当初因为wait(60s)而阻塞的线程

/**
 * 向Broker发请求拉取元数据，得到响应之后，会从响应中取出最新拉取到的Cluster，将其赋值给this.cluster。
 * 然后notifyAll()唤醒当初因为wait(60s)而阻塞的线程
 */
public synchronized void update(Cluster cluster, long now) {
    // 将“是否需要update元数据”的标记设为false，即现在不需要update
    this.needUpdate = false;
    // 将“最近的刷新时间”和“成功刷新时间”都设为now
    this.lastRefreshMs = now;
    this.lastSuccessfulRefreshMs = now;
    // 每次成功update元数据后，就会对version加1
    this.version += 1;

    // 拉取元数据使用的监听器
    for (Listener listener: listeners)
        listener.onMetadataUpdate(cluster);

    // Do this after notifying listeners as subscribed topics' list can be changed by listeners
    // needMetadataForAllTopics（默认false）表示：将所有Topic的元数据都刷新一次
    // 于是将刚刚包装好的Cluster实例赋值给this.cluster
    this.cluster = this.needMetadataForAllTopics ? getClusterForCurrentTopics(cluster) : cluster;

    // 由于本方法由synchronized修饰，是线程安全的，所以Thread-1抢到了锁，执行该方法，Thread-2就得wait进入休眠状态
    // 此时调用notifyAll()方法就会唤醒（处于休眠状态的）Thread-2，Thread-2就又能争抢锁了
    notifyAll();
    log.debug("Updated cluster metadata version {} to {}", this.version, this.cluster);
}

3.同步阻塞，等待拉取结果

通过wait()方法让所在线程以同步阻塞的方式，等待元数据拉取结果。while循环的判定条件是以元数据版本号version为准，只要元数据拉取成功，必然会更新version，此时也就能跳出while循环了。

public synchronized void awaitUpdate(final int lastVersion, final long maxWaitMs) throws InterruptedException {
    if (maxWaitMs < 0) {
        throw new IllegalArgumentException("Max time to wait for metadata updates should not be < 0 milli seconds");
    }
    long begin = System.currentTimeMillis();
    // 最多能够阻塞等待的时间
    long remainingWaitMs = maxWaitMs;
    // while循环等待元数据拉取结果，啥时候拉取成功了，version就会自增+1，就能跳出while循环
    while (this.version <= lastVersion) {
        // 最多能够阻塞等待的时间也正常
        if (remainingWaitMs != 0)
            // wait释放锁，让业务逻辑所在的线程阻塞等待最长60s
            wait(remainingWaitMs);
        // 已经因为阻塞等待而耗费的时间
        long elapsed = System.currentTimeMillis() - begin;
        // 如果等待元数据拉取结果的的时间超过了默认的60s，就抛出异常
        if (elapsed >= maxWaitMs)
            throw new TimeoutException("Failed to update metadata after " + maxWaitMs + " ms.");
        // 否则，表示元数据拉取过程并未超时，计算出剩余还需要阻塞等待的时间 = 默认的60s - 已经花费的时间
        remainingWaitMs = maxWaitMs - elapsed;
    }
}

如果在默认的阻塞等待时间内，成功拉取到了集群元数据，那就计算出整个拉取流程的耗费时间并return。

一旦拉取超时，那就得抛出TimeoutException。异常抛出会中断上述while循环，异常信息会传递到waitOnMetadata()方法，于是waitOnMetadata()方法就会抛出InterruptedException。

最外层的doSend方法捕获到InterruptedException异常后，会专门对其进行处理：

catch (InterruptedException e) {
    // 如果拉取元数据的过程超过了60s，就会将TimeoutException抛出来，在这里catch住，并通过onSendError回调交给开发者
    this.errors.record();
    if (this.interceptors != null)
        this.interceptors.onSendError(record, tp, e);
    throw new InterruptException(e);
}

总结

在KafkaProducer初始化时，并不会拉取集群元数据，仅仅是将Broker包装成了Node，并add到了List中用来构建Cluster实例。

发送消息时加载元数据，之所以采用“同步阻塞等待 + 异步拉取”的方式，是因为既不想无脑的同步阻塞在那，也不想无限制的等待异步结果。如果60s内拉取成功，wait的线程就会唤醒，正常走以后的逻辑；如果60s内没拉取到，那就主动抛异常让最外层捕获、视情况处理…

Apache Kafka的伸缩性探究：实现高性能、弹性扩展的关键 i289292951 kafka kafka
引言ApacheKafka作为当今最流行的消息中间件之一，以其强大的伸缩性著称。在大数据处理、流处理和实时数据集成等领域，Kafka的伸缩性为其在面临急剧增长的数据流量和多样化业务需求时提供了无与伦比的扩展能力。本文将深入探讨Kafka如何通过其独特的架构设计实现高水平的伸缩性，以及在实际部署中如何优化和利用这一特性。一、Kafka伸缩性的核心设计分区（Partitioning）与水平扩展Kafk
【二】【设计模式】建造者模式妖精七七_ 设计模式设计模式建造者模式
建造者模式的引入//C10_1.cpp#include#include"SystemConfig.h"intmain(){SystemConfigconfig("mysql://127.0.0.1/","xiaomu","xiaomumemeda","redis://127.0.0.1/","xiaomuredis","xiaomuredispw","kafka://127.0.0.1","xia
kafka-eagle 配置文件修改使用自带的数据库 bright future cheer kafka 数据库分布式
######################################multizookeeper&kafkaclusterlistSettingsprefixedwith‘kafka.eagle.’willbedeprecated,use‘efak.’instead######################################efak.zk.cluster.alias=clu
Kafka、ActiveMQ、RabbitMQ 及 RocketMQ区别比较木西爷 kafka activemq rabbitmq 阿里云 rocketmq
消息队列中间件是分布式系统中重要的组件，主要解决应用耦合、异步消息、流量削锋等问题。它可以实现高性能、高可用、可伸缩和最终一致性架构，是大型分布式系统不可缺少的中间件。消息队列在电商系统、消息通讯、日志收集等应用中扮演着关键作用，以阿里为例，其研发的消息队列（RocketMQ）在历次天猫“双十一”活动中支撑了万亿级的数据洪峰，为大规模交易提供了有力保障。常见消息中间件对比特性ActiveMQRab
MQ横向对比：RocketMQ、Kafka、RabbitMQ、ActiveMQ、ZeroMQ namelessmyth Java框架 MQ rocketmq kafka rabbitmq activemq
前言本文将从多个角度全方位对比目前比较常用的几个MQ：RocketMQKafkaRabbitMQActiveMQZeroMQ下文单独说明。表格对比特性RocketMQKafkaRabbitMQActiveMQ单机吞吐量10万级，支撑高吞吐10万级以上，甚至有文献称，可以达到单机百万级TPS。万级，同ActiveMQ万级，相对其他MQ较低。topic数量对吞吐量的影响topic可以达到几百/几千的级
Maxwell监听mysql的binlog日志变化写入kafka消费者澄绪猿 mysql kafka 数据库
一.环境：maxwell:v1.29.2(从1.30开始maxwell停止了对java8的使用，改为为11)maxwell1.29.2这个版本对mysql8.0以后的缺少utf8mb3字符的解码问题，需要对原码中加上一个部分内容：具体也给大家做了总结：关于v1.29.2版本的Maxwell存在于mysql8.0后版本部分源码字符集处理确实问题-CSDN博客二.程序这里还是那一个kafka模拟器来实
Debezium日常分享系列之：Debezium2.5稳定版本之MySQL连接器配置示例和Connector参数详解最笨的羊羊日常分享专栏 Debezium日常分享系列 Debezium2.5稳定版本 MySQL连接器配置示例 Connector参数详解
Debezium日常分享系列之：Debezium2.5稳定版本之MySQL连接器配置示例和Connector参数详解一、MySQL连接器配置示例二、添加连接器配置三、连接器属性四、必须的连接器配置属性五、高级MySQL连接器配置属性六、Debezium连接器数据库架构历史配置属性七、用于配置生产者和消费者客户端的传递数据库架构历史属性八、Debezium连接器Kafka信号配置属性九、Debezi
Flink 批作业消费kafka wending-Y Flink 入门到实践 flink kafka 大数据
文章目录示例代码原理总是kafka数据源可以是有界数据源，也可以是无界数据源示例代码publicstaticvoidmain(String[]args){StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism
Kafka主题二三事慢一点，细一点 Kafka kafka 分布式
客户端如果订阅了多次主题，则以最后一次为主，例如consumer.subscribe(Arrays.asList(topic1));consumer.subscribe(Arrays.asList(topic2));则订阅的只有topic2。消费者订阅主题是支持正则表达式，这样如果有新topic上线，并且匹配正则，则也会消费到这个新topic的内容，比如consumer.subscribe(Pat
大数据开发（Kafka面试真题-卷一） Key-Key 大数据 kafka 面试
大数据开发（Kafka面试真题）1、请解释以下ApacheKafka是什么？它在大数据系统中的角色是什么？2、请解释以下Kafka的工作原理和它与传统消息队列服务的不同之处？3、解释以下ApacheKafka的作用以及它与常见消息队列系统（如RabbitMQ）之间的区别？4、如何使用ApacheKafka来实现实时数据流处理？5、Flinkcheckpoint和Kafkaoffset的关联是什么？
Kafka-SSL笔记整理 yicj kafka ssl 笔记
创建密钥仓库以及CA创建密匙仓库,用户存储证书文件keytool-keystoreserver.keystore.jks-aliashello_kafka-validity100000-genkey创建CAopensslreq-new-x509-keyoutca-key-outca-cert-days100000将生成的CA添加到客户端信任库keytool-keystoreclient.trust
架构:Apache Kafka Connect实现sqlserver数据实时同步管理大亨 sqlserver 中间件架构
实现ApacheKafkaConnect与SQLServer之间的实时数据同步，您可以使用KafkaConnect的JDBCSourceConnector。以下是一个基本的步骤：1.安装KafkaConnect：确保您已经安装了ApacheKafka和KafkaConnect。您可以从ApacheKafka的官方网站或其他途径获取它。2.下载JDBCDriver：获取适用于SQLServer的JD
flume集成kafka weixin_34112181 大数据 python java
2019独角兽企业重金招聘Python工程师标准>>>1.kafka的配置参照https://my.oschina.net/u/1591525/blog/22519102.flum配置在flume的conf目录下新建kafka.propertiesagent.sources=s1agent.channels=c1agent.sinks=k1agent.sources.s1.type=execage
集群启动脚本西风凋丶碧树 linux
使用SSH服务，要首先确保Linux主机间ssh相互免密，配置免密可看下面：Linux主机间ssh相互免密创建kafka启动脚本vimkafka-cluster.shforiin192.168.8.105192.168.8.106192.168.8.107doecho--------------------------------$ikafka启动-------------------------
1分钟玩转Kafka 中间件小哥
说起Kafka，许多使用者对它是又爱又恨。Kafka是一种分布式的、基于发布/订阅的消息系统，其极致体验让人欲罢不能，但操心的运维、复杂的安全策略、可靠性易用性的缺失、算不上极致的性能发挥、并不丰富的消息服务功能，仍需要使用者付出诸多的背后工作。即使你是Kafka老手，也难免会有上述同样的烦恼。与其整日操心Kafka的部署，不如试试云上Kafka带给你的惊喜？目前国内主流的云服务厂商均提供了云上的
springboot 连kafka 发，接消息 Perfect珈蓝 spring boot kafka linq
引入pomorg.apache.kafkakafka_2.133.7.0org.springframework.kafkaspring-kafka增加yml配置spring:kafka:bootstrap-servers:192.168.1.30:9092consumer:group-id:testack-mode:manual#生产者producer:key-serializer:org.apa
kafka（三）springboot集成kafka（1）介绍 w_t_y_y kafka spring boot linq
一、相关组件介绍1、pom：org.apache.kafkakafka-clients3.0.02、kafkaProducerproduce的发送主要流程概述如下：拦截器对发送的消息拦截处理；获取元数据信息；序列化处理；分区处理；批次添加处理；发送消息。3、KafkaConsumer二、生产者发送消息类型1、同步发送消息同步发送的意思就是，一条消息发送之后，会阻塞当前线程，直至返回ack。由于se
kafka Interceptors and Listeners 伊布拉西莫 kafka
InterceptorsProducerInterceptorhttps://www.cnblogs.com/huxi2b/p/7072447.htmlProducer拦截器(interceptor)是个相当新的功能，它和consumer端interceptor是在Kafka0.10版本被引入的，主要用于实现clients端的定制化控制逻辑。对于producer而言，interceptor使得用户
幂等性设计风清扬-独孤九剑 golang 幂等性设计软件设计
目录前言幂等性设计幂等性设计处理流程HTTP幂等性消息队列幂等性基于kafka前言幂等性设计，就是说，一次和多次请求某一个资源应该具有同样的副作用。为什么我们要有幂等性操作？说白了，就两点：1、网络的不稳定性2、服务状态不确定性，服务状态不仅有成功，失败，还有超时。超时又有多种原因引起的，有可能是网络抖动，也有可能是负载引起的。对于这种情况，需要做重试，重试的后果是服务被调用了多次，数据不对，业务
常用中间件docker安装 Happywzy~ 中间件 docker 容器
zookeeperdockerrun-d--namezookeeper-p2181:2181--restartalways-eZOO_MY_ID=1-eALLOW_ANONYMOUS_LOGIN=yes-eTZ=Asia/Shanghai-v/etc/localtime:/etc/localtimezookeeper:3.7kafka#注意：KAFKA_CFG_ADVERTISED_LISTENE
prometheus监控kafka 仙女陈 prometheus kafka 分布式
kafka_exporter下载地址：https://github.com/danielqsj/kafka_exporter/releases/download/v1.2.0/kafka_exporter-1.2.0.linux-amd64.tar.gz1.1安装kafka_exportertar-xvfkafka_exporter-1.2.0.linux-amd64.tar.gz-C/usr/l
消息队列-kafka 百晓生612 消息队列 kafka 分布式
kafka和redis的区别数据类型和用途：Kafka：Kafka是一个分布式消息队列系统，主要用于高吞吐量的消息发布和订阅。它可以用于构建实时流处理应用、日志收集和传输、事件驱动架构等场景。Redis：Redis是一个内存数据库，支持多种数据结构（如字符串、列表、哈希、集合、有序集合等），并提供持久化功能。它通常用于缓存、会话存储、实时数据处理、消息队列、发布/订阅等场景。持久化支持：Kafka
在消息队列kafka多消费者组消费同一Topic场景下的idea调试debug断点进不去的解决方案小白菜儿929 java kafka intellij-idea java
1.问题场景复现不同类型的消息发到同一个Topic中，设置多个消费者组，为每个消费者组打一个标记。每一种消费者组只能消费对应的消息类型。这样做的好处是避免设置多个Topic，简化代码开发的同时性能损耗小。问题出现在消费端，由于多个消费者组对象随着项目初始化而初始化，导致了你的断点不一定能准确打在对应的消费者上，出现的问题就是进不去断点。2.解决思路你在生产者端发送一条消息进入到kafka消息队列，
Kafka入门介绍一吴代庄 Java kafka 分布式 java
介绍Kafka是一个分布式系统，由服务器和客户端组成，通过高性能TCP网络协议进行通信。它可以部署在本地和云中的裸机硬件、虚拟机和容器上环境。服务器：Kafka作为一个或多个服务器的群集运行，这些服务器可以跨越多个数据中心或云区域。其中一些服务器构成了存储层，称为代理。其他服务器运行KafkaConnect以持续导入和导出数据作为事件流，用于将Kafka与现有系统（如关系数据库）集成，以及其他Ka
docker安装kafka和kafka-console-ui 李君临 docker kafka ui
3、安装kafkahttps://blog.csdn.net/m0_64210833/article/details/134199061kafka依赖Zookeeper,当然也可以用内置的kraft。安装前提条件1.安装Zookeeper1.1运行ZooKeeper容器2.运行Kafka容器2.1启动Kafka容器3.验证3.1进入Kafka容器3.2查看容器状态3.3查看容器日志3.4重新启动容
kafka 生产者消费者设计思考动态一时爽，重构火葬场哲学与架构 middleware kafka 分布式
生产者负载均衡生产者直接发送消息给分区leader，而不需要通过中间者进行转发。这意味着生产者需要知道哪些服务器是存活的，以及主题分区leader在哪里的元数据请求。同时这也意味着生产者可以根据情况决定发给哪个broker，那么既可以随机负载，也可以进行散列批量发送生产者会尝试收集数据，然后在单次请求中发送大量数据，以牺牲少量额外延迟来换取更好的吞吐量。消费者pushorpull?kafka选择了
[AIGC] Kafka 消费者的实现原理程序员三木 AI kafka 分布式
在Kafka中，消费者通过订阅主题来消费数据。每个消费者都属于一个消费者组，消费者组中的多个消费者可以共同消费一个主题，实现分布式消费。每个消费者都会维护自己的偏移量，用于记录已经读取到的消息位置。消费者可以选择手动提交偏移量，也可以选择自动提交偏移量。当消费者处理完一个分区中的消息后，它需要将自己的偏移量提交给Kafka服务器，以便Kafka服务器知道消费者已经读取了哪些消息。下面是一个使用Py
【Azure 应用服务】本地创建Azure Function Kafka Trigger 函数和Kafka output的HTTP Trigger函数实验云中路灯
问题描述在上一篇博文(https://www.cnblogs.com/lulight/p/16525902.html)中，我们成功的以VM作为Kafka服务器运行，并且验证了从其他机器中远程访问。在本文中，将使用VisualStudio2022创建AzureFunction作为生产者和消费者在本地进行验证生产者：使用HTTPTrigger函数，以kafkaoutput作为输出消费者：使用Kafka
美团面试：Kafka如何处理百万级消息队列？ javakafka
美团面试：Kafka如何处理百万级消息队列？在今天的大数据时代，处理海量数据已成为各行各业的标配。特别是在消息队列领域，ApacheKafka作为一个分布式流处理平台，因其高吞吐量、可扩展性、容错性以及低延迟的特性而广受欢迎。但当面对真正的百万级甚至更高量级的消息处理时，如何有效地利用Kafka，确保数据的快速、准确传输，成为了许多开发者和架构师思考的问题。本文将深入探讨Kafka的高级应用，通过
Kafka痛点与Puslar介绍 weidajiangjiang kafka痛点 Puslar
ApacheKafka作为一款成熟的消费队列得到了很广泛地运用.但以2019年的角度来看,存在一些痛点.存储计算没有分离,难以扩容和缩容没有IO隔离,写高了读不动,读高了写不动没有多租户IO模型过于简单,面对大量topic时性能下降严重消费模型有限,无法利用部分业务可以接受消息无序的特点Puslar是一个非常优秀的开源系统，它的整体框架偏向于HBase的设计，在其上实现了流数据的处理和服务。从与K
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s