平时在 Pulsar 交流群中,我们发现大家在接触和使用 Pulsar 的过程中,会反复遇到相类似的问题。为了更高效地解决大家这些“高频疑问”,同时也对提出优质问题的朋友表示感谢,我们特别建立了 FAQ 知识库,以便于收集及解答大家的疑问。
我们将定期收集筛选社群内提出的高频问题,由社区专家甄别筛选出其中优质的提问进行回答,整合优化后分享给社区的小伙伴们作为遇到问题时的优先参考,希望可以帮助大家解决使用 Pulsar 过程中的问题。
下面来看看本次收集的问题吧:
消息保留
问题 1: 在 Pulsar 的消息保留机制里,Pulsar 的消息被一个消费者 Ack 后就会进入保留策略。那么在多个消费者订阅了一个 Topic、某条消息的部分消费者 Ack 的情况下,这条消息是否会进入保留策略?
解答:只有消息在所有订阅里都被 ACK,才会进一步由保留策略处理。对于同一个订阅,由哪个消费者进行 ACK 不重要,只要被 ACK 一次,在这个订阅里消息就是已经被 ACK 的状态。具体可参考:https://pulsar.apache.org/doc...
重试次数
问题 2: Pulsar 支持参数配置重试次数吗?
解答:不支持。Pulsar 按照时间来进行退避重试策略,和重试次数机制类似。客户端内部的重试策略是用的退避(backoff)机制,可以配置 ClientBuilder 的 backoff
参数来控制。
/**
* Set the duration of time for a backoff interval.
*
* @param duration the duration of the interval
* @param unit the time unit in which the duration is defined
* @return the client builder instance
*/
ClientBuilder startingBackoffInterval(long duration, TimeUnit unit);
/**
* Set the maximum duration of time for a backoff interval.
*
* @param duration the duration of the interval
* @param unit the time unit in which the duration is defined
* @return the client builder instance
*/
从生产者的角度,可以在 ProducerBuilder 中配置总的 send timeout。
/**
* Set the send timeout (default: 30 seconds).
*
* If a message is not acknowledged by the server before the sendTimeout expires, an error will be reported.
*
*
Setting the timeout to zero, for example {@code setTimeout(0, TimeUnit.SECONDS)} will set the timeout
* to infinity, which can be useful when using Pulsar's message deduplication feature, since the client
* library will retry forever to publish a message. No errors will be propagated back to the application.
*
* @param sendTimeout
* the send timeout
* @param unit
* the time unit of the {@code sendTimeout}
* @return the producer builder instance
*/
ProducerBuilder sendTimeout(int sendTimeout, TimeUnit unit)
Pulsar Perf
问题 3: 用 Pulsar Perf 来生产数据,但是无积压。
解答:在 Pulsar Perf 生产数据之前先创建 Subscription。
压测工具
问题 4: 如何对 Pulsar 压测呢?使用什么工具?
解答:Pulsar 压测工具目前有 Pulsar Perf 和 OpenMessaging Benchmark,使用详情参考以下链接:
消息延迟
问题 5: Pulsar 服务端默认支持延迟投递吗?
解答:Delay message 只在 Shared(共享)订阅模式生效。如果未生效,需要首先检查订阅模式是不是 Shared(共享),Pulsar 本身默认 Exclusive(独占) 订阅模式;同时应避免 delay message 在 KeyShared(键共享) 模式下生效,Delay message 和 Key_Shared 语义是违背的。
Broker 宕机
问题 6: 如果 Broker 宕机,消息如何通知到下一个 broker?
解答:Broker 本身无状态。
- Broker 在宕机时,不会主动通知其他 broker,分布在这个 broker上的所有 bundle(bundle 是 topic 集合,是 Pulsar topic 进行负载均衡的最小单位)都会执行 unload 操作,unload 操作的流程:
- 关闭 unload 中所有 topic 的生产者、消费者和复制机;
- 关闭 Managedledger。当所有 bundle 都 unload 完成后,这个 broker 就可以正常退出。
- 如果是 broker 异常退出,这个 broker 上的所有 bundle 也会被强行去掉对应归属,即这个 bundle 不在归属于这个 Broker。
当生产者或消费者客户端需要继续向某个 topic 发送/接收消息时,会首先执行 lookup 请求,会按照 loadbalance 策略找到目标 broker 节点(当前是 load 最低的节点),将对应 bundle onLoad 到目标 broker。待 onLoad 完成后,这个 broker 就可以继续为该 topic 提供读写服务了。
另外,Broker 在 ZooKeeper 上的一些临时节点信息,会主动删除;或因为超时而断开、其他 Broker 监听后,会进行相应的操作。
Compaction 限流
问题 7: 磁盘占用很严重,磁盘清理文件的速度远远跟不上写的速度,调整了 BookKeeper 参数 gcWaitTime、majorCompactionInterval、minorCompactionInterval
效果不明显,是否还有其他解决方案?
解答:Compaction 有一个限流策略,从你的描述来看,应该是 Compaction 比较慢,可以调整 isThrottleByBytes=true
,并且增加 compactionRateByBytes
的限流阈值。
# Throttle compaction by bytes or by entries.
isThrottleByBytes=false
# Set the rate at which compaction will readd entries. The unit is adds per second.
compactionRateByEntries=1000
# Set the rate at which compaction will readd entries. The unit is bytes added per second.
compactionRateByBytes=1000000
Pulsar 权限
问题 8: Pulsar 权限相关资料。
解答:
以上就是第 4 期社区 FAQ 汇总,在此感谢参与社群日常提问与解答的小伙伴们。让我们期待下一期的 FAQ 内容吧!