心有余力

Apache Pulsar 分布式消息系统

Apache Pulsar是一个企业级的分布式消息系统。项目于2015年由 Yahoo 开源，2017年6月提交给 Apache 孵化器，2018年9月成为Apache的顶级项目。

特性

架构概述

Broker

集群

元数据

持久存储

Apache BookKeeper

Pulsar相关概念

Topic

数据分区

命名空间

订阅类型

消费模式

生产环境实践

总结

特性

Pulsar之所以能够称为下一代消息队列，主要是因为以下特性:

线性扩展。能够方便的扩容到成百上千个节点(Kafka扩容需要占用很多系统资源在节点间拷贝数据，而Pulsar完全不用)
高吞吐。已经在Yahoo的生产环境中经受了考验，每秒数百万消息
低延迟。在大规模的消息量下依然能够保持低延迟(< 5ms)
持久化机制。Pulsar的持久化机制构建在Apache BookKeeper之上，提供了写与读之前的IO隔离
基于地理位置的复制。Pulsar将多地域/可用区的复制作为首要特性支持。用户只需配置好可用区，消息就会被源源不断的复制到其他可用区。当某一个可用区挂掉或者发生网络分区，Pulsar会在之后不断的重试。
部署方式的多样化。既可以运行在裸机，也支持目前例如Docker、K8S的一些容器化方案以及不同的云厂商，同时在本地开发时也只需要一行命令即可启动整个环境。
Topic支持多种消费模式:exclusive、shared、failover

架构概述

在最高层，Pulsar实例由一个或多个Pulsar集群组成。同一个实例内的集群间可以相互复制数据，

Pulsar集群由三部分组成：

Broker：一个或者多个broker负责处理和负载均衡源源不断从Producer发来的消息，并分发给消费者。通过一个全局的ZK集群来处理多种协作式任务，例如说基于地理位置的复制。它与配置存储交互来处理相应的任务，将消息存储在BookKeeper实例中(也称为bookies)，同时单个集群内也需要有一套ZK集群，来存储一些元数据。
BookKeeper集群：由一个或多个bookie组成的BookKeeper集群，用于持久化消息。
ZooKeeper集群：用于Pulsar集群操作的该Pulsar集群独有的ZooKeeper

下图是Pulsar集群的说明：

Broker

在Kafka和RocketMQ中，Broker负责消息数据的存储以及consumer消费位移的存储等，而Pulsar中的broker和他们两个有所不同。

Pulsar中的broker是一个无状态的节点，主要负责运行另外的两个组件：

HTTP服务器，通过调用REST API接口来实现管理任务，以及为Producer和Consumer提供Topic查询。
调度器，异步的TCP服务，通过自定义Binary Protocol处理所有数据传输（协议是Google开源的Protocol Buffer）。

消息通常被分发到托管ledger缓存，除非backlog已经超出了缓存的大小。如果backlog对于缓存来说增长的太大，broker将开始从BookKeepr读取数据条目。

为了支持全局Topic异地复制，Broker使用复制器查询出发布在本区域尾部的条目，然后通过Java客户端类库重新把他们发步到其他远程可用区。

集群

Pulsar的实例，由一到多个Pulsar集群组成。而集群组成如下：

一到多个Pulsar broker
ZooKeeper仲裁，作为集群层面的配置和协调
一套bookie，用作来消息的持久存储。

集群可以通过geo-replication相互复制。

元数据

Pulsar中的元数据主要存储到ZK中，在Pulsar实例中：

不同可用区相关的配置信息，namespace，以及其他所有需要全局一致的信息，会存在全局的ZK中
集群内部的ZK用于存储集群指定的配置和协调信息，如元数据的所有权、Broker负载报告、BookKeeper ledger元数据等。例如某个Topic的数据写入到了那些Ledger、Broker目前的一些埋点数据等等。

持久存储

Pulsar为应用提供消息发送的保证。一旦消息成功到达Pulsar broker，他将会被发送到他预期的目标上。

这种保证，需要消息被发送及确认前，被持久存储。这种消息传输的模式，通常被称为持久化消息传输。在Pulsar中，所有消息的N份拷贝被存储及同步在硬盘上，例如，跨越两台server的4份拷贝，存储于镜像RAID卷。

Pulsar broker 在收到消息并进行确认之后，就必须确保消息在任何情况下都不会丢失。与其他消息系统不同的是，Pulsar 使用Apache BookKeeper来保证持久性。BookKeeper 提供了低延迟的持久化存储。Pulsar 在收到消息之后，将消息发送给多个 BookKeeper 节点（具体由复制系数来定），节点将数据写入预写式日志（write ahead log），同时在内存里也保存一份。节点在对消息进行确认之前，强制将日志写入到持久化的存储上，因此即使出现电力故障，数据也不会丢失。因为 Pulsar broker 将数据发给了多个节点，所以只会在大多数节点（quorum）确认写入成功之后它才会将确认消息发给生产者。Pulsar 就是通过这种方式来保证即使在出现了硬件故障、网络故障或其他故障的情况下仍然能够保证数据不丢失。

Apache BookKeeper

Apache BookKeeper是分布式 write-ahead log(WAL) 系统。

Pulsar使用BookKeeper系统来持久存储消息，BookKeeper为Pulsar提供了很重要的优势：

它使得Pulsar可以使用很多称为legder的独立log。随着时间的移动，可以为topic创建很多的ledger。
它为有序数据提供了非常高效的存储，并处理数据条目复制。
在各种可能的系统崩溃下，它可以保证ledger的读一致性。
它提供跨bookie的I/O分配。
它在容量及吞吐量上都能做到可扩展。可以通过为集群增加bookie立即提升容量。
Bookie的设计支持处理成千上万ledger的读写并发。通过使用多个硬盘设备---一块用于journal，其他的用做普通存储，这把读操作从正在进行的写操作延迟影响中隔离出来。

BookKeeper是一个可横向扩展的、错误容忍的、低延迟的分布式存储服务，BookKeeper中最基本的单位是记录，实际上就一个字节数组，而记录的数组称之为ledger，BK会将记录复制到多个bookies，存储ledger的节点叫做bookies，从而获得更高的可用性和错误容忍性。从设计阶段BK就考虑到了各种故障，Bookies可以宕机、丢数据、脏数据，但是主要整个集群中有足够的Bookies服务的行为就是正确的。

在Pulsar中，每个分区Topic是由若干个ledger组成的，而ledger是一个append-only的数据结构，只允许单个writer，ledger中的每条记录会被复制到多个bookies中，一个ledger被关闭后(例如broker宕机了或者达到了一定的大小)就只支持读取，而当ledger中的数据不再需要的时候(例如所有的消费者都已经消费了这个ledger中的消息)就会被删除。

Bookkeeper的主要优势在于它可以保证在出现故障时在ledger的读取一致性。因为ledger只能被同时被一个writer写入，因为没有竞争，BK可以更高效的实现写入。在Broker宕机后重启时，Pulsar会启动一个恢复的操作，从ZK中读取最后一个写入的Ledger并读取最后一个已提交的记录，然后所有的消费者也都被保证能看到同样的内容。

我们知道Kafka在0.8版本之前是将消费进度存储到ZK中的，但是ZK本质上基于单个日志的中心服务，简单来讲，ZK的性能不会随着你增加更多的节点而线性增加，会只会相反减少，因为更多的节点意味着需要将日志同步到更多的节点，性能也会随之下降，因此QPS也会受单机性能影响，因此0.8版本之后就将消费进度存储到了Kafka的Topic中，而RocketMQ最初的版本也类似，有几种不同的实现例如ZK、数据库等，目前版本采用的是存储到本机文件系统中，而Pulsar采用了和Kafka类似的思想，Pulsar将消费进度也存储到了BK的ledger中。

Ledger

ledger是单写入仅可追加的数据结构，被分配给多个BookKeeper的存储节点或者bookie。Ledger条目被复制到多个bookie。Ledge自己的语义十分简单：

Pulsar broker可以创建ledger，往ledger添加条目，关闭ledger。
ledger关闭后--无论是主动还是因为写入程序错误---他都可以被以只读的方式打开。
最后，当ledger中的条目不再需要时，整个ledger都将从系统中被删除（跨所有bookie）

Ledger的读一致性

BookKeeper最主要的长处是他在存在失败的情况下，能够保证ledger的读一致性。因为ledger仅可被单线程写入，这让程序很轻易就做到高效增加条目，而不需要考虑一致性。失败后，ledger将会执行恢复程序，最终确定ledger状态并发布最后提交的条目日志。经过上述操作，ledger的所有读取者会被保证读取到完全一样的内容。

托管ledger

考虑到BookKeeper Ledger提供单一log抽象，构建于ledger之上的类库，被称为托管ledger，它代表了单一log的存储层。托管ledger代表消息流的抽象。它有一个单独的写入者，往流的末尾持续添加数据，多个游标在消费流数据，每个游标都持有自己的关联位置。

在内部，一个单独的托管ledger使用多个BookKeeper ledger来存储数据。使用多个ledger出于以下两个原因考虑：

失败后，ledger不再可写，一个新的ledger需要被创建
当ledger含有的全部消息被所有cursor都消费完成时，ledger就可以被删除了。这允许ledger周期回滚。

Pulsar相关概念

Topic

向 Pulsar 发送数据的应用程序叫作生产者（producer），而从 Pulsar 读取数据的应用程序叫作消费者（consumer）。有时候消费者也被叫作订阅者。发布订阅系统中最核心的概念是Topic，简单来说，Topic可以理解为一个管道，Producer可以往这个管道丢消息，Consumer可以从这个管道的另一端读取消息，但是这里可以有多个Consumer同时从这个管道读取消息。

数据分区

写入主题的数据可能只有几个 MB，也有可能是几个 TB。所以，在某些情况下主题的吞吐量很低，有时候又很高，完全取决于消费者的数量。那么碰到有些主题吞吐量很高而有些又很低的情况该怎么处理？为了解决这个问题，Pulsar 将一个主题的数据分布到多台机器上，也就是所谓的分区。

在处理海量数据时，为了保证高吞吐量，分区是一种很常见的手段。默认情况下，Pulsar 的主题是不进行分区的，但通过命令行工具或 API 可以很容易地创建分区主题，并指定分区的数量。

在创建好分区主题之后，Pulsar 可以自动对数据进行分区，不会影响到生产者和消费者。也就是说，一个应用程序向一个主题写入数据，对主题分区之后，不需要修改应用程序的代码。分区只是一个运维操作，应用程序不需要关心分区是如何进行的。

主题的分区操作由一个叫作 broker 的进程来处理，Pulsar 集群里的每个节点都会运行自己的 broker。

每个Topic可以划分为多个分区，同一个Topic下的不同分区所包含的消息都是不同的。每个消息在被添加到一个分区后都会分配一个唯一的offset，在同一个分区内消息是有序的，因此客户端可以根据比如说用户ID进行一个哈希取模从而使得整个用户的消息都发往整个分区，从而一定程度上避免race condition的问题。
通过分区，将大量的消息分散到不同的节点处理从而获得高吞吐。默认情况下，Pulsar的topic都是非分区的，但是支持通过cli或者接口创建一定分区数目的Topic。

将一个主题分到多个 broker 上：

默认情况下Pulsar会自动均衡Producer和Consumer,但有时候客户端想要根据自己的业务规则也进行路由，Pulsar默认支持以下几种规则：

单个分区——生产者随机挑选一个分区，并将数据写入该分区。该策略与非分区主题提供的保证是一样的，不过如果有多个生产者向同一个主题写入数据，该策略就会很有用。
轮询（round robin）分区——生产者通过轮询的方式将数据平均地分布到各个分区上。比如，第一个消息写入第一个分区，第二个消息写入第二个分区，并以此类推。
哈希（hash）分区——每个消息会带上一个键，要写入哪个分区取决于它所带的键。这种分区方式可以保证次序。
自定义分区——生产者使用自定义函数生成分区对应的数值，然后根据这个数值将消息写入对应的分区。

构建 Pulsar 的目的是为了支持多租户（multi-tenant）应用场景。Pulsar 的多租户机制包含了两种资源：资产（property）和命名空间（namespace）。资产代表系统里的租户。假设有一个 Pulsar 集群用于支持多个应用程序（就像 Yahoo 那样），集群里的每个资产可以代表一个组织的团队、一个核心的功能或一个产品线。一个资产可以包含多个命名空间，一个命名空间可以包含任意个主题。

Pulsar 各个组件间的关系：

命名空间

命名空间是 Pulsar 最基本的管理单元。在命名空间层面，我们可以设置权限、调整复制选项、管理跨级群的数据复制、控制消息的过期时间或执行其他关键任务。命名空间里的主题会继承命名空间的配置，所以我们可以一次性对同一个命名空间内的所有主题进行配置。命名空间可以分为两种：

本地（local）——本地命名空间只在集群内可见。
全局（global）——命名空间对多个集群可见，可以是同一个数据中心内的集群，也可以是跨地域数据中心的集群。该功能取决于是否启用了集群复制功能。

虽然本地命名空间和全局命名空间的作用域不同，但它们都可以在不同的团队或不同的组织内共享。如果应用程序获得了命名空间的写入权限，就可以往该命名空间内的所有主题写入数据。如果写入的主题不存在，就会创建该主题。

订阅类型

每个命名空间可以包含一到多个主题，每个主题可以有多个订阅者，每个订阅者可以接收所有发布到该主题的消息。为了给应用程序提供更大的灵活性，Pulsar 提供了三种订阅类型，它们可以共存在同一个主题上：

独享（exclusive）订阅——同时只能有一个消费者。
共享（shared）订阅——可以由多个消费者订阅，每个消费者接收其中的一部分消息。
失效备援（failover）订阅——允许多个消费者连接到同一个主题上，但只有一个消费者能够接收消息。只有在当前消费者发生失效时，其他消费者才开始接收消息。

下图展示了这三种类型的订阅。Pulsar 的订阅机制解耦了消息的生产者和消费者，在不增加复杂性和开发工作量的情况下为应用程序提供了更大的弹性。

消费模式

消费决定了消息具体是如何被分发到消费者的，Pulsar支持几种不同的消费模式: exclusive、shared、failover。

图示如下:

Exclusive: 一个topic只能被一个消费者消费。Pulsar默认就是这个模式
Shared: 共享模式或者叫轮询模式，多个消费者可以连接到同一个topic，消息被依次分发给消费者，当一个消费者宕机或者主动断开连接，那么发到那个消费者的还没有ack的消息会得到重新调度分发给其他消费者。
Failover: 多个消费者可以连接同一个topic并按照字典序排序，第一个消费者会开始消费消息，称之为master，当master断开连接，所有未ack和队列中剩下的消息会分发给另一个消费者。
Pulsar目前也支持另一种Reader接口，支持传入一个消息ID，例如说Message.Earliest来从最早的消息开始消费。

生产环境实践

Pulsar 目前在助力 Yahoo 的主要应用，如Yahoo Mail、Yahoo Finance、Yahoo Sports、Gemini广告平台和 Yahoo 分布式键值存储系统Sherpa。很多场景都要求很强的持久性保证，比如零数据丢失，同时又要求很高的性能。Pulsar 从 2015 年开始部署到生产环境，现在在 Yahoo 的生产环境里大规模地运行。

Pulsar 被部署在 10 多个数据中心里，具备了全网格复制能力
每天处理超过 1000 亿个消息
支持着 140 万个主题
整体的消息发布延迟小于 5 毫秒

总结

Pulsar作为下一代分布式消息队列，拥有非常多吸引人的特性，也弥补了一些其他竞品的短板，例如地域复制、多租户、扩展性、读写隔离等等。

官网Pulsar架构概述

官网Pulsar消息系统概述

Pulsar VS. Kafka: 统一的消息消费模型（Queue + Stream）

Kafka和Pulsar深入解析 jasen91 大数据开发 kafka 分布式
Kafka多租户：单租户系统数据迁移：依赖MirrorMaker，需要额外维护。市场上也有ConfluentReplicator等供应商工具。分层存储：由供应商提供商业使用。组件依赖：KafkaRaft（KRaft）从Kafka2.8开始处于早期访问模式，允许Kafka在没有ZooKeeper的情况下工作。这对Kafka来说是一个显著的优势，因为它简化了Kafka的体系结构并降低了学习成本。云原生
【Rust光年纪】深度解读：Rust语言中各类消息队列客户端库详细对比 friklogff Rust光年纪 rust 开发语言后端
选择最佳Rust消息队列客户端库：全面对比与分析前言随着现代应用程序的复杂性不断增加，消息队列成为构建可靠、高性能系统的重要组件。本文将介绍一些用于Rust语言的消息队列客户端库，包括AMQP、ApacheKafka、NSQ、ApachePulsar和RocketMQ，探讨它们的核心功能、使用场景、安装配置以及API概览。欢迎订阅专栏：Rust光年纪文章目录选择最佳Rust消息队列客户端库：全面对
pulsar集群部署 Dragon-qwe spring boot linux
Linux安装openjdk11下载openjdk11openjdk11下载压缩包上传到指定路径并解压tar-xvfopenjdk-11.0.0.2_linux-x64.tar.gz&&mvjdk-11.0.0.2/jdk11配置指定用户的环境变量vi~/.bash_profile#末尾增加如下内容(根据自己jdk目录修改)exportJAVA_HOME=/yourpath/jdk-11expor
Pulsar与Rocketmq、Kafka、Inlong-TubeMQ，谁才是消息中间件的王者？腾讯云开发者运维大数据分布式数据库 kafka
导语|Pulsar作为下一代消息中间件的典型代表，在设计和实现上面都具备很好的前瞻性，综合考量了业界现存的一些比较常用的、优秀的消息中间的架构设计、适用场景、运营中的问题等，如目前用的比较多的Kafka、Rocketmq、Inlong-TubeMQ等。本文仅从设计角度出发，说明下Pulsar与Kafka、Rocketmq及腾讯开源的Inlong-TubeMQ在实现上的几点区别和可能遇到的问题，供大
消息中间件：Puslar、Kafka、RabbigMQ、ActiveMQ MarkHD kafka activemq 分布式
消息中间件是一种独立的技术组件，允许应用程序和应用程序之间进行通信。它们主要用于处理异步消息，解耦应用程序，削峰填谷，以及提供可靠的消息传输。以下是提到的几种消息中间件的概述：Pulsar：Pulsar是一个由Apache软件基金会管理的开源分布式发布-订阅消息系统。它支持多租户、持久化存储、多机房跨区域数据复制，并具有强一致性、高吞吐、低延时及高可扩展性等流数据存储特性。Pulsar的单个实例原
如何给开源项目发起提案开源pulsar
背景前段时间在使用Pulsar的adminAPI时，发现其中的一个接口响应非常慢：admin.topics().getPartitionedStats(topic);使用curl拿到的响应结果非常大，同时也非常耗时：具体的issue在这里：https://github.com/apache/pulsar/issues/21200后面经过分析，是因为某些topic的生产者和消费者非常多，导致这个查询
Pulsar Architecture Overview（架构概述） swadian2008 Apache pulsar Pulsar 的组成部分 Pulsar 的架构概述 Pulsar
目录1、Brokers代理服务器2、Clusters集群3、Metadatastore元数据存储4、Configurationstore配置存储5、Persistentstorage持久化存储（1）ApacheBookKeeper存储实体（2）Ledgers分类账（3）Journalstorage日志存储6、Pulsarproxy（代理）7、Servicediscovery服务发现从一个最高层级来
Pulsar Standalone服务搭建 aileen5150 docker
PulsarStandalone服务搭建说明简介ApachePulsar是Apache软件基金会顶级项目，是下一代云原生分布式消息流平台，集消息、存储、轻量化函数式计算为一体。该系统源于Yahoo，最初在Yahoo内部开发和部署，支持Yahoo应用服务平台140万个主题，日处理超过1000亿条消息。Pulsar于2016年由Yahoo开源并捐赠给Apache软件基金会进行孵化，2018年成为Apa
Apache Pulsar--简单介绍陈永佳 Apache Pulsar Apache Pulsar
摘要今天分享下——ApachePulsar–简单介绍的一些基本知识，欢迎关注！官方文档查看官网文档地址ApachePulsar是什么？一句话说：是一个云原生的批流一体的在诸多场景优于Kafka的新一代的消息队列中间件。ApachePulsar有哪些特性？ApachePulsar采用计算与存储分离的分层架构设计，支持多租户、持久化存储、多机房跨区域数据复制，具有强一致性、高吞吐以及低延时的高可扩展流
Pulsar-架构与设计临江蓑笠翁消息队列架构
Pulsar架构与设计一、背景和起源二、框架概述1.设计特点2.框架适用场景三、架构图1.Broker2.持久化存储（Persistentstorage）3.Pulsar元数据（Metadatastore）四、功能特性1.消息顺序性2.消息回溯3.消息去重4.消息重投递5.消息重试6.消息TTL7.延迟队列8.重试队列9.死信队列10.消息语义五、设计原理1.消息去重2.消息重试3.延迟队列4.消
Znode数据丢失导致pulsar元数据不一致问题复盘 ShootHzj
问题背景某环境执行zk升级后，pulsar的生产者报告部分topic发送消息超时，创建生产者超时，查看pulsar后台日志发现无明显异常，遂猜测可能为元数据损坏问题。重启生产者也未恢复正常。升级zk的时候，因为未知原因，导致数据部分损坏，体现为/manager-ledgers/{namespace}/{topic}下存在topic数据，但/admin/partitioned-topics/pers
Apache Pulsar 在腾讯 Angel PowerFL 联邦学习平台上的实践 StreamNative
腾讯AngelPowerFL联邦学习平台联邦学习作为新一代人工智能基础技术，通过解决数据隐私与数据孤岛问题，重塑金融、医疗、城市安防等领域。腾讯AngelPowerFL联邦学习平台构建在Angel机器学习平台上，利用Angel-PS支持万亿级模型训练的能力，将很多在Worker上的计算提升到PS（参数服务器）端；AngelPowerFL为联邦学习算法提供了计算、加密、存储、状态同步等基本操作接口，
Apache Pulsar——tenants租户、namespace命名空间、topic 小波同学
一、多租户ApachePulsar最初诞生于雅虎，当时就是为了解决雅虎内部各个部门之间数据的协调，所以多租户特性显得至关重用，Pulsar从诞生之日起就考虑到多租户这一特性，并在后续的实现过程中，将其不断的完善。多租户这一特性，使得各个部门之间可以共享同一份数据，不用单独部署独立的系统来操作数据，很好的保证了各部门间数据一致性的问题，同时简化维护成本。在介绍Pulsar多租户之前，先来看一下，正常
KubeBlocks v0.8.0 发布！Component API 让数据库引擎组装更简单！小猿姐数据库 kubernetes 云计算
KubeBlocksv0.8.0版本发布了！KubeBlocksv0.8.0推出了ComponentAPI，让数据库引擎的组装变得更加简单。举个例子，我们可以将etcd和zookeeper这两种数据库做成了标准组件，开发者在定义Kafka或者Pulsar等复杂引擎时可以直接引用；再举个例子，我们还可以将Proxy做成了标准组件，开发者在定义各种发行版的MySQL或PostgreSQL引擎读写分离拓
Apache Pulsar 为滴滴大数据运维带来了哪些收益？滴滴技术 apache 大数据运维
ApachePulsar是Apache软件基金会顶级项目，是下一代云原生分布式消息流平台，集消息、存储、轻量化函数式计算为一体。该系统源于Yahoo，最初在Yahoo内部开发和部署，支持Yahoo应用服务平台140万个主题，日处理超过1000亿条消息。Pulsar于2017年由Yahoo开源并捐赠给Apache软件基金会进行孵化，2018年成为Apache软件基金会顶级项目。滴滴大数据于2021年
Apache Pulsar——协议适配器小波同学
背景为了能平滑、不改写代码、无侵入地迁移应用使用pulsar，KoP以插件形式支持Kafka协议。Github地址：https://github.com/streamnative/kop一、Kafka协议适配器KoPKoP（KafkaonPulsar）通过在Pulsar代理上引入Kafka协议处理程序，为ApachePulsar带来了原生的ApacheKafka协议支持。通过将KoP协议处理程序添
Apache Pulsar 社区周报｜09-05 ~ 09-11 StreamNative
关于ApachePulsarApachePulsar是Apache软件基金会顶级项目，是下一代云原生分布式消息流平台，集消息、存储、轻量化函数式计算为一体，采用计算与存储分离架构设计，支持多租户、持久化存储、多机房跨区域数据复制，具有强一致性、高吞吐、低延时及高可扩展性等。导语各位小伙伴们，Pulsar社区周报来啦！本次Pulsar社区周报，为大家呈现Pulsarclient、transactio
Linux中如何实现定时任务千锋
Linux中如何实现定时任务在电商、支付等领域，往往会有这样的场景，用户下单后放弃支付了，那这笔订单会在指定的时间段后进行关闭操作。细心的你一定发现了像某宝、某东都有这样的逻辑，而且时间很准确，误差在1s内，那他们是怎么实现的呢？一般实现的方法有几种：使用RocketMQ、RabbitMQ、Pulsar等消息队列的延时投递功能使用Redisson提供的DelayedQueue有一些方案虽然广为流传
（转载）Python 并发框架 Pulsar-Python 慌翯
原文来自：https://www.oschina.net/p/pulsar-python前言Pulsar-Python是Python的并发框架，它可以在不同的线程或者进程中通过执行一个或者多个活动来写异步服务器。Pulsar-Python的目标是提供一个构建可扩展网络程序的简单方法。示例代码：学习从来不是一个人的事情，要有个相互监督的伙伴，工作需要学习python或者有兴趣学习python的伙伴可
比拼Kafka，大数据分析新秀Pulsar到底好在哪 java菜
在用户选择一个消息系统时，消息模型是用户首先考虑的事情。消息模型应涵盖以下3个方面：消息消费——如何发送和消费消息；消息确认（ack）——如何确认消息；消息保存——消息保留多长时间，触发消息删除的原因以及怎样删除；消息消费模型在实时流式架构中，消息传递可以分为两类：队列（Queue）和流（Stream）。队列（Queue）模型队列模型主要是采用无序或者共享的方式来消费消息。通过队列模型，用户可以创
请注意，你的 Pulsar 集群可能有删除数据的风险 crossoverJie
在上一篇Pulsar3.0新功能介绍中提到，在升级到3.0的过程中碰到一个致命的问题，就是升级之后topic被删除了。正好最近社区也补充了相关细节，本次也接着这个机会再次复盘一下，毕竟这是一个非常致命的Bug。现象先来回顾下当时的情况：升级当晚没有出现啥问题，各个流量指标、生产者、消费者数量都是在正常范围内波动。事后才知道，因为只是删除了很少一部分的topic，所以从监控中反应不出来。早上上班后陆
技术阅读周刊第十三期：一些提高生产力工具的终端命令 crossoverJie java 开发语言
技术阅读周刊，每周更新。历史更新20231201：第八期20231215：第十期20231122：第十一期20231129：第十二期生存还是毁灭？一文带你看懂Pulsar的消息保留和过期策略-腾讯云开发者社区-腾讯云URL:https://cloud.tencent.com/developer/article/2245703本文分析了Pulsar消息的生命周期，主要是如何保留和回收消息TTL（Ti
pulsar的架构与特性记录那小子、真烦云原生
一、什么是云原生云原生的概念是2013年MattStine提出的,到目前为止，云原生的概念发生了多次变更，目前最新对云原生定义为:Devps+持续交付+微服务+容器而符合云原生架构的应用程序是:采用开源堆栈(K8S+Docker)进行容器化，基于微服务架构提高灵活性和可维护性，借助敏捷方法、DevOps支持持续迭代和运维自动化，利用云平台设施实现弹性伸缩、动态调度、优化资源利用率。二、Apache
pulsar原来是这样操作topic的林崇辉 java 消息队列 pulsar 流平台
本篇主要讲述pulsartopic部分，主要从设计以及源码的视角进行讲述。在pulsar中，一个Topic的新建、扩容以及删除操作都是由Broker来处理的，而Topic相关的数据是存储在zookeeper上的。本篇文章模拟一个高效的学习流程进行展开介绍使用方式(Topic操作指令)从高纬度俯视调用流程(从服务层面看Topic的调用流程)逐步切入某个具体的操作进一步展开内部的调用流程(从代码层面看
Apache Pulsar[3] 概念进阶 QuinnSun
订阅模型Pulsar提供了灵活的消息模型，支持三种订阅类型：Exclusivesubscription：排他，只能有一个Consumer，接收一个Topic所有的消息Sharedsubscription：共享，可以同时存在多个Consumer，每个Consumer处理Topic中一部消息（Shared模型是不保证消息顺序的，Consumer数量可以超过分区的数量）Failoversubscript
源码编译部署篇（二）源码编译milvus成功后如何启动standalone并调试成功！就想做一条闲鱼向量数据库 milvus
Milvus启动和调试0前言1Milvus启动【问题描述】出现Aborted问题【问题分析】【解决方法】安装Pulsar服务执行单机启动命令解决监听端口号2Milvus调试编写launch.json验证单例调试成功3遇到的问题汇总问题1问题2:Permissiondenied0前言由于Milvus官方文档只提及如何使用docker安装部署Milvus，关于源码安装方式篇幅较少，因此，我整理撰写了如
Apache Pulsar[4] 伪集群环境搭建 QuinnSun
1准备工作操作系统：macOs运行环境：java82集群组成zk集群（3个节点）bk集群（3个节点）pulsar集群（3个节点）3搭建过程3.1zk集群搭建zk版本：3.4.121下载并解压zk2将解压好的zookeeper文件夹复制3份分别命名为zookeeper1，zookeeper2，zookeeper3image.png3以其中一个节点为例进行配置（3.1）新建两个目录分别使data、lo
3分钟看懂如何给开源项目发起提案白日梦批发商开源
背景前段时间在使用Pulsar的adminAPI时，发现其中的一个接口响应非常慢：admin.topics().getPartitionedStats(topic);使用curl拿到的响应结果非常大，同时也非常耗时：具体的issue在这里：https://github.com/apache/pulsar/issues/21200后面经过分析，是因为某些topic的生产者和消费者非常多，导致这个查询
Flink版本更新汇总（1.14-1.18）猫猫爱吃小鱼粮 flink 人工智能大数据
0、汇总========1.14.0========1.有界流支持Checkpoint；2.批执行模式支持DataStream和Table/SQL混合应用；3.新增HybridSource功能；4.新增缓冲区去膨胀功能；5.新增细粒度资源管理功能；6.新增DataStream的Pulsar连接器；========1.15.0========1.支持增量的Savepoint；2.保证作业级别的指标在
FAST银道面脉冲星巡天项目介绍 qiufeng1ye
ToolsofRadioAstronomy,6thedition（射电天文工具，第6版）ToolsofRadioAstronomy,5thedition（射电天文工具，第5版）FAST19波束脉冲星漂移扫描巡天模拟（基于Parkes观测数据）FAST科学数据简介FAST第八批科学数据开放通告FAST望远镜银道面脉冲星巡天项目TheFASTGalacticPlanePulsarSnapshotsur
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

Apache Pulsar 分布式消息系统

特性

架构概述

Broker

集群

元数据

持久存储

Apache BookKeeper

Pulsar相关概念

Topic

数据分区

命名空间

订阅类型

消费模式

生产环境实践

总结

你可能感兴趣的:(Pulsar)