面试题

zookeeper 都有哪些使用场景?

面试官心理分析

假设现在聊的话题是分布式系统,面试官跟你聊完了 dubbo 相关的一些问题之后,已经确认你对分布式服务框架/RPC框架基本都有一些认知了。

那么接下来他可能开始要跟你聊分布式相关的其它问题了,比如分布式锁。

分布式锁这个东西很常用,无论做 Java 系统开发或者分布式系统,都可能会有一些场景会用到。而最常用的分布式锁就是基于 zookeeper 来实现的。

说实话,问这个问题,一般就是看看你是否了解 zookeeper,因为 zookeeper 是分布式系统中很常见的一个基础系统。

并且面试官问的话,常问的就是 zookeeper 的使用场景是什么?看你知道不知道一些基本的使用场景。当然其实 zookeeper 挖深了自然是可以问的很深很深的。

面试题剖析

大致来说,zookeeper 的使用场景如下,我就举下面几个简单的例子,大家能说这几个就OK了:

  • 分布式协调

  • 分布式锁

  • 元数据/配置信息管理

  • HA高可用性

分布式协调

这个其实是 zookeeper 很经典的一个用法,简单来说,就好比你 A 系统发送个请求到 mq,然后 B 系统消息消费之后处理了。

那 A 系统如何知道 B 系统的处理结果?

答案是:用 zookeeper 就可以实现分布式系统之间的协调工作。A 系统发送请求之后可以在 zookeeper 上对某个节点的值注册个监听器,一旦 B 系统处理完了就修改 zookeeper 那个节点的值,A 系统立马就可以收到通知,完美解决。

下图用一个用户提交订单请求展示了整个过程:

zookeeper 有哪些应用场景?面试官希望听到这 4 点!_第1张图片

分布式锁

这是zk的第二个使用场景。举个栗子,对某一个数据连续发出两个修改操作,两台机器同时收到了请求,但是只能一台机器先执行完另外一个机器再执行。

那么此时就可以使用 zookeeper 分布式锁,一个机器接收到了请求之后先获取 zookeeper 上的一把分布式锁,就可以去创建一个 znode,接着执行操作;

然后另外一个机器也尝试去创建那个 znode,结果发现自己创建不了,因为被别人创建了,那只能等着,等第一个机器执行完了自己再执行。

整个过程,如下图所示:

zookeeper 有哪些应用场景?面试官希望听到这 4 点!_第2张图片


元数据/配置信息管理

第三个场景,zookeeper 可以用作很多系统的配置信息的管理,比如 kafka、storm 等等很多分布式系统都会选用 zookeeper 来做一些元数据、配置信息的管理,包括 dubbo 注册中心不也支持 zookeeper 么?

下图展示了如何用zookeeper管理dubbo注册中心。

zookeeper 有哪些应用场景?面试官希望听到这 4 点!_第3张图片

HA高可用性

第四个应用场景即高可用(HA),这个应该是很常见的。

比如 hadoop、hdfs、yarn 等很多大数据系统,都选择基于 zookeeper 来开发 HA 高可用机制。

具体来说就是一个重要进程一般会做主备两个,主进程挂了立马通过 zookeeper 感知到切换到备用进程。

同样还是通过一张图来看看

zookeeper 有哪些应用场景?面试官希望听到这 4 点!_第4张图片