关于Zookeeper

Zookeeper简介

1.Zookeeper是一个开放源代码的软件。

2.Zookeeper是一个管理“分布式应用程序”的软件。什么是分布式应用程序服务?我们知道,Hadoop中的组件,如hdfs、MapReduce/yarn、hbase、double、kafka都是分布式服务。如MapReduce就是一个分布式服务,MapReduce会将所做的工作分发给Hadoop集群中的多台服务器共同实现。如何对分布式服务做协调,管理这些运行在不同电脑上的任务?就需要一个对分布式应用程序做协调的服务,这就是Zookeeper的工作。

3.Zookeeper可以实现对分布式应用程序做一致性服务,什么是一致性服务?比如我们对A服务器上的一个数据进行了修改,这个数据同时在D服务器和M服务器有两个备份,这时就要对D服务器和M服务器有两个备份都进行修改,这就是一致性服务。Zookeeper就可以实现这么一个一致性服务。

4.Zookeeper实现的强一致性服务。一致性服务分为3类,分别是:

  • 强一致性:a发生变化,b立刻就发生变化
  • 弱一致性:a发生变化,b过一会会发生变化
  • 最终一致性:a发生变化,b最终也会发生变化

Zookeeper可以实现立刻的数据一致性,即强一致性。
大家知道,Hadoop生态系统中的组件,都喜欢起动物的名称。如Hadoop、Hive、Pig等。而Zookeeper中文意思是动物园管理员,就是管理Hadoop生态系统。

5.ZooKeeper的好处
以下是使用ZooKeeper的好处:

  • 简单的分布式协调过程
  • 同步 - 服务器进程之间的相互排斥和协作。此过程有助于Apache HBase进行配置管理。
  • 有序的消息
  • 序列化 - 根据特定规则对数据进行编码。确保应用程序运行一致。这种方法可以在MapReduce中用来协调队列以执行运行的线程。
  • 可靠性
  • 原子性 - 数据转移完全成功或完全失败,但没有事务是部分的。

Zookeeper的选举机制

看看下面的图表。它描述了ZooKeeper的“客户端-服务器架构”。
关于Zookeeper_第1张图片
配置多个实例共同构成一个Zookeeper集群对外提供服务以达到水平扩展的目的,集群中的每一台电脑都称为服务器(Server),每个服务器上的数据是相同的,每一个服务器均可以对外提供读和写的服务,这点和redis是相同的,即对客户端来讲每个服务器都是平等的。zookeeper集群一般需要奇数台服务器,为什么是奇数台服务器?因为我们需要通过选举机制选出领导者(leader),所以必须是奇数台服务器。
Zookeeper提供了三种选举机制:

  • LeaderElection
  • AuthFastLeaderElection
  • FastLeaderElection

默认的算法是FastLeaderElection
客户端(client)是请求发起方。服务器分为不同的角色,有领导者(leader),也有学习者(learner)。角色的不同是在选举中产生的,下面是选举的流程。
目前有5台服务器,每台服务器均没有数据,它们的编号分别是A,B,C,D,E按编号依次启动,它们的选择举过程如下:

  • 服务器A启动,给自己投票,然后发投票信息,由于其它机器还没有启动所以它收不到反馈信息,服务器A的状态一直属于Looking(选举状态)。
  • 服务器B启动,给自己投票,同时与之前启动的服务器A交换结果,由于服务器B的编号大所以服务器B胜出,但此时投票数没有大于半数,所以两个服务器的状态依然是Looking(选举状态)。
  • 服务器C启动,给自己投票,同时与之前启动的服务器A,B交换信息,由于服务器C的编号最大所以服务器C胜出,此时投票数正好大于半数,所以服务器C成为领导者(Leader),服务器A,B成为小弟。
  • 服务器D启动,给自己投票,同时与之前启动的服务器A,B,C交换信息,尽管服务器D的编号大,但之前服务器C已经胜出,所以服务器D只能成为小弟。
  • 服务器E启动,后面的逻辑同服务器E成为小弟。

这里的小弟就是学习者(learner)。学习者(learner)分为两类,能够参与投票的就是跟随者(follower),否则就是观察者(observer)。
服务器有以下状态。

  • LOOKING:竞选状态。
  • FOLLOWING:随从状态,同步leader状态,参与投票。
  • OBSERVING:观察状态,同步leader状态,不参与投票。
  • LEADING:领导者状态。

下面是选举的简易流程图。
关于Zookeeper_第2张图片
以下是选举状态图
描述Leader选择过程中的状态变化,这是假设全部实例中均没有数据,假设服务器启动顺序分别为:A,B,C。
关于Zookeeper_第3张图片
关于Zookeeper_第4张图片

Zookeeper的读写机制

关于Zookeeper_第5张图片
客户端首先和一个Server或者Observer(可以认为是一个Server的代理)通信,发起写请求,然后Server将写请求转发给Leader,Leader再将写请求转发给其他Server,Server在接收到写请求后写入数据并回应Leader,Leader在接收到大多数写成功回应后,认为数据写成功,回应Client。
Zookeeper读取由特定连接的Server在内部执行,因此不需要与集群进行交互。

Zookeeper的数据模型

Zookeeper的数据保存在一个类似于文件系统的一个树形结构中,每个数据节点只能携带少量的数据。为什么只能携带少量的数据呢?因为Zookeeper用于进行协调服务的,所以不需要携带大量数据。
每个数据节点(树中的每一个分支节点或者叶子节点)称之为znode。每一个znode节点既是目录又是文件(是文件的含义是它可以带少量数据,是目录的含义是它有可能还有子目录),这和我们普通看到的文件系统不一样。
关于Zookeeper_第6张图片

  • 每个目录在zookeeper中叫做znode,并且其有一个唯一的路径标识,如/services/myservice/servers/stuidname1
  • znode有两种类型,短暂的(ephemeral: 断开连接自己删除)和持久的(ersistent: 断开连接不删除);
  • znode可以包含数据和子znode(ephemeral类型的节点不能有子znode);
  • znode中的数据可以有多个版本,比如某一个znode下存有多个数据版本,那么查询这个路径下的数据需带上版本;
    创建znode时设置顺序标识,znode名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护 。
    如存一个/stu/name值mike,会对路径上加序列化,如/name000001
    再存一个/stu/name值jack,会对路径上加序列化, 如/name000002 上面的znode就有两个版本
  • 客户端应用可以在znode上设置监视器(Watcher)。
  • znode不支持部分读写,而是一次性完整读写
  • znode的类型在创建时确定并且之后不能再修改;
  • ephemeral znode的客户端会话结束时,zookeeper会将该ephemeral znode删除,ephemeral
    znode不可以有子节点;
    persistent znode不依赖于客户端会话,只有当客户端明确要删除该persistent znode时才会被删除;

总体来说,Zookeeper的节点有5种ACL(Access Controller List)权限:

  • CREATE 允许创建Child Nodes
  • READ 允许获取ZNode的数据,以及该节点的孩子列表
  • WRITE 可以修改ZNode的数据
  • DELETE 可以删除一个孩子节点
  • ADMIN 可以设置权限

这5种权限简写为crwda(即:每个单词的首字符缩写)。注意这5种权限中,delete是指对子节点的删除权限,其它4种权限指对自身节点的操作权限。

你可能感兴趣的:(大数据)