ZooKeeper(动物园管理员),顾名思义,是用来管理Hadoop(大象)、Hive(蜜蜂)、Pig(小猪)的管理员,同时Apache HBase、Apache Solr、LinkedIn Sensei等众多项目中都采用了ZooKeeper。
ZooKeeper是Hadoop的正式子项目,与Hadoop密切相关但却没有任何依赖。它是一个针对大型应用提供高可用的数据管理、应用程序协调服务的分布式服务框架,基于对Paxos算法的实现,使该框架保证了分布式环境中数据的强一致性,提供的功能包括:配置维护、统一命名服务、状态同步服务、集群管理等。
在分布式应用中,由于工程师不能很好地使用锁机制,以及基于消息的协调机制不适合在某些应用中使用,因此需要有一种可靠的、可扩展的、分布式的、可配置的协调机制来统一系统的状态。Zookeeper的目的就在于此。
根据ZooKeeper官方文档和ZooKeeper的作用,ZooKeeper一般有两种部署方式:
另外,需要注意的是,ZooKeeper集群是以宕机个数过半才会让整个集群宕机的,所以最好部署奇数个节点。ZooKeeper的单机模式是没有备份的,如果ZooKeeper宕了,服务也就停了,所以,在开发模式中可以使用单机模式,但是生成环境最好使用ZooKeeper集群的分布式模式。
以单机模式运行ZooKeeper服务是最简单的。因为ZooKeeper服务包含在一个JAR文件中,所以安装过程只要修改一个配置文件就行了。
将下载好的稳定版解压到某个目录,设置环境变量ZOOKEEPER_HOME
指向该目录。然后需要修改基本配置,ZooKeeper的配置文件在conf目录下,这个目录下有zoo_sample.cfg和log4j.properties,先将zoo_sample.cfg改名为zoo.cfg(ZooKeeper在启动时会找这个文件作为默认配置文件),在单机模式中,可以修改为下面的内容:
tickTime=2000 dataDir=/home/lxh/hadoop/data/zookeeper clientPort=2181
现在使用bin/zkServer.sh
脚本启动ZooKeeper:
$ $ZOOKEEPER_HOME/bin/zkServer.sh start
如果显示下面内容,说明启动成功:
JMX enabled by default Using config: /home/lxh/hadoop/zookeeper-3.4.6/bin/../conf/zoo.cfg Starting zookeeper ... STARTED
也可以通过jps
命令查看:
6056 Jps 6009 QuorumPeerMain
QuorumPeerMain
就是ZooKeeper的进程名。
ZooKeeper的日志信息输出使用了log4j,默认是控制台打印,可以修改$ZOOKEEPER_HOME/conf/log4j.properties
来控制输出内容和位置。
Zookeeper不仅可以单机提供服务,同时也支持多机组成集群来提供服务。
在单机模式中运行ZooKeeper,对于测试、开发比较方便。但是在生产环境中,为了获得可靠的ZooKeeper服务,应该在一个集群上部署 ZooKeeper。因为ZooKeeper集群宕机个数过半才会让整个集群宕机,所以,只要集群中半数以上的ZooKeeper服务启动了,那么总的 ZooKeeper服务将是可用的。从而也推断出,如果有5台机器,可以保证2台机器故障而不影响整个集群,ZooKeeper能继续正常运行。(这里又提到关于集群中机器的数量,是因为我一般喜欢双数,在做架构设计时,极易选择双数作为机器数。)
ZooKeeper的分布式模式的安装配置几乎跟单机模式一样,只是需要增加几个配置,下面是例子:
tickTime=2000 dataDir=/home/lxh/hadoop/data/zookeeper clientPort=2181 initLimit=5 syncLimit=2 server.1=zoo1:2888:3888 server.2=zoo2:2888:3888 server.3=zoo3:2888:3888
另外,在集群模式下,除了修改zoo.cfg配置文件,还要配置一个文件myid,这个文件在dataDir目录下,这个文件里面就有一个数据就是A的值,Zookeeper启动时会读取这个文件,拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。