1 应用场景:
hbase分布式部署 和 Hadoop2的自动切换
2 一些地址:
官网地址:http://zookeeper.apache.org/
下载地址: http://www.apache.org/dyn/closer.cgi/zookeeper/
官网文档学习地址: http://zookeeper.apache.org/doc/trunk/
3 概念简介:
Zookeeper 是 Google 的 Chubby一个开源的实现,是 Hadoop 的分布式协调服务
它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等
a) 为何使用:
大部分分布式应用需要一个主控、协调器或控制器来管理物理分布的子进程(如资源、任务分配等)
目前,大部分应用需要开发私有的协调程序,缺乏一个通用的机制
协调程序的反复编写浪费,且难以形成通用、伸缩性好的协调器
ZooKeeper:提供通用的分布式锁服务,用以协调分布式应用
b) zookeeper的角色:
领导者(leader),负责进行投票的发起和决议,更新系统状态
学习者(learner),包括跟随者(follower)和观察者(observer),follower用于接受客户端请求并想客户端返回结果,在选主过程中参与投票
Observer可以接受客户端连接,将写请求转发给leader,但observer不参加投票过程,只同步leader的状态,observer的目的是为了扩展系统,提高读取速度
客户端(client),请求发起方
4 搭建:
// 0 解压和重命名 [root@master local]# tar -zxvf zookeeper-3.4.5.tar.gz [root@master local]# mv zookeeper-3.4.5 zk // 1 设置环境变量 增加zk部分 [root@master zk]# vi /etc/profile export JAVA_HOME=/usr/local/jdk export HADOOP_HOME=/usr/local/hadoop export HIVE_HOME=/usr/local/hive export ZK_HOME=/usr/local/zk export PATH=.:$ZK_HOME/bin:$HIVE_HOME/bin:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH [root@master zk]# source /ect/profile // 2 给zk增加Java环境变量: [root@master conf]# ls configuration.xsl log4j.properties zoo_sample.cfg [root@master conf]# mv zoo_sample.cfg zoo.cfg [root@master conf]# ls configuration.xsl log4j.properties zoo.cfg [root@master conf]# // 3 修改 zoo.cfg的信息, 如下 dataDir=/usr/local/zk/data server.0=master:2888:3888 server.1=sliver103:2888:3888 server.2=sliver104:2888:3888 // 4 创建data目录,并创建myid文件添加内容: [root@master zk]# mkdir data [root@master data]# more myid //0是zk server标识,对应zoo.cfg下的server.0(server.是zk固定写法) 0 // 5 拷贝zk到sliver103, sliver104上 [root@master zk]# scp -r /usr/local/zk sliver103:/usr/local/ [root@master zk]# scp -r /usr/local/zk sliver104:/usr/local/ // 6 修改sliver103, sliver104的 zk/data/myid, 分别修改为1,2 // 7 拷贝master的/etc/profile到sliver103, sliver104上 [root@master zk]# scp /etc/profile sliver103:/etc/ [root@master zk]# scp /etc/profile sliver104:/etc/ 并分别在sliver103,104上执行 # source /ect/profile // 8 在三个节点上分别执行命令zkServer.sh start [root@master bin]# zkServer.sh start JMX enabled by default Using config: /usr/local/zk/bin/../conf/zoo.cfg Starting zookeeper ... STARTED [root@master bin]# ls [root@sliver103 bin]# zkServer.sh start JMX enabled by default Using config: /usr/local/zk/bin/../conf/zoo.cfg Starting zookeeper ... STARTED [root@sliver104 bin]# zkServer.sh start JMX enabled by default Using config: /usr/local/zk/bin/../conf/zoo.cfg Starting zookeeper ... STARTED // 9 检验,在三个节点上分别执行命令zkServer.sh status, 可以看到此三个节点通过选举在sliver103上产生了leader [root@master bin]# zkServer.sh status JMX enabled by default Using config: /usr/local/zk/bin/../conf/zoo.cfg Mode: follower [root@sliver103 bin]# zkServer.sh status JMX enabled by default Using config: /usr/local/zk/bin/../conf/zoo.cfg Mode: leader [root@sliver104 bin]# zkServer.sh status JMX enabled by default Using config: /usr/local/zk/bin/../conf/zoo.cfg Mode: follower
5 使用简介:
4.1) 进入master机器客户端界面,创建并赋值一个变量 [root@sliver103 bin]# zkCli.sh Welcome to ZooKeeper! ..... WatchedEvent state:SyncConnected type:None path:null [zk: localhost:2181(CONNECTED) 0] [zk: localhost:2181(CONNECTED) 0] dfddfdfdffdf //随便敲击命令,zk会输出如下命令提示信息: ZooKeeper -server host:port cmd args connect host:port get path [watch] // 获取数值 ls path [watch] // 查看子集 set path data [version] // 设置数值 rmr path delquota [-n|-b] path quit printwatches on|off create [-s] [-e] path data acl // 创建路径 stat path [watch] close ls2 path [watch] history listquota path setAcl path acl getAcl path sync path redo cmdno addauth scheme auth delete path [version] // 删除路径 setquota -n|-b val path [zk: localhost:2181(CONNECTED) 5] create /myzk myzookeeperdata // 在zk根目录下创建目录myzk 内容为myzookeeperdata Created /myzk [zk: localhost:2181(CONNECTED) 6] ls / [myzk, zookeeper] [zk: localhost:2181(CONNECTED) 8] get /myzk // 获取数据 下面更多的是版本时间信息 myzookeeperdata cZxid = 0x100000002 ctime = Sat Dec 20 20:54:04 PST 2014 mZxid = 0x100000002 mtime = Sat Dec 20 20:54:04 PST 2014 pZxid = 0x100000002 cversion = 0 dataVersion = 0 aclVersion = 0 ephemeralOwner = 0x0 dataLength = 15 numChildren = 0 10.2) 进入sliver103主机,获取get /myzk: zk保证了数值的一致性 [root@sliver103 ~]# cd /usr/local/zk/bin [root@sliver103 bin]# zkCli.sh [zk: localhost:2181(CONNECTED) 0] get /myzk myzookeeperdata cZxid = 0x100000002 ctime = Sat Dec 20 20:54:04 PST 2014 mZxid = 0x100000002 mtime = Sat Dec 20 20:54:04 PST 2014 pZxid = 0x100000002 cversion = 0 dataVersion = 0 aclVersion = 0 ephemeralOwner = 0x0 dataLength = 15