从零开始学Hadoop大数据分析之ZooKeeper初识

导言

前面三天连续学习了hadoop环境配置,以及hdfs实践,这都是hadoop大数据的起步。为了搭建高可用的hdfs接下来就需要ZooKeeper出场。

ZooKeeper环境配置

zookeeper简介

zookeeper是为了实现hdfs高可用,提供了在分布式系统中统一命名服务,配置管理以及分布锁的基础,在zookeeper中提供了Leader,Follower,Observer三个角色,客户端与服务器会话是采用的TCP长连接的方式。在Zookeeper的数据节点表示为Znode,对应着Stat的数据结构。
Stat:version,cversion,aversion
ZooKeeper中权限控制系统采用的是ACL策略:


从零开始学Hadoop大数据分析之ZooKeeper初识_第1张图片
ACL策略.png
解压安装包

首先将ZooKeeper安装包解压到对应目录,我这里采用的是zookeeper-3.4.6.tar.gz,命令如下:

tar -zxvf zookeeper-3.4.6.tar.gz

配置环境变量:
PATH=$PATH:$HOME/bin
export JAVA_HOME=/usr/java/jdk1.7.0_79
export HADOOP_HOME=/opt/hadoop-2.7.0
export ZOOKEEPER_HOME=/opt/zookeeper-3.4.6
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin
export PATH

设置完成后别忘了使用source .bash_prifile命令让环境变量立即生效。

配置zoo.cfg文件
tickTime=2000
initLimit=10
syncLimit=5
dataDir=/opt/zookeeper-3.4.6/data
clientPort=2181
server.1=192.168.0.110
server.2=192.168.0.111
server.3=192.168.0.112

最后还需要再/opt/zookeeper-3.4.6/data目录下依次创建server.1,server.2,server.3对应节点的myid,在myid中写入1,2,3对应节点标识即可。

ZooKeeper命令

启动服务

./zkServer.sh start

查看服务状态

./zkServer.sh status

停止服务

./zkServer.sh stop

重启服务

./zkServer.sh restart

客户端操作

连接ZooKeeper

./zkCli.sh -server node1:2181

连接服务器

connect node1:2181

你可能感兴趣的:(从零开始学Hadoop大数据分析之ZooKeeper初识)