如果使用Maven,在“pom.xml”文件中增加如下内容,引入对Java版驱动程序库的依赖。
<dependency>
<groupId>org.apache.zookeeper</groupId>
<artifactId>zookeeper</artifactId>
<version>3.4.8</version>
</dependency>
关于“会话”的一些困惑解答参见《ZooKeeper中“会话”的那些事儿》。
在Java版驱动程序库中,表示“会话”的类是org.apache.zookeeper.ZooKeeper
,创建会话和结束会话的代码片段如下。
注意在创建一个ZooKeeper Session的过程中,会创建一个Daemon线程,该线程负责维护该ZooKeeper Session。
package org.apache.zookeeper.book;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.ZooKeeper;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.io.IOException;
/** * Session实现Watcher的目的是为了让回调方法能够访问Session中的状态变量 */
public class Session implements Watcher {
private static final Logger logger = LoggerFactory.getLogger(Session.class);
/** * ZooKeeper集群的端口号和地址列表 */
private static final String hostPort = "127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183";
/** * ZooKeeper Server判定会话超期的时间间隔 */
private static final Integer sessionTimeout = 60000;
/** * ZooKeeper Session对象 */
private ZooKeeper zk;
/** * ZooKeeper Session是否连接状态 */
private volatile boolean connected = false;
/** * ZooKeeper Session是否过期状态 */
private volatile boolean expired = false;
public Session() {}
/** * 由单独的回调线程负责调用 * * @param watchedEvent */
@Override
public void process(WatchedEvent watchedEvent) {
if (watchedEvent.getType() == Event.EventType.None) {
if (watchedEvent.getState() == Event.KeeperState.SyncConnected) {
logger.info("session is created");
connected = true;
} else if (watchedEvent.getState() == Event.KeeperState.Disconnected) {
logger.info("session is disconnected");
connected = false;
} else if (watchedEvent.getState() == Event.KeeperState.Expired) {
logger.info("session expired");
expired = true;
connected = false;
}
}
}
/** * 创建一个ZooKeeper Session * * @throws IOException */
public void start() throws IOException {
// 创建一个“Session”实例
// hostPort:表示该“Session”实例关联的ZooKeeper集群的端口号和地址列表
// sessionTimeout:表示该“Session”实例的过期时间。具体含义是,该“Session”实例关联到的ZooKeeper
// Server在“sessionTimeout”时间内没有收到该“Session”实例关联到的ZooKeeper
// Client的数据,该“Session”实例关联到的ZooKeeper Server则认为该“Session”实例过期
// watcher:在该“Session”实例上设置的监视器,可以监听该“Session”实例上发生的事件
zk = new ZooKeeper(hostPort, sessionTimeout, this);
// 以上只是发出创建“Session”命令,“Session”完全建立需要一点时间
while (!isConnected()) {
try {
Thread.sleep(100);
} catch (Exception e) {
logger.error("", e);
}
}
}
/** * 结束“Session”实例 * * @throws InterruptedException */
public void stop() throws InterruptedException {
zk.close();
}
public boolean isConnected() {
return connected;
}
public void setConnected(boolean connected) {
this.connected = connected;
}
public boolean isExpired() {
return expired;
}
public void setExpired(boolean expired) {
this.expired = expired;
}
public ZooKeeper getZk() {
return zk;
}
public static void main(String[] args) throws IOException {
Session session = new Session();
session.start();
}
}
监视器的基础接口是org.apache.zookeeper.Watcher
,“二、会话”中的代码不仅介绍了“会话”实例,也介绍了“监视器”实例。
运行以上代码的结果部分截图如图1所示,这表明“会话”实例创建后,发生了一个事件,监视器实例监听到了这个事件,并在public void process(WatchedEvent watchedEvent)
方法中将其内容打印了出来。
图1
使用“Java版驱动程序库提供的API”编写应用程序有以下几点注意事项:
1、接口一般分为同步接口和异步接口,采用异步接口,编码比较简单
2、需要特殊处理ConnectionLossException
异常,因为它不像NodeExistsException
,NoNodeException
等异常,对应的是确定的系统状态。在异步结果返回中,这些异常相对应的结果码分别为CONNECTIONLOSS
,NODEEXISTS
和NONODE
实现Master程序,有以下几点注意事项:
1、整个分布式应用程序中只有1个Master进程,利用ZooKeeper提供的服务,可以设定成功创建“/master”Znode节点的进程作为Master进程
2、整个分布式应用程序虽然只有一个Master进程,但还是需要多个候选Master进程,这样才能在原Master进程不能正常工作情况下,选举新的Master进程
3、原Master进程不能正常工作之时,对应的“/master”Znode节点应该自动删除,因此Znode节点的类型应为“Ephemeral ”,这样才能让候选Master进程能够被选举成为新的Master进程
方法签名如下:
void create(String path,byte[] data,List<ACL> acl,CreateMode createMode,AsyncCallback.StringCallback cb,Object ctx)
方法签名含义介绍如下:
“path”:欲创建Znode节点的路径
“data”:欲创建Znode节点的内容
“acl”:欲创建Znode节点的访问权限控制设置,一般取为“Ids.OPEN_ACL_UNSAFE”
“createMode”:欲创建Znode节点的类型,有“Persistent,Ephemeral,Sequential”
“cb”:表示包含回调方法的回调实例
“ctx”:传递给回调方法的对象,可作为本方法与回调方法的通信数据对象
AsyncCallback.StringCallback类定义如下:
public interface StringCallback extends AsyncCallback {
void processResult(int rc, String path, Object ctx, String name);
}
“processResult”方法签名含义介绍如下:
“rc”:返回结果代码
“path”:调用“create”方法时,提供的Znode节点路径
“ctx”:调用“create”方法时,提供的“Object ctx”
“name”:欲创建Znode节点的名字,一般跟“path”一致,但是当欲创建Znode节点类型为“Sequential”时,就不一致了
方法签名如下:
public void getData(String path, boolean watch, AsyncCallback.DataCallback cb, Object ctx)
方法签名含义介绍如下:
“path”:欲读取数据的Znode节点路径
“watch”:是否设置监视器,如果是“true”,那么使用的监视器就是在“ZooKeeper Session”上设置的监视器
“cb”:表示包含回调方法的回调实例
“ctx”:传递给回调方法的对象,可作为本方法与回调方法的通信数据对象
AsyncCallback.DataCallback类定义如下:
public interface DataCallback extends AsyncCallback {
void processResult(int rc, String path, Object ctx, byte[] data, Stat stat);
}
“processResult”方法签名含义介绍如下:
“rc”:返回结果代码
“path”:调用“getData”方法时,提供的Znode节点路径
“ctx”:调用“getData”方法时,提供的“Object ctx”
“data”:返回的Znode节点的内容,以字节数组形式表示
“stat”:使用Znode节点的元数据进行填充的对象
package org.apache.zookeeper.book;
import java.io.IOException;
import java.util.Random;
import org.apache.zookeeper.AsyncCallback.DataCallback;
import org.apache.zookeeper.AsyncCallback.StatCallback;
import org.apache.zookeeper.AsyncCallback.StringCallback;
import org.apache.zookeeper.CreateMode;
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.Watcher.Event.EventType;
import org.apache.zookeeper.ZooDefs.Ids;
import org.apache.zookeeper.KeeperException.Code;
import org.apache.zookeeper.data.Stat;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
/** * Master程序 */
public class Master {
private static final Logger logger = LoggerFactory.getLogger(Master.class);
/** * 需要的“Session”对象 */
private Session session;
/** * Master进程状态 */
private volatile MasterStates state = MasterStates.RUNNING;
private Random random = new Random(this.hashCode());
/** * 作为Znode节点内容 */
private String serverId = Integer.toHexString(random.nextInt());
public Master(Session session) {
this.session = session;
}
/** * 创建“Session” * * @throws IOException */
void startZK() throws IOException {
session.start();
}
/** * 尝试申请作为Master进程 */
synchronized public void runForMaster() {
logger.info("Running for master");
session.getZk().create("/master", serverId.getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL,
masterCreateCallback, null);
}
/** * 申请创建"/master"Znode节点回调类实例 */
StringCallback masterCreateCallback = new StringCallback() {
public void processResult(int rc, String path, Object ctx, String name) {
switch (Code.get(rc)) {
case CONNECTIONLOSS:
checkMaster();
break;
case OK:
state = MasterStates.ELECTED;
// 其他处理,由于这里只是作为示例,因而不列出这个复杂的“其他处理”
// takeLeadership();
break;
case NODEEXISTS:
state = MasterStates.NOTELECTED;
masterExists();
break;
default:
state = MasterStates.NOTELECTED;
logger.error("Something went wrong when running for master.",
KeeperException.create(Code.get(rc), path));
}
logger.info("I'm " + (state == MasterStates.ELECTED ? "" : "not ") + "the leader " + serverId);
}
};
/** * 查看"/master"Znode是否真的存在 */
void checkMaster() {
session.getZk().getData("/master", false, masterCheckCallback, null);
}
/** * 查看"/master"Znode是否真的存在的回调实例:<br/> * 1、如果连接中断,那么循环查看<br/> * 2、如果不存在"/master"Znode节点,那么本进程申请成为Master进程<br/> * 3、如果成功查询,那么判断是否是本进程<br/> */
DataCallback masterCheckCallback = new DataCallback() {
public void processResult(int rc, String path, Object ctx, byte[] data, Stat stat) {
switch (Code.get(rc)) {
case CONNECTIONLOSS:
checkMaster();
break;
case NONODE:
runForMaster();
break;
case OK:
if (serverId.equals(new String(data))) {
state = MasterStates.ELECTED;
// 其他处理,由于这里只是作为示例,因而不列出这个复杂的“其他处理”
// takeLeadership();
} else {
state = MasterStates.NOTELECTED;
masterExists();
}
break;
default:
logger.error("Error when reading data.", KeeperException.create(Code.get(rc), path));
}
}
};
/** * 确认“/master”Znode节点是否真的存在 */
void masterExists() {
session.getZk().exists("/master", masterExistsWatcher, masterExistsCallback, null);
}
StatCallback masterExistsCallback = new StatCallback() {
public void processResult(int rc, String path, Object ctx, Stat stat) {
switch (Code.get(rc)) {
case CONNECTIONLOSS:
masterExists();
break;
case OK:
// 的确真的存在,不可能是自身进程,因为对于同一个候选Master进程,只会启动一次
break;
case NONODE:
state = MasterStates.RUNNING;
// 已经不存在
runForMaster();
logger.info("It sounds like the previous master is gone, " + "so let's run for master again.");
break;
default:
checkMaster();
break;
}
}
};
/** * 一举两得,正好测试是否master进程挂掉了 */
Watcher masterExistsWatcher = new Watcher() {
public void process(WatchedEvent e) {
if (e.getType() == EventType.NodeDeleted) {
runForMaster();
}
}
};
MasterStates getState() {
return state;
}
/** * 关闭“Session” * * @throws InterruptedException * @throws IOException */
void stopZK() throws InterruptedException {
session.stop();
}
public static void main(String args[]) throws Exception {
Master m = new Master(new Session());
m.startZK();
m.runForMaster();
Thread.sleep(10000);
m.stopZK();
}
}
enum MasterStates {
RUNNING, ELECTED, NOTELECTED
};
package org.apache.zookeeper.book;
import java.io.IOException;
import java.util.Random;
import org.apache.zookeeper.AsyncCallback.StringCallback;
import org.apache.zookeeper.CreateMode;
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.ZooDefs.Ids;
import org.apache.zookeeper.KeeperException.Code;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
public class Worker {
private static final Logger logger = LoggerFactory.getLogger(Worker.class);
/** * 需要的“Session”对象 */
private Session session;
/** * Znode节点路径的一部分 */
private String serverId = Integer.toHexString((new Random()).nextInt());
public Worker(Session session) {
this.session = session;
}
public void startZK() throws IOException {
this.session.start();
}
/** * 注册一个“Worker” */
public void register() {
String name = "worker-" + serverId;
this.session.getZk().create("/workers/" + name, "Idle".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL,
createWorkerCallback, null);
}
StringCallback createWorkerCallback = new StringCallback() {
public void processResult(int rc, String path, Object ctx, String name) {
switch (Code.get(rc)) {
case CONNECTIONLOSS:
register();
break;
case OK:
logger.info("Registered successfully: " + serverId);
break;
case NODEEXISTS:
logger.warn("Already registered: " + serverId);
break;
default:
logger.error("Something went wrong: ", KeeperException.create(Code.get(rc), path));
}
}
};
public void close() throws IOException {
logger.info("Closing");
try {
this.session.stop();
} catch (InterruptedException e) {
logger.warn("ZooKeeper interrupted while closing");
}
}
public static void main(String args[]) throws Exception {
Worker w = new Worker(new Session());
w.startZK();
w.register();
Thread.sleep(1000);
}
}
以下代码片段,在Worker程序中用于更改状态。
String status;
String name;
AsyncCallback.StatCallback statusUpdateCallback = new AsyncCallback.StatCallback() {
public void processResult(int rc, String path, Object ctx, Stat stat) {
switch (KeeperException.Code.get(rc)) {
case CONNECTIONLOSS:
updateStatus((String) ctx);
return;
}
}
};
synchronized private void updateStatus(String status) {
if (status.equals(this.status)) {
this.session.getZk().setData("/workers/" + name, status.getBytes(), -1, statusUpdateCallback, status);
}
}
public void setStatus(String status) {
this.status = status;
updateStatus(status);
}
对于以上代码片段,有两点需要特别注意。
1、status.equals(this.status)
逻辑
出现以上逻辑主要是为了应对以下情形:主线程调用“setStatus”方法欲将状态设为“A”,由于ConnectionLossException
异常未成功,执行回调方法的线程等待执行“updateStatus”方法;在这过程中,主线程又调用“setStatus”方法欲将状态设为“B”;此时,执行回调方法的线程执行“updateStatus”方法,欲将状态设为“A”。最后的状态本应为“B”,现为“A”,以上逻辑可以避免这种情况
2、updateStatus
方法的synchronized
关键词
分析可知,执行回调方法的线程和主线程都会尝试执行“updateStatus”方法,如果“updateStatus”方法中只是简单的“setData”方法,那么不会产生并发问题,而现在有status.equals(this.status)
逻辑,需要通过使用synchronized
关键词来达到线程安全的目的
需要注意的是,主线程调用异步方法后立即返回,它其实只是发出了一个命令,另外会开启一个线程将发出请求的请求数据传输给“ZooKeeper Server”,对于回调方法也会由独立的线程进行执行。而且,为了保证顺序,只会有一个专门的线程用于执行回调方法,并不是每个回调方法的执行都独立开启一个线程。
参考文献:
[1]https://github.com/fpj/zookeeper-book-example/tree/master/src/main/java/org/apache/zookeeper/book
[2]https://github.com/dslztx/zookeeper-book-example