查看PDF

转载请注明:@ni掌柜 [email protected]

     在公司内部,有不少应用已经强依赖zookeeper,zookeeper的工作状态直接影响它们的正常工作。目前开源世界中暂没有一个比较成熟的zookeeper-monitor, 于是开始zookeeper监控这块工作。

     目前zookeeper-monitor能做哪些事情,讲到这个,首先来看看哪些因素对zookeeper正常工作比较大的影响:
1. 用于zookeeper写日志的目录要有足够大小,并且强烈建议在单独的磁盘(挂载点)上,这是影响ZK性能最大因素之一。
2. 连接数。
3. 注册的Watcher数。
4. ZNode是否可读,可写。
5. ZK事件通知的延时是否过大。
围绕以上几点展开,完成了taokeeper一期的开发,目前主要完成以下方面的监控:(项目地址:https://github.com/taobao/taokeeper)
1. CPU/MEM/LOAD的监控
2. ZK日志目录所在磁盘剩余空间监控
3. 单机连接数的峰值报警
4. 单机 Watcher数的峰值报警
5. 节点自检:是指对集群中每个IP所在ZK节点上的PATH: /YINSHI.MONITOR.ALIVE.CHECK 定期进行三次如下流程 : 节点连接 – 数据发布 – 修改通知 – 获取数据 – 数据对比, 在指定的延时内,三次流程均成功视为该节点处于正常状态。
 
ZooKeeper集群实时状态 

【ZooKeeper Notes 10】ZooKeepr监控_第1张图片

 
 点击查看按钮可以查看当前服务器上所有订阅者的详细信息:

【ZooKeeper Notes 10】ZooKeepr监控_第2张图片

ZooKeeper监控报警设置

【ZooKeeper Notes 10】ZooKeepr监控_第3张图片

ZooKeeper集群状态趋势图

【ZooKeeper Notes 10】ZooKeepr监控_第4张图片

 

如何安装部署 

首先,对之前使用 maven-war-plugin 来进行配置管理的方式,表示遗憾。不少开发人员反馈部署比较困难,另外还有一些对maven不熟悉的开发人员也是这样认为。现在有了改进,将配置与程序分离开来。对此给大家带来的不便,深表歉意。

 一、直接部署
1. 下载 taokeeper.sql,初始化数据库(Mysql).
2. 下载 taokeeper-monitor.tar.gz文件,解压到tomcat的webapps目前下,确保最后目录结构如下:  %TOMCAT_HOME%\webapps\taokeeper-monitor\WEB-INF
3. 下载 taokeeper-monitor-config.properties 文件,存放到一个指定目录,比如
/home/xiaoming/taokeeper-monitor/config/taokeeper-monitor-config.properties, 其中内容如下,根据需要自己修改下。
 
   
   
   
   
  1. systemInfo.envName=TEST 
  2. #DBCP 
  3. dbcp.driverClassName=com.mysql.jdbc.Driver 
  4. dbcp.dbJDBCUrl=jdbc:mysql://1.1.1.1:3306/taokeeper 
  5. dbcp.characterEncoding=GBK 
  6. dbcp.username=xiaoming 
  7. dbcp.password=123456 
  8. dbcp.maxActive=30 
  9. dbcp.maxIdle=10 
  10. dbcp.maxWait=10000 
  11. #SystemConstant 
  12. SystemConstent.dataStoreBasePath=/home/xiaoming/taokeeper-monitor/ZookeeperStore 
  13. #SSH account of zk server 
  14. SystemConstant.userNameOfSSH=xiaoming 
  15. SystemConstant.passwordOfSSH=123456 
4. 在tomcat启动脚本中添加JAVA_OPTS:
windows上:set JAVA_OPTS=-DconfigFilePath="D:\server\tomcat\webapps\taokeeper-monitor-config.properties"
linux上:JAVA_OPTS=-DconfigFilePath="/home/xiaoming/taokeeper-monitor/config/taokeeper-monitor-config.properties"
5. 启动tomcat服务器
6. 正常启动后,访问:http://127.0.0.1:8080/taokeeper-monitor
 
二、从源代码开始
1. Check out 源代码:[email protected]:nileader/taokeeper.git
2. 修改代码…
3. 实现 com.taobao.taokeeper.reporter.alarm.MessageSender 接口,用于发送报警信息。(可选)
4. 到taokeeper根目录下执行 package.cmd 命令,打成一个war包,之后进行部署
 
  如何使用
 1. taokeeper-monitor启动后,还没有配置任何zookeeper集群,点击“加入监控”进行集群添加。

【ZooKeeper Notes 10】ZooKeepr监控_第5张图片

2. 配置zookeeper集群信息

【ZooKeeper Notes 10】ZooKeepr监控_第6张图片