Reaper是什么
Reaper是专门用于执行Cassandra数据修复操作的可视化工具。
当然,除了核心功能外,也提供了其他一些功能,例如,快照管理,集群基本信息、状态等。
Cassandra为什么需要修复
如果集群中某一个节点A关闭或无法访问,该节点不能被写入。当节点A恢复后,其他节点会通知A错过了哪些数据,并修复。但这并不能保证100%通知到。这些不一致日积月累可能会导致数据丢失。
要解决这个问题,就需要经常修复节点数据。
修复大体分两类:增量修复,全量修复。默认使用nodetool repair
是增量修复,如需全量修复,使用nodetool repair --full
。
按照官方给出的最佳实践建议,1到3天进行一次增量修复,1到3周进行一次全量修复。当然,这要看具体的数据情况。
为什么要用Reaper
使用nodetool repair
修复几次,就会知道实在是痛苦,尤其是集群节点多了之后,所有节点都要去手动维护不说,修复的进度还看不到,数据量大了之后,修复一个节点动辄十几个小时,只能不断的去刷日志。
所以,就需要一个管理修复任务的可视化的工具。
Reaper安装
Reaper核心是一个jar包,可以直接运行jar包,也可以安装为Linux系统服务。这里介绍安装为系统服务,其他的安装方式可参考 Reaper官网。
- 下载安装包:
https://bintray.com/thelastpickle/reaper-rpm/cassandra-reaper/1.4.4
请自行fq下载。如有困难,考虑源码编译jar包安装的方式。
- 安装rpm
rpm -ivh reaper-*.*.*.x86_64.rpm
- 启动服务
service cassandra-reaper start
- 停止服务
service cassandra-reaper stop
如果启动失败,提示 java not found,原因是没有安装jdk环境,或者环境变量配置有问题。
查看启动脚本可以知道,执行的是sudo -u "$user" $dir/$cmd >> "$stdout_log" 2>> "$stderr_log" &
,$user
是 reaper,所以要确保 sudo -u reaper java -version
能正常输出。
一般使用安装包方式安装的jdk没问题,绿色安装的jdk可能有问题,在/usr/bin下建个java的软连接即可:
ln -s /jdk_home/bin/java /usr/bin/java
5.登录
http://ip:8080/webui/
默认用户名/密码: admin/admin。
Reaper配置
- 修改用户名密码
which cassandra-reaper
找到服务启动脚本:/usr/local/bin/cassandra-reaper
cat /usr/local/bin/cassandra-reaper
查看脚本内容,找到jar包位置:
...
CLASS_PATH="/usr/share/cassandra-reaper/*:/usr/local/share/cassandra-reaper/*"
...
找到jar包在/usr/share/cassandra-reaper/目录下。下面进行修改:
cd /usr/share/cassandra-reaper/
vim cassandra-reaper-1.4.4.jar
/shiro.ini
找到users设置:
# default authentication is the following hardcoded admin user
[users]
admin = admin
- 修改Reaper数据存储方案
Reaper有自己的元信息需要存储,默认存储方式是内存,重启服务后之前的设置就都丢失了,所以改成持久化存储方案。
一共支持4种:
- memory
- H2
- Postgres
- Cassandra
我们选用Cassandra。
修改配置文件:
vim /etc/cassandra-reaper/cassandra-reaper.yaml
找到
storageType: memory
改为:
storageType: cassandra
cassandra:
clusterName: "集群名"
contactPoints: ["节点1", "节点2", ...]
keyspace: reaper_db
queryOptions:
consistencyLevel: LOCAL_QUORUM
serialConsistencyLevel: SERIAL
然后,需要在Cassandra中创建名为reaper_db的key space
CREATE KEYSPACE reaper_db WITH replication = {'class': 'NetworkTopologyStrategy', 'datacenter1': '3'}
- 修改datacenterAvailability
vim /etc/cassandra-reaper/cassandra-reaper.yaml
datacenterAvailability值改为LOCAL:
datacenterAvailability: LOCAL
此配置项根据具体使用场景设置。因为只有一个DC,所以设置为LOCAL。具体说明请参考Reaper的使用文档。
- 修改Cassandra配置,允许远程JMX管理
Reaper依赖于JMX来管理节点,需要Cassandra所有节点开启JMX远程操控权限。
默认Cassandra的JMX是只能本地模式,也就在A节点通过nodetool -h hostname
操控只能其他节点是不行的。
修改JMX配置
cd cassandra_home
vim conf/cassandra-env.sh
修改JMX相关的配置
...
LOCAL_JMX=no
...
JVM_OPTS="$JVM_OPTS -Dcom.sun.management.jmxremote.authenticate=false"
这里禁用掉JMX的用户授权功能。
- 重启Cassandra集群;重启Cassandra Repair服务即可。
Repair使用
-
添加集群
在Clusters页面输入集群中任意一个seed节点,点击“add cluster”按钮即可。
添加完成后,可以看到集群的基础信息。点击某个节点,可以查看该节点的详细信息。
-
修复数据
在Repairs页面可以创建一个修复任务,选择集群、Keyspace,Owner和Cause随意填写。
如果需要更多设置,可以展开Advanced Settings进行设置。可以设置修复的节点、表名、数据中心、修复方式(增量或全量)等。设置完成后点击Repair按钮即可。
创建成功后的修复任务会出现在下边的Running列表里,点击对应的任务的Acitve按钮即可开始执行。
Running列表里可以看到修复的进度。
-
定时修复
在Schedules页面可以创建定时任务,自动触发修复任务,设置的方式与Repair页面类似。
-
快照管理
这个页面可以很方便管理集群的快照。
参考:
Cassandra repair 命令使用文档(含最佳实践)
Cassandra Reaper 使用文档
JMX 文档