Cassandra运维工具-Reaper安装与使用

Reaper是什么

Reaper是专门用于执行Cassandra数据修复操作的可视化工具。

当然,除了核心功能外,也提供了其他一些功能,例如,快照管理,集群基本信息、状态等。

Cassandra为什么需要修复

如果集群中某一个节点A关闭或无法访问,该节点不能被写入。当节点A恢复后,其他节点会通知A错过了哪些数据,并修复。但这并不能保证100%通知到。这些不一致日积月累可能会导致数据丢失。

要解决这个问题,就需要经常修复节点数据。

修复大体分两类:增量修复,全量修复。默认使用nodetool repair是增量修复,如需全量修复,使用nodetool repair --full

按照官方给出的最佳实践建议,1到3天进行一次增量修复,1到3周进行一次全量修复。当然,这要看具体的数据情况。

为什么要用Reaper

使用nodetool repair修复几次,就会知道实在是痛苦,尤其是集群节点多了之后,所有节点都要去手动维护不说,修复的进度还看不到,数据量大了之后,修复一个节点动辄十几个小时,只能不断的去刷日志。

所以,就需要一个管理修复任务的可视化的工具。

Reaper安装

Reaper核心是一个jar包,可以直接运行jar包,也可以安装为Linux系统服务。这里介绍安装为系统服务,其他的安装方式可参考 Reaper官网。

  1. 下载安装包:
https://bintray.com/thelastpickle/reaper-rpm/cassandra-reaper/1.4.4

请自行fq下载。如有困难,考虑源码编译jar包安装的方式。

  1. 安装rpm
rpm -ivh reaper-*.*.*.x86_64.rpm
  1. 启动服务
service cassandra-reaper start 
  1. 停止服务
service cassandra-reaper stop

如果启动失败,提示 java not found,原因是没有安装jdk环境,或者环境变量配置有问题。

查看启动脚本可以知道,执行的是sudo -u "$user" $dir/$cmd >> "$stdout_log" 2>> "$stderr_log" &$user 是 reaper,所以要确保 sudo -u reaper java -version 能正常输出。

一般使用安装包方式安装的jdk没问题,绿色安装的jdk可能有问题,在/usr/bin下建个java的软连接即可:

ln -s /jdk_home/bin/java /usr/bin/java

5.登录

http://ip:8080/webui/
image.png

默认用户名/密码: admin/admin。

Reaper配置

  1. 修改用户名密码
which cassandra-reaper

找到服务启动脚本:/usr/local/bin/cassandra-reaper

cat /usr/local/bin/cassandra-reaper

查看脚本内容,找到jar包位置:

...
CLASS_PATH="/usr/share/cassandra-reaper/*:/usr/local/share/cassandra-reaper/*"
...

找到jar包在/usr/share/cassandra-reaper/目录下。下面进行修改:

cd /usr/share/cassandra-reaper/
vim cassandra-reaper-1.4.4.jar
/shiro.ini

找到users设置:

# default authentication is the following hardcoded admin user
[users]
admin = admin
  1. 修改Reaper数据存储方案
    Reaper有自己的元信息需要存储,默认存储方式是内存,重启服务后之前的设置就都丢失了,所以改成持久化存储方案。

一共支持4种:

  • memory
  • H2
  • Postgres
  • Cassandra

我们选用Cassandra。

修改配置文件:

vim /etc/cassandra-reaper/cassandra-reaper.yaml

找到

storageType: memory

改为:

storageType: cassandra
cassandra:
  clusterName: "集群名"
  contactPoints: ["节点1", "节点2", ...]
  keyspace: reaper_db
  queryOptions:
    consistencyLevel: LOCAL_QUORUM
    serialConsistencyLevel: SERIAL

然后,需要在Cassandra中创建名为reaper_db的key space

CREATE KEYSPACE reaper_db WITH replication = {'class': 'NetworkTopologyStrategy', 'datacenter1': '3'}
  1. 修改datacenterAvailability
vim /etc/cassandra-reaper/cassandra-reaper.yaml

datacenterAvailability值改为LOCAL:

datacenterAvailability: LOCAL

此配置项根据具体使用场景设置。因为只有一个DC,所以设置为LOCAL。具体说明请参考Reaper的使用文档。

  1. 修改Cassandra配置,允许远程JMX管理

Reaper依赖于JMX来管理节点,需要Cassandra所有节点开启JMX远程操控权限。
默认Cassandra的JMX是只能本地模式,也就在A节点通过nodetool -h hostname操控只能其他节点是不行的。

修改JMX配置

cd cassandra_home
vim conf/cassandra-env.sh

修改JMX相关的配置

...
LOCAL_JMX=no
...
JVM_OPTS="$JVM_OPTS -Dcom.sun.management.jmxremote.authenticate=false"

这里禁用掉JMX的用户授权功能。

  1. 重启Cassandra集群;重启Cassandra Repair服务即可。

Repair使用

  1. 添加集群


    Clusters页面

在Clusters页面输入集群中任意一个seed节点,点击“add cluster”按钮即可。
添加完成后,可以看到集群的基础信息。点击某个节点,可以查看该节点的详细信息。

  1. 修复数据


    Repairs页面

在Repairs页面可以创建一个修复任务,选择集群、Keyspace,Owner和Cause随意填写。
如果需要更多设置,可以展开Advanced Settings进行设置。可以设置修复的节点、表名、数据中心、修复方式(增量或全量)等。设置完成后点击Repair按钮即可。
创建成功后的修复任务会出现在下边的Running列表里,点击对应的任务的Acitve按钮即可开始执行。
Running列表里可以看到修复的进度。

  1. 定时修复


    Schedules页面

在Schedules页面可以创建定时任务,自动触发修复任务,设置的方式与Repair页面类似。

  1. 快照管理


    Snapshots页面

这个页面可以很方便管理集群的快照。

参考:

Cassandra repair 命令使用文档(含最佳实践)
Cassandra Reaper 使用文档
JMX 文档

你可能感兴趣的:(Cassandra运维工具-Reaper安装与使用)