本文说到的TTServer就是 TokyoTyrant+TokyoCabinet ,是一个来自日本的持久化高性能的Key-Value存储,文章对TTserver 的安装启动,监控运维等方案进行了详尽的说明。推荐给使用TTserver的同学一看。
示例数据库目录 /data/ttserver_data
安装ttserver后默认在/usr/local/sbin目录下有ttservctl启动脚本示例,建议copy到具体ttserver数据存放的目录(一个机器可能有多个ttserver服务器,分开便于配置和管理)
cp /usr/local/sbin/ttservctl /data/ttserver_data/ cd /data/ttserver_data
配置启动脚本ttservctl , vim ttservctl;如:
# configuration variables basedir=”/data/ttserver_data” #数据库目录 port=”1978″ #ttserver端口 ulimsiz=”256m” #对单个ulog文件限制,超过将新建一个文件 sid=1 #server id同mysql,不能有重复的 mhost=”remotehost1″ #master的地址 mport=”1978″ #master端口 extfile=”$basedir/ext.lua” #lua扩展脚本文件,默认ttservctl没有这项,如果要使用lua扩展请加上, #并在启动脚本下面的逻辑代码中增加相应判断。 rtsfile=”$basedir/rts” #replication的时间记录文件 dbname=”$basedir/database_name.tch#bnum=bucket数量#xmsiz=最大使用内存”
#数据库名称及优化参数(“#”后面参数,根据需求配置,bnum推荐为记录数0.5-4倍,xmsiz理论上越大性能越好,默认64M,也可以使用默认配置,去掉“#”后面参数即可启动)
启动ttserver服务器:
./ttservctl start
关闭ttserver服务器:
./ttservctl stop
Note:可以放入rc.local中, ttserver启动脚本如果错误会有提示,也可以检查端口是否启用来确定ttserver的启动是否成功
监控命令:
tcrmgr inform -st -port 服务器使用的端口 监控服务地址
监控程序提供数据项包括:内存使用,数据文件大小,读写次数,未命中key数量等,由cacti定时读取实现监控
示例地址:http://…/cacti/graph.php?action=view&rra_id=all&local_graph_id=1050
增加磁盘io监控,iotop (iotop要求linux内核2.6.20以上)
Note:具体阀值可以设定iotop占总量的80%
全量热备份
备份命令为:
tcrmgr copy -port 1978 localhost dpath.tch.xxxxx (其中xxxxx为备份时间)
根据业务需求及数据库运行状态决定备份的频度,全量热备时数据库库会写锁定,读不受影响。全量备份需记录备份时间点以提供replication恢复时所用,时间记录点精确的微妙,可记录到备份文件名中,如backup.tch.1259474040630024。
示例备份脚本:
[ -n "$1" ] || { echo “input port number”; exit; } [ -n "$2" ] || { echo “input backup dir”; exit; } backup_date=`date +%s%N` backup_date=`expr $backup_date / 1000` tcrmgr copy -port ${1} localhost ${2}/backup_${1}.tch.${backup_date} echo “back up finish! ${2}/backup_${1}.tch.${backup_date}”
增量备份ulog
ttserver产生的ulog在”$basedir/ulog”目录,设置了ulimsiz后会按文件尺寸进行切割并按数据升序命名,可以根据备份的频度,按ulog文件最后修改时间,备份到ulog最大命名数字的前一个文件,同时也需记录备份时间,可将时间记录在打包备份的文件名中,如backup_ulog.1259474040630024.tar.gz, 和全量备份一样,精确到微妙。
Note:全量备份速度和服务器情况有关,基本接近直接copy速度
使用replication恢复
根据备份方案中数据库全量备份方法得到的备份库,如backup.tch.xxxxxx ,
echo xxxxxx > “$basedir/rts”
写入备份时间点,即恢复时间点
cp backup.tch.xxxxx database_name.tch
启动:
./ttservctl start
恢复的库会根据时间点去master库同步数据,实现恢复
使用日志增量恢复
先使用前一个全量备份的数据库文件作为基数据库,下线要整理的ttserver。
清空原来的日志,然后解压,再cp 备份的ulog文件 $basedir/ulog/ ,
echo xxxxxx > “$basedir/rts”
写入备份时间点(压缩文件名中包含),即恢复时间点
单独启动ttserver :
ttserver database_name.tch
从日志恢复:
tcrmgr restore -port port -rcc localhost ulog
ctrl+c停掉ttserver,然后使用 ./ttservctl start 启动,master结构重新建立
Note:日志增量恢复环节应避免受其他ttserver的服务器影响,如可以使用一个不使用的端口进行恢复,这样数据也不会影响到其他服务器,恢复后再用原来的启动脚本启动,形成原来的dual master结构。
定期优化,整理数据文件碎片,优化命令:
tcrmgr optimize -port port host
Note:整理时会锁库,读写都锁定
基于dual master的结构具有较高的可靠性,dual master其实就是实时的热备方案,所以在备份频度和广度上是否可以适当宽松一些?建议每天备份全量即可,增量的日志一直留在服务器上,但是日志的分割尺寸要根据业务和恢复的粒度来确定。
PS:文章原出处难以考证,如有知情读者欢迎提供原文地址。