我现在生产使用的Jira是安装在物理机上的,而且是一台将近6年的古董机,Jira承载着我们公司日常的工作流任务交互,所以我必须想办法好好保护它。
目前的容灾方案是通过Linux的crontab每天晚上凌晨将DB中的数据和Jira的文件系统做一次异机备份(由于历史原因,我接手的时候就已经这样了,并非我本意),但是这样一旦发生磁盘损坏等问题会让我最多丢失一天的数据,而且需要重新搭建一次jira,并没有足够的信心。
于是为了将风险降到最低,并且在出现故障时可以迅速恢复,我们本篇来好好研究下如何更好的设计下Jira的容灾问题。因为Jira和Wiki一般都是一起采购使用的,所以这里我把这两个工具一起备份。
要解决容灾,首先要搞清楚工具的工作原理,其数据是由哪几部分组成的,否则如果遗漏了某些文件将会导致整个工具不可用。
应用服务包括原生的服务和已安装插件
基础数据存储在关系型数据库中,包含用户信息、任务信息、空间信息等,mysql迁移可以直接解决这部分问题。
附件以文件方式存储在本地,需要找到相应的目录做压缩拷贝迁移,也是整个备份的重点。
可以通过系统工具全量的导出导入数据,但是恢复时间很长。
可以选择单个空间或项目进行备份和恢复,但公司现在有上百个项目和空间,操作复杂度太高,所以该策略不适合。
所以当初次备份恢复后,以上的1和2都不适用于增量数据的处理,需要寻找其它方式来解决增量数据同步的问题。
/data/atlassian
|
jira (jira app,除开logs都应该备份)
|
confluence (wiki app,除开logs都应该备份)
|
application-data
|
jira
|
dbconfig.xml(数据库配置,需要备份)
|
data (附件和图片,需要重点备份)
|
plugins (已安装的插件,需要备份)
|
monitor (不清楚用途,需要备份)
|
export (jira原生备份机制每日生成的文件,不需要备份,甚至可以删除)
|
import (jira恢复时使用的文件,不需要备份)
|
caches (jira的索引,需要备份)
|
其它(日志或临时文件,不需要备份)
|
confluence
|
confluence.cfg.xml (licence和数据库配置,需要备份)
|
plugins-* (插件相关,需要备份)
|
attachments (wiki的附件,需要重点备份)
|
index (wiki的索引,需要备份)
|
viewfile(查看文件宏,展现用的,需要备份)
|
其它(日志或临时文件,不需要备份;有几个拿不准的目录,需要备份)
文件大小:
jira和confluence一样做为工具类竟然有37G的大小明显有问题,对它进行瘦身:
所以备份前可以将这些历史日志清理掉,节省很大的磁盘空间,并可以提高同步效率。
Jira还有个日备份数据也需要清理:
所以清理完以后我需要维护的数据从180G下降到100G左右!几乎降低了一半!
总体原则:保持备机目录结构和数据库结构不变,通过rsync和数据库同步方式做热备。
1 mysql相对于其他模块是独立的,可以先行
2 转移jira数据内容之前,先把历史log和备份文件清除,特别是export中每日备份数据,文件又多又大,已经没有保留的意义
3 转移wiki的数据内容之前,只需要把log清除,然后全量压缩复制过去
4 在备机恢复做验证时,主机需要阻断从备机过来的请求,避免移植过程中配置项有依赖。
/etc/rsyncd.conf中添加
[atlassian_backup]
path=/data/atlassian
comment=atlassian rsync
#ignore errors
read only=yes
list =yes
uid=root
gid=root
secrets file=/etc/rsync/atlassian.scrt
auth users = jingtao
vi /etc/rsync/atlassian.scrt
jingtao:******
chmod 600 /etc/rsync/atlassian.scrt
vi /etc/jira_rsyncd.pass
******
chmod 600 /etc/jira_rsyncd.pass
/usr/bin/rsync -avPz --ignore-errors --delete --contimeout=30 --timeout=3600 --password-file=/etc/jira_rsyncd.pass [email protected]::atlassian_backup /data/atlassian/
crontab -e
0 */1 * * * nohup /usr/bin/rsync -avPz --exclude=jira/logs --ignore-errors --delete --contimeout=30 --timeout=3600 --password-file=/etc/jira_rsyncd.pass [email protected]::atlassian_backup /data/atlassian/ &
wq
service crond restart
这样每小时备机就会从主机把文件同步一次,也就是说我们最多只会丢失一小时的文件数据。
/data/atlassian/jira/bin/start-jira.sh 启动jira
/data/atlassian/jira/bin/stop-jira.sh 关闭jira
/data/atlassian/confluence/bin/start-confluence.sh 启动wiki
/data/atlassian/confluence/bin/stop-confluence.sh 关闭wiki
grep 8080 /data/atlassian/jira/conf/server.xml jira的tomcat端口
grep 8005 /data/atlassian/jira/conf/server.xml jira程序端口
grep 8090 /data/atlassian/confluence/conf/server.xml wiki的tomcat端口
grep 8000 /data/atlassian/confluence/conf/server.xml wiki程序端口
/data/atlassian/application-data/jira/dbconfig.xml jira的DB配置
/data/atlassian/application-data/confluence/confluence.cfg.xml wiki的DB配置
注意:在验证备机的时候需要注意一个问题,我自己也遇到了。如果你买的license不是cluster类型的,同一时间内只能由一个进程,也就是说你必须把主机的Jira和Wiki停掉,才能验证备机,否则备机会报license的错。