rsync+inotify实现数据实时备份
一、rsync简介
rsync是类unix系统下的数据镜像备份工具——remote sync。与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份、本地复制,远程同步等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了!
二、inotify简介
Inotify 是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在之前章节中,我们讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync同步,这样刚好解决了同步数据的实时性问题。
三、实时同步和定期同步的优缺点
定期同步的优点:可定时备份,节约CPU资源和带宽资源,
定期同步的不足:执行备份的时间固定,延期明显,实时性差,当同步源长期不变化时,密集的定期任务是不必要的
实时同步的优点:一旦同步源出现变化,立即启动备份;只要同步源无变化,则不执行备份。
实时同步的不足:服务器压力较大时,执行实时备份会增加服务器负载。
四、先使用rsync实现服务器数据备份
1、安装前的准备工作
主机名 |
主机IP地址 |
系统版本 |
系统内核版本 |
数据服务器server |
192.168.115.120 |
CentOS 7.x |
3.10.0-514.el7.x86_64 |
备份服务器backup |
192.168.115.130 |
CentOS 7.x |
3.10.0-514.el7.x86_64 |
(1)两台服务器都关闭防火墙和selinux
[root@backup ~]# systemctl stop firewalld
[root@backup ~]# systemctl disable firewalld
[root@backup ~]# sed -i "7s/enforcing/disabled/" /etc/selinux/config
[root@backup ~]# setenforce 0
(2)配置数据服务器IP地址为192.168.115.120,备份服务器IP为192.168.115.130
2、在备份服务器安装rsync,并创建用户及模块目录并更改其用户组
[root@backup ~]# yum -y install rsync 数据服务器
[root@backup ~]# useradd rsync -s /sbin/nologin -M
[root@backup ~]# grep rsync /etc/passwd
rsync:x:1000:1000::/home/rsync:/sbin/nologin
[root@backup ~]# mkdir /backup 创建rsync daemon工作模式的模块目录
[root@backup ~]# chown rsync.rsync /backup/ 更改模块目录的用户组
[root@backup ~]# ll -d /backup/
drwxr-xr-x 2 rsync rsync 6 3月 4 13:57 /backup/
3、修改rsync daemon配置文件/etc/rsyncd.conf
[root@backup ~]# vim /etc/rsyncd.conf
# /etc/rsyncd: configuration file for rsync daemon mode
# See rsyncd.conf man page for more options.
# configuration example:
uid = rsync 设置rsync运行权限为root
gid = rsync 设置rsync运行权限为root
use chroot = no 修改为no,增加对目录文件软连接的备份
read only = no 设置rsync服务端文件为读写权限
list = no 不显示rsync服务端资源列表
max connections = 20 最大连接数
log file = /var/log/rsyncd.log 日志文件位置
pidfile = /var/run/rsyncd.pid pid文件的存放位置
lock file = /var/run/rsync.lock 支持max connections参数的锁文件
secrets file = /etc/rsync.passwd 虚拟用户的密码文件,后面会创建这个文件
transfer logging = yes 使 rsync 服务器将传输操作记录到传输日志文件
timeout = 600 设置超时时间
ignore nonreadable = yes 指定 rysnc 服务器完全忽略那些用户没有访问权限的文件
dont compress = *.gz *.tgz *.zip *.z *.Z *.rpm *.deb *.bz2
指定那些在传输之前不进行压缩处理的文件
[backup] 自定义模块名称
path = /backup 需要同步的备份目录
ignore errors 表示出现错误忽略错误
comment = backup 给模块指定一个描述
auth users = user1 执行数据同步的用户名,可以设置多个,用英文逗号隔开
4、创建虚拟用户认证文件并设置权限
[root@backup ~]# echo "user1:123456" >/etc/rsync.passwd
[root@backup ~]# cat /etc/rsync.passwd
user1:123456 注:user1为虚拟用户,123456为这个虚拟用户的密码
[root@backup ~]# chmod 600 /etc/rsync.passwd
5、启动rsync服务并查看端口是否开启
[root@backup ~]# rsync --daemon
[root@backup ~]# netstat -antp|grep 873
tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 12313/rsync
tcp6 0 0 :::873 :::* LISTEN 12313/rsync
6、在数据服务器安装Rsync客户端并创建密码文件
[root@server ~]# yum -y install rsync
[root@server ~]# rpm -q rsync
rsync-3.0.9-18.el7.x86_64
[root@server ~]# echo "123456"> /etc/passwd.txt 注:passwd.txt密码文件里只写密码即可
[root@server ~]# chmod 600 /etc/passwd.txt
7、在数据服务器上测试能否推送备份成功
[root@server ~]# rsync -avz /server/www/ [email protected]::backup --password-file=/etc/passwd.txt
sending incremental file list
./
1.txt
a.txt
sent 147 bytes received 49 bytes 392.00 bytes/sec
total size is 26 speedup is 0.13
上面推送成功之后,到备份服务器查看是否备份成功
[root@backup ~]# ls /backup/
1.txt a.txt
通过测试发现我们已经可以从数据服务器同步文件到备份服务器了。
五、安装inotify-tools配合rsync实现数据实时备份
1、查看服务器内核是否支持inotify
[root@server ~]# ll /proc/sys/fs/inotify 出现下面的内容,说明内核支持inotify
-rw-r--r-- 1 root root 0 3月 3 17:48 max_queued_events
-rw-r--r-- 1 root root 0 3月 3 17:48 max_user_instances
-rw-r--r-- 1 root root 0 3月 3 17:48 max_user_watches
备注:Linux下支持inotify的内核最小为2.6.13,可以输入命令:uname -a查看内核
2、下载源码包并安装inotify-tools
[root@server ~]# yum -y install make gcc gcc-c++
[root@server ~]# wget --no-check-certificate https://github.com/downloads/rvoicilas/inotify-tools/inotify-tools-3.14.tar.gz
[root@server ~]# tar -xf inotify-tools-3.14.tar.gz
[root@server ~]# cd inotify-tools-3.14
[root@server inotify-tools-3.14]# ./configure --prefix=/usr/local/inotify
[root@server inotify-tools-3.14]# make && make install
3、inotify的inotifywait命令常用参数及可监控的事件
inotifywait命令参数
-m 始终保持事件监听状态。
-r 使用递归形式监视目录。
-q 减少冗余信息,只打印监控事件的信息。
-e 指定要监视的事件列表。
--timefmt 是指定时间的输出格式。
--format 打印使用指定的输出类似格式字符串。
--excludei 排除文件或目录时,不区分大小写。
可监听的事件 |
|
事件 |
描述 |
access |
读取文件或目录内容 |
modify |
修改文件或目录内容 |
attrib |
文件或目录的属性改变 |
close_write |
修改真实文件内容 |
move |
移动文件或目录移动到监视目录 |
moved_to |
文件或目录移动到 |
moved_from |
文件或目录从移动 |
create |
在监视目录下创建文件或目录 |
open |
文件或目录被打开 |
close |
关闭,对文件进行关闭操作。 |
delete |
删除监视目录下的文件或目录 |
unmount |
卸载文件系统 |
4、修改inotify默认参数(inotify默认内核参数值太小)
(1)查看系统默认参数
[root@server ~]# sysctl -a | grep max_queued_events
fs.inotify.max_queued_events = 16384 监控队列大小,如果值太小,会出错
[root@server ~]# sysctl -a | grep max_user_watches
fs.inotify.max_user_watches = 8192 同时同一用户可以监控的目录数量
[root@server ~]# sysctl -a | grep max_user_instances
fs.inotify.max_user_instances = 128 每个用户创建inotify实例最大值
(2)修改后的参数(参数可根据需要适当调大)
使用下面的这种方法修改的参数是生效的
[root@server ~]# echo 65535 > /proc/sys/fs/inotify/max_user_instances
[root@server ~]# echo 999999 > /proc/sys/fs/inotify/max_queued_events
[root@server ~]# echo 9 > /proc/sys/fs/inotify/max_user_watches
注意:按照网上说法在/etc/sysctl.conf里添加或在/usr/lib/sysctl.d/50-default.conf文件添加下面的参数都是无效的。本人亲测!
[root@server ~]# vim /etc/sysctl.conf
max_queued_events = 999999
max_user_instances = 65535
max_user_watches = 999999
[root@server ~]# vim /usr/lib/sysctl.d/50-default.conf
max_queued_events = 999999
max_user_instances = 65535
max_user_watches = 999999
5、编写监控脚本并加载到后台执行
[root@server ~]# cat inotify.sh
#!/bin/bash
host=192.168.115.130 #备份服务器IP
src=/server/www #数据服务器需要备份的目录
dst=backup #备份服务器的备份数据目录
user=user1 #rsync --daemon定义的验证用户名
rsync_passfile=/etc/passwd.txt # rsync验证的密码文件
inotify_home=/usr/local/inotify #inotify安装路径
#判断上面这些目录和文件是否全部存在
if [ ! -e "$src" ] || [ ! -e "${rsync_passfile}" ] || [ ! -e "${inotify_home}/bin/inotifywait" ] || [ ! -e "/usr/bin/rsync" ];
then
echo "Please check whether there is a directory or file"
exit 9
fi
#这里必须要先cd到源目录,inotify再监听,./ 才能rsync同步后目录结构一致
cd ${src}
${inotify_home}/bin/inotifywait -mrq --format '%Xe %w%f' -e modify,create,delete,attrib,close_write,move ./ | while read file
#把监控到有发生更改的"文件路径列表"循环
do
# 把inotify输出切割 把事件类型部分赋值给INO_EVENT
INO_EVENT=$(echo $file | awk '{print $1}')
# 把inotify输出切割 把文件路径部分赋值给INO_FILE
INO_FILE=$(echo $file | awk '{print $2}')
echo "-------------------------------$(date)------------------------------------"
echo $file
#这里判断是否有文件的创建、修改、移动等操作
if [[ $INO_EVENT =~ 'CREATE' ]] || [[ $INO_EVENT =~ 'MODIFY' ]] || [[ $INO_EVENT =~ 'CLOSE_WRITE' ]] || [[ $INO_EVENT =~ 'MOVED_TO' ]]
then
echo 'CREATE or MODIFY or CLOSE_WRITE or MOVED_TO'
#如果有上面的条件则同步文件到目标服务器
rsync -avzcR --password-file=${rsync_passfile} $(dirname ${INO_FILE}) ${user}@${host}::${dst}
fi
#这里判断是否有文件的删除、移动的操作
if [[ $INO_EVENT =~ 'DELETE' ]] || [[ $INO_EVENT =~ 'MOVED_FROM' ]]
then
echo 'DELETE or MOVED_FROM'
#如果有上面的条件则同步文件到目标服务器
rsync -avzR --delete --password-file=${rsync_passfile} $(dirname ${INO_FILE}) ${user}@${host}::${dst}
fi
#这里判断文件的属性是否发生改变
if [[ $INO_EVENT =~ 'ATTRIB' ]]
then
echo 'ATTRIB'
if [ ! -d "$INO_FILE" ]
then
#如果有上面的条件则同步文件到目标服务器
rsync -avzcR --password-file=${rsync_passfile} $(dirname ${INO_FILE}) ${user}@${host}::${dst}
fi
fi
done
给脚本授予执行权限并在后台运行脚本监控
[root@server ~]# chmod +x inotify.sh
[root@server ~]# nohup ./inotify.sh &
[root@server ~]# ps -aux|grep inotify
root 14741 0.0 0.1 113132 1420 pts/2 S 11:23 0:00 /bin/bash ./inotify.sh
root 14742 0.0 0.0 6480 644 pts/2 S 11:23 0:00 /usr/local/inotify/bin/inotifywait -mrq --format %Xe %w%f -e modify,create,delete,attrib,close_write,move ./
root 14743 0.0 0.0 113132 384 pts/2 S 11:23 0:00 /bin/bash ./inotify.sh
6、设置定时任务,防止意外导致无法同步
因为inotify只在启动时会监控目录,他没有启动期间的文件发生更改,他是不知道的,所以这里每2个小时做1次全量同步,防止各种意外遗漏,保证目录一致。
[root@localhost ~]# crontab -e
* */2 * * * rsync -avz --password-file=/etc/passwd.txt /server/www/ [email protected]::backup
7、 实时同步测试
(1)在数据服务器端创建文件,看是否能够同步备份
在数据服务器创建文件并查看
[root@server ~]# touch /server/www/{1..5}.txt
[root@server ~]# ls /server/www/
1.txt 2.txt 3.txt 4.txt 5.txt
在备份服务器查看是否同步备份
[root@backup ~]# ls /backup/
1.txt 2.txt 3.txt 4.txt 5.txt
(2)在数据服务器端删除文件,看是否能够同步删除
在数据服务器删除文件并查看
[root@server ~]# rm -f /server/www/1.txt /server/www/2.txt
[root@server ~]# ls /server/www/
3.txt 4.txt 5.txt
在备份服务器查看是否同步删除
[root@backup ~]# ls /backup/
3.txt 4.txt 5.txt
(3)在数据服务器端修改文件内容,看是否能够同步内容
在数据服务器修改文件内容并查看
[root@server ~]# echo -e "33333333333\n444444444444">/server/www/3.txt
[root@server ~]# cat /server/www/3.txt
33333333333
444444444444
在备份服务器查看文件内容是否同步
[root@backup ~]# cat /backup/3.txt
33333333333
444444444444
(4)修改文件权限看能否同步
在数据服务器修改文件权限并查看
[root@server ~]# ls -l /server/www/
-rw-r--r-- 1 root root 25 3月 5 11:37 3.txt
-rw-r--r-- 1 root root 0 3月 5 11:28 4.txt
-rw-r--r-- 1 root root 0 3月 5 11:28 5.txt
[root@server ~]# chmod 755 /server/www/*
[root@server ~]# ls -l /server/www/
-rwxr-xr-x 1 root root 25 3月 5 11:37 3.txt
-rwxr-xr-x 1 root root 0 3月 5 11:28 4.txt
-rwxr-xr-x 1 root root 0 3月 5 11:28 5.txt
在备份服务器查看文件权限是否同步
[root@backup ~]# ls -l /backup/
-rwxr-xr-x 1 rsync rsync 25 3月 5 11:37 3.txt
-rwxr-xr-x 1 rsync rsync 0 3月 5 11:28 4.txt
-rwxr-xr-x 1 rsync rsync 0 3月 5 11:28 5.txt
以上所有的测试做完之后,发现都可以同步,说明我们的rsync+inotify实现数据实时备份已经配置完成了