rsync+ inotify
rsync是一个快速备份工具,可以在不同主机之间镜像同步整个目录树,支持增量备份,保存连接和权限,且采用优化的同步算法,传输前执行压缩,因此
非常适合用于异地备份,镜像服务器等应用,rsync保证了数据的同步一致性,那我们把两台web服务器的数据保持一致,这样可以用两台web服务器做负载
均衡,所以rsync是实现LVS的重要工具的一种,需要注意的是必须在主服务器和同步服务器上都安装rsync,其中主服务器上是以服务器模式运行rsync,
而同步上则以客户端方式运行rsync。这样在主服务器上运行rsyn守护进程,在同步上用crond定时运行客户程序来同步主服务器上需要同步的内容。
rsync保证了服务器有的数据,客户端一定有,但是客户端比服务器多出的额外的数据,服务器那边是没有的
rsync命令的工作模式有四种:
1、shell模式,也称为本地模式,速度要比cp快
2、远程shell模式,其可以借助于ssh协议承载其数据传输过程
3、列表模式,其工作方式与ls相似,仅列出源的内容:-nv
4、服务器模式,此时,rsync可以工作为守护进程,能够接收客户端的数据传输请求,在使用时可以在客户端使用rsync命令发送给守护进程,也可以向服务器主获取文件。
1.安装rsync服务器
yum -y install rsync
2.建立rsync的三个配置文件,
touch /etc/rsyncd.conf(rsync的配置文件)
touch /etc/rsyncd.secrets(用户的密码文件)
chmod 600 /etc/rsyncd.secrets(权限要设置为600,否则无法备份成功)
touch /etc/rsyncd.motd(rsync服务器信息,这个不是必须创建的)
3.自己手动建立rsync的配置文件的信息
vim /etc/rsyncd.conf
########前面为#号的可以不要
uid = nobody # 备份以什么身份进行,用户ID
gid = nobody # 备份以什么身份进行,组ID
use chroot = no #禁锢在源目录
max connections = 0 #最大连接数,0代表没有限制
port = 873 #默认端口873
address = 172.16.1.10 #rsync服务器的ip地址
pid file = /var/run/rsyncd.pid #运行进程的ID写到哪里
log file = /var/log/rsyncd.log #日志记录文件
#hosts allow = 172.16.1.0/24 #允许连接服务器的主机IP地址,如果多个ip则用空格隔开
#hosts deny = 0.0.0.0/0.0.0.0 #禁止连接服务器的主机IP地址,也可为*,表示所有。
#strict modes =yes #是否检查口令文件的权限
#motd file = /etc/rsyncd.motd #欢迎消息
#lock file = /var/run/rsync.lock
[wwwroot] # 指定认证的备份模块名
path = /var/www/html # 需要备份的目录,这里备份web存放网页目录的路径,真是环境写你需要备份的路径
comment = BACKUP p_w_upload # 注释,提示信息
ignore errors # 忽略一些无关的IO错误
read only = false # 设置为非只读,即可以传至服务器的相应目录。
auth users = backuper # 认证的用户名,如果没有这行,则表明是匿名
secrets file = /etc/rsyncd.secrets # 认证文件名,用来存放密码
#list = false # 不允许列文件
#exclude = test/ test.php #设置不同步的目录或文件用空格隔开
######配置完成保存退出
4.设置密码文件
vim /etc/rsyncd.secrets
####
backuper:pwd123 #这里的用户名对应配置文件里面的用户,配置文件里面有几个用户就建立几个用户 类容格式 用户名:密码
####编辑完成保存退出
5.可以启动rsync服务了
rsync --daemon #启动rsync服务,如果你的配置文件是/etc/rsyncd/rsyncd.conf那启动的时候就 sync --daemon --config=/etc/rsyncd/rsyncd.conf
netstat -tnlp | grep rsync #查看端口
kill $(cat /var/run/rsyncd.pid) orpkill rsync #杀死rsync的进程
6.如果是异地备份,因为数据不需要全天不断运行,只是有用户在客户机连接的时候才启用,因此可以将rsync交给超级服务xinetd管理
yum -y install xinetd
vim /etc/xinetd.d/rsync
#####
service rsync
{
disable = no
flags = IPv6
socket_type = stream
wait = no
user = root
server = /usr/bin/rsync
server_args = --daemon
log_on_failure += USERID
}
####
service xinted restart 启动xinted服务
命令的解释:
-v表示verbose(详细)
-z表示zip(压缩)
-r表示recursive(递归目录)
-topg是保持文件原有属性如o=owner(属主)、t=times(时间)、p=perms(权限)、g=group(组)的参数
-H表示保持硬连接
-l:保留软链结
-u:表示只更新源文件比目标时间新的文件
--progress是指显示出详细的进度情况
--delete是指如果服务器端删除了这一文件,那么客户端也相应把文件删除,保持真正的一致。如果客户机和服务器的文件有不同的那么
客户机的文件将被删除,所以此参数慎用
--password-file = /etc/rsyncd.secrets来指定密码文件,这里需要注意的是这份密码文件权限属性要设得只有属主可读(权限为600),属主为正在运行此命令的用户。
如果是指定密码文件了,则就不需要输入密码,但是客户端的这个文件必须存在
vim /etc/rsyncd.secrets
###
pwd123 #只需要写用户的密码
### chmod 600 /etc/rsyncd.secrets
命令格式及常用的备份选项
Rync [选项] 原始位置 目标位置
-v, --verbose 详细模式输出
-q, --quiet 精简输出模式
-c, --checksum 打开校验开关,强制对文件传输进行校验
-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, --recursive 对子目录以递归模式处理
-R, --relative 使用相对路径信息
-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀
-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, --links 保留软链结
-L, --copy-links 想对待常规文件一样处理软链结
--copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
--safe-links 忽略指向SRC路径目录树以外的链结
-H, --hard-links 保留硬链结
-p, --perms 保持文件权限
-o, --owner 保持文件属主信息
-g, --group 保持文件属组信息
-D, --devices 保持设备文件信息
-t, --times 保持文件时间信息
-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, --dry-run现实哪些文件将被传输
-W, --whole-file 拷贝文件,不进行增量检测
-x, --one-file-system 不要跨越文件系统边界
-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
--delete 删除那些DST中SRC没有的文件
--delete-excluded 同样删除接收端那些被该选项指定排除的文件
--delete-after 传输结束以后再删除-
-ignore-errors 及时出现IO错误也进行删除
--max-delete=NUM 最多删除NUM个文件-
-partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
--force 强制删除目录,即使不为空
--numeric-ids 不将数字的用户和组ID匹配为用户名和组名
--timeout=TIME IP超时时间,单位为秒-I,
--ignore-times 不跳过那些有同样的时间和长度的文件
--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T --temp-dir=DIR 在DIR中创建临时文件
--compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 --partial--progress 显示备份过程
-z, --compress 对备份的文件在传输时进行压缩处理
--exclude=PATTERN 指定排除不需要传输的文件模式
--include=PATTERN 指定不排除而需要传输的文件模式
--exclude-from=FILE 排除FILE中指定模式的文
--include-from=FILE 不排除FILE指定模式匹配的文件
--version 打印版本信息
--address 绑定到特定的地址
--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
--port=PORT 指定其他的rsync服务端口
--blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
--progress 在传输时现实传输过程
--log-format=formAT 指定日志文件格式
--password-file=FILE 从FILE中得到密码
--bwlimit=KBPS 限制I/O带宽,KBytes per second
-h, --help 显示帮助信息
注意:rsync命令使用中,如果源参数的末尾有斜线,就会复制指定目录内容,而不复制目录本身;没有斜线,则会复制目录本身,因此有如下命令:
# rsync -r /mydata/data /backups/:会把目录data直接同步至/backups目录中去
# rsync -r /mydata/data/ /backups/:会把目录中的data/中的内容同步至/backups目录中
rsync本地用法:
# cd /etc /tmp/
# rsync /tmp/etc/passwd/tmp/test/passwd -nv
推送到远程主机上去,把本地的etc文件推送到172.16.251.244主机上去:
# rsync -r -e ssh /tmp/[email protected]:/tmp/
拉取远程服务器上的文件:
# rsync -e ssh -r [email protected]:/etc/pam.d ./ --stats
把文件推送到服务器端上去:
# rsync -auzv messages [email protected]::my_data_rsync
如果我们从服务器上拉取文件时必须要指定文件路径
# rsync [email protected]::my_data_rsync/messages/tmp/
关于以下知识,本人正握不多,还在研究阶段,有一大部分是摘录至其他博客,望见谅!
初识inotify
Inotify 是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在上面章节中,我们讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync同步,这样刚好解决了同步数据的实时性问题。
安装inotify工具inotify-tools
由于inotify特性需要Linux内核的支持,在安装inotify-tools前要先确认Linux系统内核是否达到了2.6.13以上,如果Linux内核低于2.6.13版本,就需要重新编译内核加入inotify的支持,也可以用如下方法判断,内核是否支持inotify:
[root@localhost webdata]# uname -r
2.6.18-164.11.1.el5PAE
[root@localhost webdata]# ll /proc/sys/fs/inotify
总计 0
-rw-r--r-- 1 root root 0 04-13 19:56 max_queued_events
-rw-r--r-- 1 root root 0 04-13 19:56 max_user_instances
-rw-r--r-- 1 root root 0 04-13 19:56 max_user_watches
如果有上面三项输出,表示系统已经默认支持inotify,接着就可以开始安装inotify-tools了。
可以到http://inotify-tools.sourceforge.net/下载相应的inotify-tools版本,然后开始编译安装:
[root@localhost ~]# tar zxvf inotify-tools-3.14.tar.gz
root@localhost ~]# cd inotify-tools-3.14
[root@localhost inotify-tools-3.14]# ./configure
[root@localhost inotify-tools-3.14]# make
[root@localhost inotify-tools-3.14]# make install
[root@localhost inotify-tools-3.14]# ll /usr/local/bin/inotifywa*
-rwxr-xr-x 1 root root 37264 04-14 13:42 /usr/local/bin/inotifywait
-rwxr-xr-x 1 root root 35438 04-14 13:42 /usr/local/bin/inotifywatch
inotify-tools安装完成后,会生成inotifywait和inotifywatch两个指令,其中,inotifywait用于等待文件或文件集上的一个特定事件,它可以监控任何文件和目录设置,并且可以递归地监控整个目录树。
inotifywatch用于收集被监控的文件系统统计数据,包括每个inotify事件发生多少次等信息。
inotify相关参数
inotify定义了下列的接口参数,可以用来限制inotify消耗kernel memory的大小。由于这些参数都是内存参数,因此,可以根据应用需求,实时的调节其大小。下面分别做简单介绍。
/proc/sys/fs/inotify/max_queued_evnets
表示调用inotify_init时分配给inotify instance中可排队的event的数目的最大值,超出这个值的事件被丢弃,但会触发IN_Q_OVERFLOW事件。
/proc/sys/fs/inotify/max_user_instances
表示每一个realuser ID可创建的inotify instatnces的数量上限。
/proc/sys/fs/inotify/max_user_watches
表示每个inotifyinstatnces可监控的最大目录数量。如果监控的文件数目巨大,需要根据情况,适当增加此值的大小,例如:
echo 30000000 > /proc/sys/fs/inotify/max_user_watches
inotifywait相关参数
Inotifywait是一个监控等待事件,可以配合shell脚本使用它,下面介绍一下常用的一些参数:
-m, 即--monitor,表示始终保持事件监听状态。
-r, 即--recursive,表示递归查询目录。
-q, 即--quiet,表示打印出监控事件。
-e, 即--event,通过此参数可以指定要监控的事件,常见的事件有modify、delete、create、attrib等。
更详细的请参看man inotifywait。