rsync(remote synchronize)
是一个远程数据同步工具,可通过 LAN/WAN
快速同步多台主机之间的文件。也可以使用 rsync
同步本地硬盘中的不同目录。
rsync
是用于替代 rcp
的一个工具,rsync
使用所谓的 rsync
算法进行数据同步,这种算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。
基本特性
rsync 具有如下的基本特性:
- 可以镜像保存整个目录树和文件系统
- 可以很容易做到保持原来文件的权限、时间、软硬链接等
- 无须特殊权限即可安装
- 优化的流程,文件传输效率高
- 可以使用 rsh、ssh 方式来传输文件,当然也可以通过直接的 socket 连接
- 支持匿名传输,以方便进行网站镜象
rsync 命令
- 本地使用:
# OPTION 可选 配置参数
# SRC 源文件路径,即要拷贝的文件路径
# DEST 目标路径
rsync [OPTION] SRC [DEST]
- 通过远程 Shell 使用:
拉: rsync [OPTION...] [USER@]HOST:SRC... [DEST]
推: rsync [OPTION...] SRC... [USER@]HOST:DEST
- 访问 rsync 服务器:
拉: rsync [OPTION...] [USER@]HOST::SRC... [DEST]
推: rsync [OPTION...] SRC... [USER@]HOST::DEST
拉: rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]
推: rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST
其中:
- SRC: 是要复制的源位置
- DEST: 是复制目标位置
- 若本地登录用户与远程主机上的用户一致,可以省略 USER@
- 使用远程 shell 同步时,主机名与资源之间使用单个冒号“:”作为分隔符
- 使用 rsync 服务器同步时,主机名与资源之间使用两个冒号“::”作为分隔符
- 当访问 rsync 服务器时也可以使用 rsync:// URL
- “拉”复制是指从远程主机复制文件到本地主机
- “推”复制是指从本地主机复制文件到远程主机
- 当进行“拉”复制时,若指定一个 SRC 且省略 DEST,则只列出资源而不进行复制
常用配置
选项 | 说明 |
---|---|
-a, ––archive | 归档模式,表示以递归方式传输文件,并保持所有文件属性,等价于 -rlptgoD (注意不包括 -H) |
-r, ––recursive | 对子目录以递归模式处理 |
-l, ––links | 保持符号链接文件 |
-H, ––hard-links | 保持硬链接文件 |
-p, ––perms | 保持文件权限 |
-t, ––times | 保持文件时间信息 |
-g, ––group | 保持文件属组信息 |
-o, ––owner | 保持文件属主信息 (super-user only) |
-D | 保持设备文件和特殊文件 (super-user only) |
-z, ––compress | 在传输文件时进行压缩处理 |
––exclude=PATTERN | 指定排除一个不需要传输的文件匹配模式 |
––exclude-from=FILE | 从 FILE 中读取排除规则 |
––include=PATTERN | 指定需要传输的文件匹配模式 |
––include-from=FILE | 从 FILE 中读取包含规则 |
––copy-unsafe-links | 拷贝指向SRC路径目录树以外的链接文件 |
––safe-links | 忽略指向SRC路径目录树以外的链接文件(默认) |
––existing | 仅仅更新那些已经存在于接收端的文件,而不备份那些新创建的文件 |
––ignore-existing | 忽略那些已经存在于接收端的文件,仅备份那些新创建的文件 |
-b, ––backup | 当有变化时,对目标目录中的旧版文件进行备份 |
––backup-dir=DIR | 与 -b 结合使用,将备份的文件存到 DIR 目录中 |
––link-dest=DIR | 当文件未改变时基于 DIR 创建硬链接文件 |
––delete | 删除那些接收端还有而发送端已经不存在的文件 |
––delete-before | 接收者在传输之前进行删除操作 (默认) |
––delete-during | 接收者在传输过程中进行删除操作 |
––delete-after | 接收者在传输之后进行删除操作 |
––delete-excluded | 在接收方同时删除被排除的文件 |
-e, ––rsh=COMMAND | 指定替代 rsh 的 shell 程序 |
––ignore-errors | 即使出现 I/O 错误也进行删除 |
––partial | 保留那些因故没有完全传输的文件,以是加快随后的再次传输 |
––progress | 在传输时显示传输过程 |
-P | 等价于 ––partial ––progress |
––delay-updates | 将正在更新的文件先保存到一个临时目录(默认为 “.tmp”),待传输完毕再更新目标文件 |
-v, ––verbose | 详细输出模式 |
-q, ––quiet | 精简输出模式 |
-h, ––human-readable | 输出文件大小使用易读的单位(如,K,M等) |
-n, ––dry-run | 显示哪些文件将被传输 |
––list-only | 仅仅列出文件而不进行复制 |
––rsyncpath=PROGRAM | 指定远程服务器上的 rsync 命令所在路径 |
––password-file=FILE | 从 FILE 中读取口令,以避免在终端上输入口令,通常在 cron 中连接 rsync 服务器时使用 |
-4, ––ipv4 | 使用 IPv4 |
-6, ––ipv6 | 使用 IPv6 |
––version | 打印版本信息 |
––help | 显示帮助信息 |
注意
- 若使用普通用户身份运行
rsync
命令,同步后的文件的属主将改变为这个普通用户身份。 - 若使用超级用户身份运行 rsync 命令,同步后的文件的属主将保持原来的用户身份。
- ––exclude-from=FILE中,
FILE
写绝对路径,例如/www/exclude.list
# exclud.list 文件.这是一个忽略文件列表,第一要注意的是这个文件的第一行书写的忽略文件规则不生效,第二注意忽略规则中的文件夹名字后面不要加空格
public/uploads
logs
db/config.js
rsync
的基本使用
在本地磁盘同步数据
# 其中 --delete 表示删除目标文件夹有,但原文件夹中没有的文件
rsync -a --delete /home /backups
rsync -a --delete /home/ /backups/home.0
注意:
在指定复制源时,路径是否有最后的 “/” 有不同的含义,例如:
-
/home
: 表示将整个/home
目录复制到目标目录 -
/home/
: 表示将/home
目录中的所有内容复制到目标目录
使用基于 ssh
的 rsync
远程同步数据
- 同步静态主机表文件
# 执行“推”复制同步,将本机下的/etc/hosts 推送到139.196.169.192远程服务器,但实际执行时,会遇到被拒绝连接情况,因此可使用下面拉取操作.
[root@soho ~]# rsync -avz --delete /etc/hosts [email protected]:/etc/hosts
- 执行“拉”复制同步 从远程服务器139.196.169.192拉取到本地
[root@centos5 ~]# rsync -avz --delete [email protected]:/etc/hosts /etc/hosts
注意
- 使用基于
ssh
的rsync
同步数据可以使用-e ssh
参数,当前的CentOS
默认指定使用ssh
作为远程Shell
。若您在其他系统上执行rsync
命令,为确保使用ssh
作为远程Shell
,请添加-e ssh
参数。 - 通常
rsync
命令在后台以cron
任务形式执行,为了避免从终端上输入口令需要设置ssh
。ssh
的设置方法请参考安全登录守护进程。
筛选 rsync 的传输目标
使用 --exclude/--include 选项
可以使用 ––exclude
选项排除源目录中要传输的文件;同样地,也可以使用 ––include
选项指定要传输的文件。
# 将 192.168.0.101 主机上的 /www 目录(不包含 /www/logs 和 /www/conf子目录)复制到本地的 /backup/www/
# 不能使用分隔符写成 --exclude="logs/ conf/",必须分开写
rsync -az --delete --exclude="logs/" --exclude="conf/" --progress [email protected]:/www/ /backup/www/
下面的 rsync 命令仅复制目录结构而忽略掉目录中的文件。
rsync -av --include='*/' --exclude='*' [email protected]:/www/ /backup/www-tree/
使用 --exclude-from/--include-from
选项
当 include/exclude
的规则较复杂时,可以将规则写入规则文件。使用规则文件可以灵活地选择传输哪些文件(include
)以及忽略哪些文件(exclude
)。
- 若文件/目录在剔除列表中,则忽略传输
- 若文件/目录在包含列表中,则传输之
- 若文件/目录未被提及,也传输之
在 rsync 的命令行中使用 ––exclude-from=FILE 或 ––include-from=FILE 读取规则文件。其中 FILE
为文件路径,如 /www/exclude.list
规则文件 FILE 的书写约定:
- 每行书写一条规则 RULE
- 以 # 或 ; 开始的行为注释行
包含(include)和排除(exclude)规则的语法如下:
- include PATTERN 或简写为 + PATTERN
- exclude PATTERN 或简写为 - PATTERN
PATTERN 的书写规则如下:
- 以 / 开头:匹配被传输的跟路径上的文件或目录
- 以 / 结尾:匹配目录而非普通文件、链接文件或设备文件
- 使用通配符
- *:匹配非空目录或文件(遇到 / 截止)
- **:匹配任何路径(包含 / )
- ?:匹配除了 / 的任意单个字符
- [:匹配字符集中的任意一个字符,如 [a-z] 或 [[:alpha:]]
- 可以使用转义字符 \ 将上述通配符还原为字符本身含义
下面给出几个使用规则的例子:
# 不传输所有后缀为 .o 的文件
- *.o
# 不传输传输根目录下名为 foo 的文件或目录
- /foo
# 不传输名为 foo 的目录
- foo/
# 不传输 /foo 目录下的名为 bar 的文件或目录
- /foo/bar
# 传输所有目录和C语言源文件并禁止传输其他文件
+ */
+ *.c
- *
# 仅传输 foo 目录和其下的 bar.c 文件
+ foo/
+ foo/bar.c
- *
将规则写入规则文件之后,如何在命令行上使用它呢?下面给出一个例子:
首先将下面的规则存入名为 www-rsync-rules 的文件
# 不传输 logs 目录
- logs/
# 不传输后缀为 .tmp 的文件
- *.tmp
# 传输 Apache 虚拟主机文档目录(/*/ 匹配域名)
+ /srv/www/
+ /srv/www/*/
+ /srv/www/*/htdocs/
+ /srv/www/*/htdocs/**
# 传输每个用户的 public_html 目录(/*/ 匹配用户名)
+ /home/
+ /home/*/
+ /home/*/public_html/
+ /home/*/public_html/**
# 禁止传输其他
- *
然后即可使用类似如下的 rsync 命令:
rsync -av --delete --exclude-from=www-rsync-rules / remotehost:/dest/dir