网站镜像 & rsync

网站镜像

网站镜像是指对网站内容的拷贝。镜像通常用于为相同信息内容提供不同的源,特别是在下载量大的时候提供了一种可靠的网络连接。制作镜像是一种文件同步的过程。

创建镜像的目的通常有以下几个:

  • 保存网页信息,特别是在一个网站面临关站的时候。
  • 提高用户在某个地区的下载速度。譬如一个美国网站的中国镜像可以使来自中国的用户直接从这个中国的镜像访问,从而加快了速度。这可以看作是一种全球范围的缓存。
  • 对不可用的信息提供连接途径。例如,2002年的时候中国对Google封锁的时候,镜像站点elgooG成为了有效的绕过封锁的途径。
  • 保存历史性的数据、信息,防止丢失。
  • 平衡网站的流量负载。例如,一个Linux 的发行版的ISO镜像文件的大量下载可能会导致主站过荷而下线,而镜像站点则可以在多个服务器分担流量,从而保证站点的持续在线。
  • 对因流量激增而下线的站点提供临时的访问。
  • 便于不同地区或不同ISP(如中国电信和中国联通的互访问题)的人获得更快的访问速度。
  • 避开对于主网站的审查和屏蔽。

建立镜像的方法

镜像站点是通过主服务器增加转移存储地址来实现信息的异地备份。通常一个镜像会定期访问主网站,以更新其内容。

更新镜像最常用的软件是rsync,有时候也直接用http镜像工具。

rsync

rsync 是类 unix 系统下的 数据镜像备份工具,从软件的命名上就可以看出来了 remote sync。
可以将一个客户机和远程文件服务器之间的文件同步,也可以在本地系统中将数据从一个分区备份到另一个分区上。
如果 rsync 在备份过程中出现了数据传输中断,恢复后可以继续传输不一致的部分。
rsync可以执行完整备份或增量备份。

它的主要特点有:

  • 可以镜像保存 整个目录树和文件系统
  • 可以很容易做到 保持原来文件的权限、时间、软硬链接;无须特殊权限即可安装;
  • 可以 增量同步数据,文件传输效率高,因而同步时间短;
  • 可以使用rcp、ssh等方式来传输文件,当然也可以通过直接的socket连接;
  • 支持匿名传输,以方便进行网站镜象等;
  • 加密传输数据,保证了数据的安全性;

使用:rsync options source target
一些常见的 options

  • -v:verbose
  • -r:copies data recursively (but don’t preserve timestamps and permission while transferring data
  • -a:archive mode, archive mode allows copying files recursively and it also preserves symbolic links, file permissions, user & group ownerships and timestamps
  • -z:compress file data
  • -h:human-readable, output numbers in a human-readable format

详细用法,参考 Rsync (Remote Sync): 10 Practical Examples of Rsync Command in Linux

例如:rsync -avzh [email protected]:/home/ /tmp/test


引用:
维基百科 - 网站镜像
Linux下rsync的用法

你可能感兴趣的:(网站镜像 & rsync)