作者:方维超
归档:课堂笔记
时间:2019/4/19
企业级实时复制备份应用实践
【目录】
1.实时复制服务介绍
2.实时复制inotify机制介绍
3.sersync+rsync****实时复制方案项实践
1.1 实时复制服务介绍
1.1.1 企业数据备份方案介绍
在网站集群架构中,数据永远是网站最重要的,一旦数据造成丢失,将会给企业造成巨大损失,因此,企业网站和应用需要有完善的数据备份方案确保数据安全。在真实企业中,数据备份方案通常有以下几种情况:
✧ 利用定时方式,实现周期备份重要数据信息。
需要周期性备份的数据可以分两类:一是程序员发布的程序代码以及运维人员对服务器等的配置变更文件,一般会使用定时任务执行脚本对该类文件进行备份,然后再配合rsync工具推送到远端服务器备份;二是对于数据库等的数据会用定时执行脚本(通过数据库自带(或第三方)的备份工具定时备份成文件)备份,然后再配合rsync工具推送到远端服务器备份。
✧ 利用实时复制方式,实现实时备份重要数据信息。
实时复制是企业数据备份最重要的方式,主要用具用户提交的数据的备份,对于用户提交到服务器上的普通文件(压缩包、视频、文档等),可采用inotify/sersync+rsync实时备份方式;对于数据文件还有交付在的分布式存储工具自身可以实现将数据同时备份成多份,例如:FastDFS、GlusterFS等;对于提交到数据库中的数据,可使用数据库的主从复制(例如:MySQL、Oracle)方式备份这是软件自带的实时复制备份方式。有的企业会采用更多思路实现数据同时变为多份,例如:程序业务逻辑在数据提交时,同时提交到两个服务器。
1.1.2 实时复制实践环境准备
1.实时复制实践部署准备
根据下图说明,部署实施服务架构的目录规划信息,包括主机地址,主机名称。
2.实时复制细节实现说明
✧ 实施复制软件会监控磁盘文件系统的变化,比如:指定一个/data目录,实时复制软件服务进程会实时监控这个/data目录中数据的变化,即文件系统中block与inode信息的变化。
✧ 一旦/data目录文件发生变化,就会执行rsync命令,将变化的数据信息推送到备份服务器相应的备份目录中,从而完成数据的实时备份。
提示:根据实时复制原理描述,可发现rsync备份服务器是需要先行搭建的,搭建完成rsync备份服务器后,再进行实时复制软件服务的部署。
1.1.3 实时复制软件介绍
随着互联网技术的不断发展,数据复制软件服务也层出不穷,目前企业中较为常用的实时复制软件有如下两种:
2.1 实时复制inotify机制介绍
2.1.1 inotify 机制简介
inotify是一种异步的文件系统事件监控机制,可以监控文件系统中添加、删除、修改、移动等各种事件,利用这个内核接口,第三方软件可以监控文件系统下文件的各种变化情况。
inotify程序原理是一种事件驱动机制,它为应用程序加农文件系统事件提供了实时响应事件的机制,可以做出对事件处理的实时响应。
inotify的实现有几款软件:inotify-tools、sersync。
提示:sersync软件在inotify基础上进行开发的,功能要更加强大些,支持配置文件配置,多了定时重试复制机制,过滤机制,提供接口做CDN数据更新,支持多线程操控。
✧ inotify 机制优点
监控文件系统文件变化,通过复制工具实现实时数据复制。
支持多线程实时复制。
✧ inotify 机制缺点
实测并发如果大于200个文件(10-100k),复制会有延迟。
2.1.2 inotify+rsync 实时复制项目实践
不管是inotify-tools还是sersync,本身的核心功能都只是,监控指定目录内的数据变化,具体的复制到远端服务器的功能,还是需要rsync工具配合,这些软件几乎都是inotify机制接口之上的软件封装,软件具体工作机制流程为:
✧ 备份源客户端开启运行inotify软件服务进程,检测指定目录的文件系统变化。
✧ 一旦获取到指定监控目录的数据发生变化,即执行rsync命令复制数据。
✧ 将变化的数据发送到rsync服务端(也可执行scp,rsync远程shell模式)的备份目录中。
特此说明:下面的inotify配置是建立在rsync服务搭建完成确认无误基础上的配置过程。
实时复制实践:
1、 部署NFS客户端
echo ‘export RSYNC_PASSWORD=oldboy’>>/etc/bashrc
source /etc/bashrc
echo $RSYNC_PASSWORD
测试推送
rsync -avz /data [email protected]::backup
2、 查看inotify支持情况
uname-r
ls -l /proc/sys/fs/inotify
上述三个文件说明:
max_user_watches:
设置inotifywait或inotifywatch命令可以监视的文件数量(单进程)
max_user_instances:
设置每个用户可以运行的inotifywait或inotifywatch命令的进程数
max_queued_events:
设置inotify实例实践(event)队列可容纳的事件数量
3、 安装inotify-tools
yum install epel-release -y
安装epel源,默认的官方没有inotify-tools工具包
yum install inotify-tools -y
下载inotify软件工具
4、 inotify 工具命令介绍
inotify-tools 工具主要命令
✧inotifywait:在被监控的目录等待特定文件系统事件(open、close、delete等)发生,执行后处于阻塞状态,适合在Shell脚本中使用,此命令是重点。
✧inotifywatch:收集被监控的文件系统使用的数据统计,指文件系统发生的次数统计。
inotify 命令参数
监控事件
5、 测试实践
inotifywait -mrq --timefmt '%d/%m/%y %H:%M' --format '%T %w%f' -e create /data
打开同服务器两个窗口,一边创建,一边监测
6、 思考:实现数据复制
监控哪些事件?
增 删 改 需要监控
监控创建和删除命令:
7、 编写实时监控和复制脚本
mkdir /server/scripts -p 创建脚本目录
touch /server/scripts/monitor.sh 创建监控脚本文件
vim monitor.sh 编辑脚本
inotify-tools软件企业优化案例
相比上面两个项目,sersync项目的优点是:
✧使用c++编写,对Linux系统文件产生的临时文件和重复的文件操作会进行过滤,再结合rsync复制的时候,会减少运行时小号的本地及网络资源,因此速度更快
✧相比较上面两个项目,sersync配置起来很简单
✧使用多线程进行复制,尤其在复制较大文件时,能够保证多个服务器实时保持复制状态。
✧serync自带出错处理机制,通过失败队列对出错的文件重新复制,如果仍旧失败,则每若干个小时对复制失败的文件再重新复制。
✧serync自带crontab功能,只需在xml配置文件中开启,即可按预先的配置,隔一段时间整体复制一次。
✧serync自带socket与http的协议扩展,可以满足有特殊需求的公司二次开发。
sersync+rsync 实时复制方案项目实践
1、 推送
rsync -az /data [email protected]::backup
2、 部署sersync服务(客户端NFS上)
拖拽sersync_oldboy_64bit_20160928.tar.gz上传
3、 sercync 配置文件:干两件事
完成监控配置
inotifywait -mrq --format ‘%w%f’ -e create,close_write,delete,moved_from,moved_to /data
完成命令拼接
rsync -az /data [email protected]::backup
4、 启动服务
**/application/sersync/bin/sersync -d 启动完成。
5、 设置开机自启动:/etc/rc.local