1. 容灾的IT实现
1.1. 数据保护是容灾的基础
为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、技术支持能力和运行管理能力进行备份的过程称为灾难备份。其中数据的容灾备份是灾难恢复的基础,也是各类业务恢复的前提。
1.2. 数据的分类及特点
数据的有效保护是容灾的关键、谈到数据容灾保护技术,我们首先要对数据有一个简单的分析。
从数据用途角度来说,一般可将需要保护数据分为系统数据、基础数据、应用数据、临时数据。
系统数据主要是指操作系统、数据库系统安装的各类软件包和应用系统执行程序。系统数据在系统安装后基本上不再变动,只有在操作系统、数据库系统版本升级或应用程序调整时才发生变化。系统数据一般都有标准的安装介质。
基础数据主要是指保证业务系统正常运行所使用的系统目录、用户目录、系统配置文件、网络配置文件、应用配置文件、存取控制权限等。基础数据随着业务系统运行环境的变化而变化,一般作为系统档案进行保存。
应用数据主要是指业务系统的所有业务数据,典型如数据库,对数据的安全性、准确性、完整性、一致性要求很高,而且变化频繁。
临时数据主要是指操作系统、数据库产生的系统运行记录、数据库逻辑日子和应用程序在执行过程中产生的各种打印、传输临时文件,谁系统运行和业务的发生而变化。
从各类数据的增长速度、数据变化频率等方面考虑,应用数据、临时数据、基础数据、系统数据都具有不同的特点,如图:
1.3. 数据保护技术概念
数据保护通常包括复制、备份等我们比较熟悉的技术,其目的是为了在数据丢失或系统故障时能够对原始数据和系统进行恢复。从灾难恢复的角度看,与数据的及时性相比更应关注数据的一致性和完整性,而不只是片面地追求数据无丢失。
在讨论具体的容灾解决方案之前,让我们先了解一些有关容灾的技术术语。
1.3.1. 源数据与目标数据
业务系统(或称作生产系统)的数据是源数据,备份/容灾系统中的数据是目标数据。在多向保护模式下,源数据可以有多个目标数据作为备份。源数据与目标数据可能完全一致,也可能有一定的时间差。但两份数据都要求具备一致性和完整性。
1.3.2. 备份
所谓备份,就是把数据复制到转储设备(备份介质)的过程。其中,转储设备是指用于放置数据库拷贝的磁带或磁盘。
备份是一种定时的数据保护方式,目前主要的备份策略有三种:全备份(Full Backup)、增量备份(Incremental Backup) 、差分备份(Differential Backup)
所谓全备份,就是对整个系统进行包括系统和数据的完全备份。这种备份方式的好处是很直观,容易被人理解。而且当发生数据丢失的灾难时,只要用灾难发生前一天的介质就可以恢复丢失的数据。但它也有不足之处,由于需要备份的数据量相当大,因此备份所需时间较长。
增量备份指每次备份的数据只是相当于上一次备份后增加的和修改过的数据。这种备份的优点很明显:没有重复的备份数据,节省磁带空间,又缩短了备份时间。它的不足之处在于恢复时需要多天的备份数据,如果中间的备份数据损坏,整个恢复有可能导致失败。
差分备份就是每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据。差分备份无需每天都做系统完全备份,因此备份所需时间短,并节省介质空间,它的灾难恢复也很方便,系统管理员只需两盘磁带,即系统全备份的磁带与发生灾难前一天的备份磁带,就可以将系统完全恢复。
1.3.3. 快照
快照(Snapshot)的定义是:关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。快照也是一种定时数据保护技术。
快照的作用主要是能够进行在线数据恢复,当数据卷故障或者文件损坏时可以将数据恢复到快照产生时间点的状态。快照的另一个作用是为业务系统提供了另外一个数据访问通道,当源数据进行在线应用处理时,应用程序可以通过访问快照获取数据,还可以利用快照进行数据备份、测试等外围工作。
目前有两大类快照技术,一种叫做即写即拷(copy-on-write)快照,另一种叫做分割镜像快照。
即写即拷快照是表现数据外观特征的“照片”。这种方式通常也被称为“元数据”拷贝,即所有的数据并没有被真正拷贝到另一个位置,只是指示数据实际所处位置的指针被拷贝。在使用这项技术的情况下,当已经有了快照时,如果有人试图改写原始的LUN或卷上的数据,快照软件将首先将原始的数据块拷贝到一个新位置(专用于复制操作的存储资源池),然后再进行写操作。以后当你引用原始数据时,快照软件将指针映射到新位置,或者当你引用快照时将指针映射到老位置。
分割镜像快照也叫作原样复制,由于它是某一LUN或文件系统上的数据的物理拷贝,有的称之为克隆、映像等。每次应用运行时,都生成整个卷的快照,而不只是新数据或更新的数据。这种使离线访问数据成为可能,并且简化了恢复、复制或存档一块硬盘上的所有数据的过程。但是,这是个较慢的过程,而且每个快照需要占用更多的存储空间。
智能存储层、主机层、SAN网络层都提供快照功能。用户可以在生产系统和容灾系统上使用快照技术保护数据或为应用系统提供数据访问。
1.3.4. 复制
复制(Replication)是目前各类容灾技术中应用最广泛的解决方案。复制技术与备份或快照相比,是实时连续的数据保护,有更好的RPO性能。当变化的数据被写到生产卷、日志或磁盘后,复制技术会实时捕获数据或I/O的变化,然后通过网络传送到另一目标系统,在目标端产生第二份数据副本,成为目标数据。复制的生产数据副本是在线的,当源数据出现错误时,目标数据能立即支持业务系统运行,可极大缩短恢复时间。
复制技术有不同的实现方法,常用的有同步复制与异步复制。
同步复制指的是复制数据在任何时间在多个复制节点间均保持一致。假如复制环境中的任何一个节点的复制数据发生了更新操作,这种变化会马上反映到其他所有的复制节点。同步复制下写操作在生产系统和复制系统同时进行,只有在两端写操作完成后,才能够进行下一个写操作。
异步复制是指生产系统和复制系统两端的写操作独立进行,在复制端会有一定的延迟,生产系统的I/O操作不受异地复制系统的I/O操作影响。为了保证数据传输的次序,异步复制需要一些特殊的排队技术支持来保证数据的一致性和完整性。
同步复制技术可以保证应用的完整性,降低了应用的复杂性,减少了系统响应时间,但是增加了网络负担。异步复制技术在生产端具有很短的响应时间,但比同步复制实现复杂,且不能保证实时。
然而,了解复制技术的弱点也很重要,由于是复制生产数据的任何变化到第二个数据副本,也包括病毒攻击或其他事件造成的数据破坏,这意味连续复制不能避免所有类型的错误。
1.3.5. CDP
持续数据保护(Continuous Data Protection - CDP)是一种数据的连续时间点保护技术,能够捕捉到文件级或数据块级的所有数据写改动,通过提取操作系统的I/O指令形成日志文件,传输到容灾或备份系统。CDP技术可以使用前滚的方式重建任意一个时间点的业务数据,这种容灾技术为灾难后数据恢复提供了更多的选择。
CDP
的原理是提供记录所有历史数据状态的动态恢复日志,它的任意时点恢复的概念,使得在任意时间恢复数据成为可能。其关键之处在于,将每一个应用数据的变化加上了时间索引,并在时间索引上按需产生虚拟时间点镜像。 CDP 的主要作用在于恢复点仅受以秒为计算单位的日志记录间隔的限制。这样,当出现数据丢失、数据损坏或者安全问题时,系统就可以恢复到最近的完好数据。CDP结合了复制与备份技术的优点,既能实时捕捉并传输数据,又能进行历史时间点恢复,代表了这两种技术未来发展并趋于融合的趋势。
在某种程度上说,CDP和快照(snapshot)技术有些相似,但是两种方法又有所不同。快照基本上就是将时间上某点的系统捕获,有点像CDP。两者之间的不同点在于快照是以事件来对待,也许每天一次或者每天两次,或者每小时一次。当一个错误发生时,快照和错误发生时中间的数据就会丢失了,这一点很像传统的数据备份。相比而言,CDP是一个持续的过程,记录了实时的所有活动,并且可以回到之前的错误发生点上。快照通常可以看作是CDP的一个幻灯片(slice)。