探寻电子邮件归档的解决方案

--Symantec Enterprise Vault

罗庆超

随着信息技术的不断发展,电子邮件已经成为不可缺失的通信和信息共享方式,伴随着邮件这类非结构化信息(unstructured information)的迅猛增加,对这些数据的保护和管理也备感压力;看着那反映迟钝体态臃肿的邮件客户端软件,那堆积如山的邮件,你是否会感到头疼?

对对于公司来说,电子邮件也都被视为至关重要的数据。因此,当人们期望电子邮件每周7天保持全天候可用性时,企业应当如何保护其电子邮件数据呢?如果法律规定IT部门必须能够找到与上季度收入相关的文件和电子邮件,企业又该如何满足这些要求?这对于企业的IT管理部门来说,面临着严峻的挑战。

而Symantec Enterprise Vault(EV) 软件却可以轻松应对上述需求,为你提供一整套针对邮件系统而设计,从存储--安全--归档的解决方案;下面就为你揭开EV的神秘面纱,展示那美妙卓绝的风采。

一、技术应用场景

EV是针对非结构化信息而设计的长期使用、易于扩展的系统,除此之外它还能够广泛地支持各种存储设备,实现信息的长期保存。EV架构的设计框架,能够和多种信息源相结合 (比如Exchange, SharePoint, 文件系统, 或者其他应用) ,通过商务加速器 (Business Accelerators, BA) ,为组织或者用户搜索归档信息提供无缝集成技术。EV在使用基本存储设备外,还使用二级存储或者三级存储;通过这样的分级存储机制,从而实现应用的信息生命周期管理。通常来说,EV可以应用在如下环境中:

A) 应用存储管理 -- EV能够做对旧的数据项作在线归档,根据用户定义的 策略将它从基本应用存储(Primary Application Storage,如Exchange) 中迁移,并控制存储邮件的大小;从而使Exchange能够集中力量,动态处理进入的邮件,并访问更多最近常使用的数据项。

B) 法规遵从保护和恢复 -- 很多组织都需要长期保存所有电子信息,如电子邮件,共享文件,SharePoint和及时消息等。EV可以和Exchange的日志协作,根据法规需求,将数据项保存起来,并保护一定的时间。

C) 升级迁移和整合 -- EV能够减少Exchange的存储需求,也就是意味着在服务器上能够支持更多的用户,从而达到服务器的整合。例如,控制邮箱大小能提高Exchange系统的整合能力;除此之外,通过缩减基本存储,并将大量的数据放到EV中,从而最小化迁移或者升级过程中的痛苦。

D) 知识利用 -- 通常情况下,EV针对个人和企业数据扮演着“信息仓库”的角色,通过内建的索引和搜索技术,可以实现数据挖掘。某些特别用途的产品,比如EV遵从和恢复加速器(Compliance and Discovery Accelerators),提供了法规遵从和法律恢复问题的解决方案。

E) 可操作性的优异表现 -- EV针对应用的优秀操作性,体现在备份的服务层级协议 (Service Level Agreements , SLA)方面;像Exchange应用,它的信息量在急剧增加,许多企业都在寻找方案来满足恢复时的SLA需求。随着将大量的数据从Exchange中迁移出来,从而能够规划和归档SLA。

因此,可以说,EV针对邮件系统提供了一套优秀的解决方案,来满足企业的不同需求。

二、探寻技术内幕

EV采用了一种归档框架,其目的是为企业提供一种“针对非结构化信息创建数据仓库”的方案;此框架包含四层,每一层完成特定的功能,如下图-1所示。

探寻电子邮件归档的解决方案 --Symantec Enterprise Vault_第1张图片

图-1 EV设计框图

A) 通用访问层 -- 提供各种服务,允许用户和企业访问归档文件。

B) 开放存储层 -- 保证EV能够支持各种存储设备,从而扩展生命周期管理。

C) 核心Vault服务 -- 是EV最根本的功能,提供基于策略、可扩展性强的归档能力。

D) 信息源 -- 提供各种组件,针对各种应用完成归档信息进行处理。

由于采用了分层结构,每一层完成各自的功能,从而提供了无限的灵活性,其中不同的组件还可以一起相互合作。EV的核心,就是针对框架中的各种操作提供服务,它通常运行在一个专用的服务器上。EV的单一安装就可以支持多个目标系统,也可以是混合类型;一般情况下它采用LAN进行访问,WAN连接也是可行的,并采用“离线”功能来优化性能。在目标系统上无需安装额外的软件,对于Exchange系统来说,采用MAPI来访问;从而当EV执行归档时,EV就是Exchange的访问用户。

三、特色介绍

3.1 扩展性

EV设计的一个重要目标就是扩展性,其架构中的多个部分都是为此目标而设计。扩展性不仅指一个初始化Vault配置能够支持不同数据大小的客户场景,同时也能满足客户需求的动态增长。它采取构造块组件方式设计,由特定功能的服务组成,包含不同的服务代理,例如根据不同的数据源而设计的归档代理、针对数据项的存储代理、用于索引的代理、以及恢复Exchange邮件的恢复代理等;图-2就是针对邮件应用的构造块组件框图。

探寻电子邮件归档的解决方案 --Symantec Enterprise Vault_第2张图片

图-2 构造块组件框图

3.2 存储独立性

EV设计中的另一个关键点就是存储独立性,它的所有数据项都存储在NTFS文件中;由于各种存储技术的硬件都可以被作为NTFS卷,从而实现存储独立性。因此EV可以用于磁盘存储、光纤存储、磁带、SAN或者NAS平台,其中的数据项采用了压缩技术,并且相同的项采用单一实例存储,从而节约存储开销。

3.3 存储和索引

EV的核心包括存储和索引服务,它们紧密接合。所有EV的归档项,都被放到存储服务的队列中,并进行索引服务。此索引服务,封装了AltaVista引擎;被选属性(特别是邮件属性) 通常都会被索引,而内容 (邮件头和附件) 则是可选择索引;如果附件可被Stellant(以前的INSO) 转化为文本,那么它也是可被索引的;此转换功能支持大约200个不同的文件类型。

3.4安全和可靠性

另一个重要的设计目标就是数据可靠性。该设计的目标,是为了解决任何系统的组件失败时也不会引起数据丢失。因此,在发生故障时EV会保存数据项两次,而不会丢失它,这一点非常重要;例如从Exchange移动数据到EV时,不会有数据丢失的危险。它引入了事务的方法来处理,只有当数据项被成功写入到EV后,才将它从Exchange中删除;如果有额外的安全需求,那么会等到EV被备份或者被复制时,才会删除。

而用户认证采用windows标准的用户登陆机制。如果未授权的用户希望访问EV相关组件,此时会要求用户采用合适的方法访问。同时EV维护有自己的访问列表,它将认证用户和它能访问的数据进行映射。在EV中采用文件级的同步访问权限,比如Exchange中的邮箱和公共文件夹,它们的归档访问权限和其目录是一致的。

3.5 知识利用

EV能够存储非结构化数据,不仅让企业减少存储应用的TCO,并且减少存储数据的风险;EV的通用访问层分离出两种不同的利用类型:用户利用和企业利用。

对于用户利用,主要提供无缝的访问能力,而不用担心归档在何候发生。而对于企业利用,往往采用不同于用户利用的方式;扩展性和审计性对于企业来说,更为重要;EV的商务加速器提供了各种工具,来满邮件的管理、搜索和恢复需求;所有的这些加速器都以如下三个主要功能为基础:

A) 搜索 -- 由于EV中的所有信息都是被索引的,因此这些信息能够被很快的查找出来;也许在备份中需要几周才能够找到的信息,在EV只需要几分钟。

B) 工作流(Workflow):企业搜索可能需要许多人的参与并且需要很多天的时间才能完成。例如,检查过程 (review process) 就是搜索的一部分,同时需要不同权限的用户来加入到搜索过程中;但是商务加速器 (Business Accelerator) 可以最小化搜索成本,使在整个检索过程中,搜索都被包裹在工作流过程(workflow process)里。

C) 审计(Audit):许多法规都规定整个过程都应该是可审计的,从而在整个过程中涉及人员的操作都可以得到确认。

四、总结和展望

EV是一款非常卓越的软件,它集成Exchange、SharePoint、IM以及文件系统,提供了一种很好的解决归档方案。它能自动的将内容归档到低成本的在线存储(online stores)中,并提供信息生命周期管理能力,能够实现管理保存、存储、迁移和最后删除。它消除了用户和管理员进行邮件管理的负荷,在恢复久的邮件时可以显著地节约时间,同时优化了邮件附件内容的管理,满足各种规则和法律的需求。总的来说,其主要卖点为:

A) 灵活多变、易于扩展、富有弹性的构造块式架构设计;

B) 允许企业使用最为合适的存储技术,其开放存储层允许采用存储虚拟化技术;

C) 允许企业级的索引,并针对索引的不断增长提供监控和管理能力;

D) 提供完整的安全归档。所有对归档数据的访问,都是依据Windows的认证机制,同时提供审计能力;

从目前的用户报告结果,EV对于Exchange恢复来讲,在服务水平上有极为显著的提高,同时能够针对Exchange提供快速的投入产出比 (ROI) 并降低总体拥有成本 (TCO)。目前EV的版本是7.0,它的功能已经得到广泛的验证;在国外早已经如火如荼,尽管在国内还不为人所知;但是可以相信,在不久的将来,EV之火终将在中国的土地上燎原。