澳大利亚国家电力公司数据复制容灾应用_shareplex

1.1         澳大利亚NEMMCO公司利用SharePlex实现应用系统失败接管

澳大利亚国家电力市场管理公司(简称NEMMCO)是一家从事电力经纪交易的公司。应用SharePlex高可用性解决方案避免了总值80亿元市场交易活动的中断,保证了业务交易的连续性。通过与其它复制技术进行对比测试,SharePlex显示出了优越的性能,使NEMMCO公司的失败接管时间由原来的3小时以上降低为不到30分钟,而且不损失任何数据。

业务挑战

NEMMCO公司整个交易管理系统包含12个大型生产数据库,同时运行60个应用。每个数据库存储 130G 数据,每小时产生 250M Redo Log日志。

这些数据库用于向公司内部和外部客户发布有关电力价格、市场统计数据、电力派送、报表、结算和计费等方面的信息。

如果系统的停机时间超过30分钟,NEMMCO公司就不得不中断整个交易活动。一旦系统恢复,公司需要赔偿客户在停机期间所收遭受到的损失。

为了确保管理系统的安全性,NEMMCO公司也需要改变他们整个生产环境的地址,这就要求有一种灵活的解决方案能够实现多场点和多服务器之间复杂的复制。

“由于业务非常关键,我们需要一种功能强大和可靠的复制工具来帮助完成多场点之间大量数据的移动,并且延迟时间少于30秒。” NEMMCO公司数据库开发组经理Kris Downey说。

由于目前的失败接管方案需要3小时以上的时间,因此NEMMCO公司需要寻求其它方案使得不同场点间的失败接管和维护工作在30分钟之内完成,以避免中断交易活动。

Quest解决方案

NEMMCO公司非常熟悉SharePlex解决方案,在此之前已经使用了三年SharePlex用于维护其报表数据库实例。NEMMCO公司同时对OracleAdvanced Replication OAR)和SharePlex进行评测。在评测过程中发现SharePlex能够满足性能要求,而Oracle的解决方案在其Oracle 7.3.4 数据库上不稳定,难于维护并且不能满足数据同步要求。

NEMMCO公司将SharePlex的多种复制策略相结合来管理电力交易中的数据。利用SharePlex实现了不同平台、不同Oracle数据库版本和操作系统之间的复制,同时也利用SharePlex的复制功能实现不同场点之间的灾难恢复。

SharePlex每天在不同场点之间的主数据库之间复制 6G Redo Log数据,在报表和结算计费数据库间复制 3G 数据。NEMMCO公司利用SharePlex来维护一个报表数据库实例,从而减轻了对主数据库资源的消耗。

应用SharePlex不久,NEMMCO公司的报表数据库服务器发生故障,导致其上运行的SharePlex进程被停止。在发现和更正错误后,主数据库上SharePlex已经保存了48小时的日志数据。但报表数据库上的SharePlex被重新启动后,只用了不到两小时时间就将保存的日志处理完毕,又利用5分钟实现两个数据库的同步。NEMMCO公司也经历过其它类似的故障,如系统停机20个小时,但利用SharePlex30分钟内就完成了恢复工作。

SharePlex可以快速实现数据同步,比其它方案都要快,而在从前,如果发生故障,要想把系统重新同步是件非常困难的事情。Oracle的复制方案无法满足性能要求,但SharePlex可很好地实现我们的管理目标。” Downey说。

NEMMCO已经将SharePlex应用于极其复杂的失败接管环境中。接管过程由80步组成,包括确保应用正常执行、文件服务器保持最新数据、按特定顺序启动和停止应用程序以及接管内部和外部网络访问等。

“一旦失败接管过程结束,即应用在备用场点启动和运行,SharePlex就可快速和准确地在不同场点之间以及向其它数据库复制数据。” Downey说。

收益及投资回报

SharePlex非常可靠和灵活,可以满足公司关键业务的需求。“如果需要为报表数据库实例实现有效和高速的复制,或者在多场点之间实现高可用性和高效的失败接管方案,建议你采用SharePlex。” Downey说。

SharePlex可以确保NEMMCO公司实现其30分钟内完成失败接管的目标。利用SharePlex,目标系统和源系统间的延迟在2秒到10秒之间,大大低于其30秒的目标。SharePlex在复制过程中也只消耗很小的CPU资源,不影响系统和应用的性能。

SharePlex帮助NEMMCO公司确保当一个场点失效时,其它场点能够快速地进行接管,用户的交易活动不受到影响,整个市场的业务也无须中断。

SharePlex允许我们重新定位结算和计费处理到其它的服务器上。这使资源得到了合理的利用,防止了结算和计费处理冲击正常的交易业务处理。” Downey说。

“利用SharePlex之前,每一次有计划或意外停机所需要的恢复时间都超过3个小时,从而不得不中断市场交易。” Downey谈到。“如果我们的系统停机时间超过30分钟,我们就不得不中断整个交易活动,而且需要赔偿客户在停机期间所遭受到的损失。我们选择SharePlex是因为它是可靠的、灵活的解决方案。更为重要的是,它可以满足我们少于30分种失败接管时间这一需求。对于这一需求的满足意味着公司将节省大量开支。”

关于NEMMCO公司

NEMMCO公司成立于1996年,由澳大利亚首都和新南威尔士、昆士兰、南澳大利亚及维多利亚地方政府共同创建,负责管理和运营世界上最大的国家电力交易市场。通过在布里斯班、悉尼和墨尔本设立办公室,NEMMCO公司的目标是为国家电力交易市场的有效运营提供基础平台保障,同时也负责维护电力系统安全和协调电力系统计划和电力传输。

 

你可能感兴趣的:(休闲,容灾,电力,Shareplex,数据复制)