公募基金核心生产业务超融合转型实践

作者简介

夏岩  英大基金  信息技术部副总经理

毕业于吉大计算机及通信黄埔北邮,二十年金融IT经验,现任英大基金信息技术部副总经理、证监会证券期货业信息技术顾问,主要负责基金企业的IT信息化建设管理及规划工作。

摘要

本文介绍了英大基金 IT 基础架构向超融合架构全面转型的背景、评估过程、部署方案和使用的心得体会,尤其是针对原支撑核心生产业务的小型机加 SAN 存储部分的相关顾虑和针对性的评估和方案设计,希望为业内同行带来参考。

一. 背景介绍

英大基金原 IT 架构一直采用如下业内常见的模式:小型机加 SAN 存储运行核心数据库,x86服务器加 SAN 存储运行其他业务:

公募基金核心生产业务超融合转型实践_第1张图片

图1:英大基金原IT架构图

最初启动超融合架构的原因是英大内部基于政策监管业务需求希望上灾备,并确定了以下几个核心需求:

  1. 方案的 RPO 希望根据监管单位的要求低于5分钟;
  2. 预算有限,希望性价比最高的解决方案;
  3. 由于 IT 部门人员有限,因此希望数据中心的容灾方案维护简单;
  4. 生产和灾备中心基础架构性能方面须支撑核心数据库系统的日常业务压力,且灾备需要具备同等业务处理能力;
  5. 灾备机房计划租用 IDC 机房,空间有限,希望设备越少越好,同时要保证后续扩展便捷;

根据传统灾备中心方案,需要再买一套存储,以及购买存储自带的复制软件,同时需要两个存储同品牌同型号,整体方案比较昂贵,而且开放性,维护和可扩展性都不好。另外,当时 IT 基础架构还存在一些其他的问题,例如:Oracle RAC 还部署在 IBM 小型机上,设备陈旧,考虑设备风险问题及运维复杂问题,希望尽快淘汰 IBM 小机。

因为多年前就听说过超融合架构的分布式存储,并认为这种方案可能会成为趋势,会逐渐替代传统的架构,现在如果花很大代价在传统架构上投入可能很快会被淘汰,所以找到SmartX、路坦力等厂商过来介绍。交流后发现这种架构的优势确实非常多,而且当时产品的成熟度,应用场景的覆盖都比之前有了非常大的提升,所以开始评估是否可以将整体架构升级为超融合架构,并基于此架构构建同城灾备。

二、超融合架构方案评估和设计

相对于传统的方案,超融合架构的优势还是非常明显,例如:

1.基于 x86 服务器的整个 IT 架构和容灾架构都可以被简化,整个系统的可靠性可以进一步提升;

2.可扩展性更好,IT团队可以更快速的满足业务资源交付需求;

3.总拥有成本可以有效降低。

虽然有以上超融合的优势,但因为涉及到公司整体 IT 基础转型,所以团队对可靠性还是有顾虑,基于分布式存储和虚拟化的超融合架构能否真正替代原来的小机加传统存储?毕竟小机的业务转移到超融合架构的案例还不多。

针对以上顾虑,我们从几个方向进行了方案评估和设计的考虑:

1.走访了比较多的基金公司和保险公司等客户了解应用情况,了解到目前超融合应用在生产系统里已经非常普遍;

  1. 通过对超融合产品进行POC,就产品的可靠性、容错能力、性能、功能做了比较充分的了解和验证。
  2. 充分利用已有设备结合Oracle DG 技术在数据库层面做了数据的同步,即针对核心业务,在超融合分布式存储副本的基础上做一个双保险。
  3. 使用基于虚拟化的CDP产品配合超融合构建灾备中心,做到三保险。

最终的方案架构如下:

公募基金核心生产业务超融合转型实践_第2张图片

图2:英大基金现IT架构图

三、超融合架构应用效果

目前英大基金全部生产系统均迁移至超融合平台,包括 O32 系统、估值系统、TA 系统、直销系统、各类 Oracle 数据库 (投资、TA、估值、风控、数据中心)、行情、报盘等,一年来超融合转型的应用效果如下:

  1. 系统性能良好,稳定运行超过一年没有出现问题,基于超融合的新型架构完全可以承载包括原来 IBM 小型机上的业务在内的各种业务;
  2. 整个数据中心只有标准的 x86 服务器和以太网,并且分布式存储在故障自动恢复,扩容数据自动均衡等方面都很智能,运维人员可以从繁琐低效的运维中解脱出来进行新技术调研等更创新的工作;
  3. 机柜空间节省了83%,使用超融合高密一体机,此前生产基础架构所有硬件设备使用的 12 个机柜缩减到 2 个机柜;

公募基金核心生产业务超融合转型实践_第3张图片

图3:英大基金数据中心升级前后机柜空间对比

  1. 整个数据中心的网络也大大简化,以下是升级前后的网络架构图:

公募基金核心生产业务超融合转型实践_第4张图片

图4:英大基金数据中心升级前网络架构图

公募基金核心生产业务超融合转型实践_第5张图片

图5:英大基金数据中心升级后网络架构图

  1. 打通生产集群及灾备集群网络二层架构,通过 CDP 工具实现 RPO 秒级、RTO 分钟级容灾能力,两个集群上虚拟机互相备份,一键切换,极大的降低灾切演练复杂度,这个后面可以专门介绍 ;
  2. 系统的可扩展性很好,上线速度快,这些敏捷 IT 的好处最近有几个实例体现的非常显著。第一个例子是公司着急要启动量化投资的测试,需要火速搭建测试环境,而量化需要高性能服务器,因为我们采用了超融合这样的新型架构,很快就支撑了公司的量化业务。另一个例子,是公司最近要火速上线新业务系统,搭建的测试环境,相当于把生产环境复制了一遍,基于超融合架构,八九台虚拟机非常快就到位了。

四、总结和心得体会

通过在公司超过一年的稳定运行,证明超融合完全可以承载包括核心生产在内各项业务,它的易维护、易扩展、快速上线等敏捷特性也非常符合目前公司金融科技转型的需求,该系统已经在近期扩容,将持续支撑公司业务发展。

最后想说的是,超融合架构虽然已经比较成熟,但产品实现和服务的情况各厂商差别其实很大,一定要选在超融合产品上真正有竞争力的专业产品型厂商,例如国外主要是Nutanix,和VMware,国内的主要是SmartX,国外的产品品牌肯定更强,但价格比较高,本地服务响应速度可能会不够及时,我们综合考虑最终选择了国内专业厂商SmartX,相对来说价格更合理,服务的响应速度也更快,目前结果还是令人满意的。

你可能感兴趣的:(超融合,虚拟化,企业信息架构)