GaussDB是华为自主创新研发的分布式关系型数据库。该产品具备企业级复杂事务混合负载能力,同时支持分布式事务,同城跨AZ部署,数据0丢失,支持1000+的扩展能力,PB级海量存储。同时拥有云上高可用,高可靠,高安全,弹性伸缩,一键部署,快速备份恢复,监控告警等关键能力,能为企业提供功能全面,稳定可靠,扩展性强,性能优越的企业级数据库服务。
我们都知道GaussDB,如果不去了解GaussDB的话,还真不知道GaussDB竟然有众多分枝,这里简单介绍一下GaussDB家族成员,以便各位小伙伴可以更好的了解GaussDB以及选择自己喜欢技术方向。
成员如下:
GaussDB(for openGauss)
GaussDB(for MySQL)
GaussDB(for Cassandra)
GaussDB(for Mongo)
GaussDB(for Redis)
GaussDB(for Influx)
关系型数据库:
基于openGauss生态的分布式数据库GaussDB(for openGauss)
基于MySQL生态的分布式数据库GaussDB(for MySQL),100%兼容MySQL
非关系型数据库:
基于文档的分布式数据库 GaussDB(for Mongo),100%兼容MongoDB的接口,解决了开源的协议风险,用3副本解决9副本的可靠性
基于时序协议的分布式数据库 GaussDB(for Influx),解决了开源主备的容量问题
基于宽表Cassandra的 GaussDB(for Cassandra),解决了Java方案的GC抖动的严重问题,数据强一致
基于KV接口GaussDB(for Redis), 当前100%兼容Redis,未来可以兼容更多的KV协议,数据强一致,超大容量10T+,解决了开源主备脱节等问题
这里面有可能小伙伴们会问了,GaussDB for openGauss 那与开源社区里面的openGauss是什么关系,以及国内各大企业发布基于openGauss内核版本数据库又是什么样的关联呢?
首先呢国内各大企业基于openGauss发行的商业版数据库,主要针对社区版本进行企业级特性增强、增加兼容各大主流数据库以及周边配套工具使用,完善整个生态,方便各大企业选择。
其次开源社区版本在易用性、配套能力等方面较弱,需要不断维护,而且一旦遇到数据丢失问题,很难快速恢复,造成的损失不可估量。也因此,开源数据库上云只能解决中小企业的简化部署、运维、调优、极致性价比等诉求。
再次GaussDB(for openGauss)是华为深度融合多年数据库领域经验,充分结合企业级场景需求,基于openGauss自研生态推出的企业级分布式关系型数据库。在支撑传统业务的基础上,持续构建竞争力特性,为企业面向5G时代的挑战,提供了无限可能。
这里就不再卖关子啦,简单一句话:其实GaussDB for openGauss可以采用主备、分布式部署,开源社区openGauss是GaussDB for openGauss的一个分支,或者说型态。
接下来我们简单了解一下GaussDB for openGauss 架构及相关特性
GaussDB for openGauss分布式形态整体架构如下:
GaussDB(for openGauss)统一基于数据分片的分布式架构(share nothing),底层数据通过一定的规则比如hash、list或者range等让数据打散分布到不同的数据节点上,计算时底层多个节点共同参与计算。同时数据节点可以扩展,上层由协调节点进行SQL解析和转发。
从图中可以看到,主要包括三类节点:协调节点、数据节点、集群类节点(最重要的是全局事务管理器)。协调节点负责SQL解析转发,充当的是类似proxy的角色,数据节点负责计算和数据存储,全局事务管理器负责全局事务读一致性的保证。
这种架构为GaussDB(for openGauss)构建了以下核心优势:
① 极致高可用: 两地三中心架构,跨Region数据实时灾备
② 数据安全: 实现跨AZ部署数据强一致性,保证数据0丢失
③ 高扩展性:容器化部署,性能容量按需水平扩展,高达1000+节点
④ 性能强劲:鲲鹏2路服务器,32节点1200万tpmC(华为内部测试)
⑤ 全栈软硬自研可控:业界领先的鲲鹏+openGauss自研开放内核
为了方便大家更好理解GaussDB(for openGauss)的技术运行状态,下面将对GaussDB(for openGauss)一些关键角色进行介绍:
关键技术特性:
高性能——分布式执行框架
高性能——分布式事务处理性能,GTM-Lite技术
高可用——多层级冗余实现系统无单点故障
高可用——跨AZ/Region容灾技术
高扩展——Scale-out在线横向扩展
华为云GaussDB for openGauss数据库定位为企业级云分布式数据库,架构上着重构筑传统数据库的企业级能力和互联网分布式数据库的高扩展和高可用能力。
主要应用场景:
交易型应用
大并发、大数据量、以联机事务处理为主的交易型应用,如政务、金融、电商、O2O、电信CRM/计费等,服务能力支持高扩展、弹性扩缩,应用可按需选择不同的部署规模。
详单查询
具备PB级数据负载能力,通过内存分析技术满足海量数据边入库边查询要求,适用于安全、电信、金融、物联网等行业的详单查询业务。