华为云 GaussDB 数据库,会是新的国产之光吗?

华为云 GaussDB 数据库,会是新的国产之光吗?_第1张图片

华为云数据库业务总裁苏光牛


7月20日,华为云TechWave技术峰会上,华为云数据库业务总裁苏光牛正式发布两大数据库新品,包括关系型数据库GaussDB(for MySQL)和非关系型数据库GaussDB NoSQL系列。

 

仅半个月后,GaussDB又迎来了新一轮更新。在华为云TechWave·数据库专题日上,华为云数据库业务总裁苏光牛详细介绍了GaussDB这个华为的战略性数据库产品的来历,并发表了他对于数据库发展的一些看法。


GaussDB数据库升级下的大调整

 

苏光牛谈到,在宣布战略性调整之前,外界还有人在质疑,华为在做数据库的态度上并不坚定,GaussDB算不上是华为的战略性产品。本次发布后,这种质疑很快被打消。

 

其实这从华为对数据库的战略性投入可以看出,比如数据库专业人才的投入和高端专家布局,数据库是人才专家密集型高门槛基础研究,华为有1000+数据库研发专业人才,还有100+布局全球7大区域的数据库内核引擎、算法等高级专家和大咖,这只是数据库的研发人员,并不包含内部为华为云/流程IT/消费者云等数据库底座服务的DBA、SRE运维人员、工具平台开发人员,还有华为云数据库的销售、交付与服务人员;比如数据库研发历史和标杆客户的选择,华为从2007年开始已经持续战略投入数据库超过10年,早在2014年开始就持续和工商银行、招行等头部标杆客户长期联创;再比如华为在生态构建上的战略耐心,数据库是讲究生态的产业,华为不仅积极参与推进数据库产业生态发展,而且注重高校生态、开发者生态等建设,开源和持续运营openGauss社区,积极拥抱开放的生态,如MySQL、PostgreSQL、Mongo、Cassandra等。

 

宣布战略升级后,华为在数据库业务、组织、生态上做了重大调整。

 

a) 业务上:将传统线下数据库的纯软件销售和交付,调整为依托华为云与华为云Stack,以云服务方式持续为客户服务,加持云后一方面提升交付与运维效率,帮助客户聚焦核心业务创新,同时为客户持续带来创新技术和新服务。

 

b) 组织层面:将华为数据库研发组织融合,统归华为云BU和2012高斯实验室,统筹数据库战略与布局全球七大区域11个研究所的1000多数据库专业人才,力出一孔,持续打造世界级数据库。

 

c) 生态方面:华为2020年6月30日开源openGauss社区版本并持续运营,与合作伙伴、高校、开发者共同繁荣生态。同时,华为将鼓励有能力的合作伙伴推出基于openGauss的数据库,旨在和业界共同繁荣数据库产业生态。


GaussDB数据库的前世今生


GaussDB(for MySQL)、GaussDB(for Cassandra)、GaussDB(for Mongo)从2019年Q4开始公测并在少数内外部大客户项目,如华为消费者云与WeLink、某大型保险公司、国家某部委等试点商用,优化数据库性能和高可用性后,于2020年7月份正式上线规模商用。

华为云 GaussDB 数据库,会是新的国产之光吗?_第2张图片

据苏光牛透露,未来华为云还将推出GaussDB (for Redis)、GaussDB (for Influx)等系列新服务。

 

这次,华为云在品牌命名上统一归到GaussDB,代表华为数据库品牌,立足创新与自研,基于同一架构,一方面拥抱并兼容MySQL等生态,另一方面打造自己的openGauss生态,主要面向政企客户,强调高性能、高可靠、高安全等方面诉求,给客户一个清晰明确的定位认知。所以,GaussDB(for MySQL)并不是简单的改名,而是在融合后,基于架构优化和改进后,结合品牌调整的结果。

 

调整后的GaussDB数据库云服务包含关系型数据库GaussDB(for MySQL)和非关系型数据库GaussDB NoSQL系列,支持文档类型(MongoDB)、宽表类型(Cassandra)、时序(InfluxDB),K-V(Redis)等多协议接口。

 

如今,最新版本的GaussDB系列产品实现了很多技术上的更新和迭代。

 

GaussDB(for MySQL)基于华为最新一代DFV分布式存储,采用计算存储分离架构,支持1写15读的只读节点的极速扩展,最高支持128TB的海量存储,可实现超百万级QPS吞吐,单节点相比原生MySQL性能提升7倍,业界第一。

 

GaussDB系列数据库支持NDP(near data process)技术,可以让计算和数据进行融合,加速数据的处理,从而大幅提升整体的性能;GaussDB NoSQL拥有极强的多模数据管理能力,在并发读写能力、扩容时间缩、故障重构时间、备份效率、恢复效率等方面也都实现了业界领先,相比纯开源软件能力有了质的飞跃。

 

不断完善的工具生态

 

对于开发者来说,有什么好用的工具是他们很关心的问题。

 

苏光牛介绍到,目前华为的数据库工具服务统一支持开源数据库服务和自研GaussDB数据库服务,当前成熟商用的有为客户提供上云的数据复制服务DRS、数据管理服务DAS、分布式数据库中间件DDM,同时下半年还会发布数据库和应用迁移工具。

 

其中,数据复制服务DRS能实现在线数据的迁移,业务切换微中断,业务切换时间可以自由选择,同时还能跨数据库版本热迁移,给出迁移/升级后直观的性能评估报告,从而让客户的原数据库切换到华为云上更加简单、安心;数据管理服务DAS可提供便捷的云上数据库管理与运维服务,核心能力包含数据库查询与开发、运维监控、性能诊断、SQL调优、数据安全管控、智能参数预测等;分布式数据库中间件DDM与RDS结合,把当今成熟的水平扩展分布式数据库能力,以单个数据库实例的访问体验,带给普通用户。保证SQL运算及事务能力,存储和计算层几乎无限扩展。 


替换IOE数据库将是个长期的过程

 

GaussDB的推出,让互联网厂商去IOE,数据库国产化的讨论和呼声再次热烈起来。

 

在苏光牛眼中,数据库国产化的机遇是否已经成熟?要走出一条不同于国外主流数据库厂商的路,中国要怎么走?

 

苏光牛坦承,逐步替换迁移IOE将是个长期的过程,至少未来3年内是这样。

 

为什么大家要放弃用惯了的主流数据库产品,要进行替换迁移?

 

他认为,厂商迁移数据库的核心原因,一是传统scale-up的扩展能力无法满足客户业务的需求、面向互联网+创新等业务,客户需要从集中式转向分布式云化的部署,在迁移到华为云数据库之前,客户主要采用的数据库大多并非一种,而是多种数据库产品结合,比如在金融行业传统核心账务系统,大的银行多使用IBM大机+DB2,这样做的封闭系统扩展能力较弱,且维护费用相当高,未来运维也是问题,所以,未来大机逐步下移会是一个趋势,但需要一个过程。

 

其次,厂商普遍达成了共识,需要业务和数据库一起来进行优化和调整,才能达成目标。

 

再次,互联网的去IOE和其它行业的去IOE挑战不太一样,从完美sharding的分片到复杂查询的场景,数据库的能力需要在严苛的标杆客户场景得到联创验证和孵化,同时要能联合为客户兜底应用的ISV,自身提供完善的系列工具迁移/运维/管理打消客户疑虑,真正地为客户做到平滑迁移。

 

这意味着,数据库国产化是一个循序渐进的过程,不可能一蹴而就。目前国产数据库还不够成熟,要提高国产数据库服务水平,打破Oracle、IBM、微软等国外数据库产品的包围,就需要走一条不同于它们走过的道路。


这条道路应该怎么走?从哪些层面着手?苏光牛有自己的思考。

 

他说道,一方面,华为云积极拥抱并完全兼容和支持业界主流的关系型数据库生态,如MySQL、PostgreSQL及非关系型数据库 MongoDB、Redis等生态,比如openGauss对外开放,避免让客户从封闭的Oracle走向另外一个封闭的“新的Oracle",而是与更多“同道中人”一起解决缺陷。

 

“因此, 华为云GaussDB数据库全面满足不同客户的需求,在架构、软硬件协同方面自主研发,同时生态兼容开放,而非仅支持自有生态,这才是我们认为的真正符合客户需要的国产数据化产品。数据库是需要长期持续战略投入和孵化门槛很高的产品,华为在数据库领域持续研发投入已经超过10年,金融行业和电信运营商这2个行业就是对数据库稳定可靠、性能等各方面要求极为苛刻的典型行业,有上亿用户和高并发海量交易等丰富的应用场景,这些场景的实践帮助GaussDB数据库快速孵化提升了能力,也完成了对世界顶级数据库的替换。”苏光牛说。

 

这一席话并非空谈,而是有数据作为支撑。据华为提供的数据显示,华为云数据库2019年外部收入相比2018年外部收入实现高达400%的增长,GaussDB系列数据库产品已涵盖关系型和非关系型数据库场景,广泛应用于金融、泛政府、电信、能源、交通、医疗、物流、电商等行业。


数据库发展方向与趋势

 

过去几年,传统数据库市场份额一直在被不断冲击,而云数据库的增长潜力巨大,GaussDB数据库转向云端,就是顺应数据库云化趋势的典型案例。

 

对于云数据库未来发展方向,苏光牛判断,云数据库将向着云原生、分布式、多模、智能化等方向发展。而一个好的云数据库产品,至少应该具备以下几个特点:

  • 高可靠:交易型数据库的首要因素是数据库的可靠,GaussDB基于DFV的分布式存储,数据的可靠性高达11个9;

  • 高性能(支持高吞吐强一致性事务能力):如GaussDB(for MySQL)相比开源,性能从15万QPS提升到100万+级别OPS。

  • 高可用(同城双活实现集群内HA,数据不丢失,业务秒级中断;同城跨AZ容灾,数据不丢失,分钟级恢复;还有两地三中心高可用):如GaussDB(for MySQL)实现数据0丢失,故障闪恢复。

  • 高扩展(计算与存储分离弹性伸缩、容量和性能按需水平扩展):如GaussDB(for MySQL)相比开源,从1写3读提升到1写15读。

  • 高安全:用户数据上云后,数据不仅在存储层是静态加密,在计算态也是加密的。(华为全密态的黑科技揭秘发布在9月23日HC大会数据库专场session)

  • 易用性:首先要有完整的工具生态支持迁移/运维/管理无忧。面向未来,通过将AI融入到数据库内核架构和算法中,来降低云数据库的运维管理及开发调优成本,逐步实现数据库自调优、自诊断自愈、自运维能力。当前,AI参数自调优技术已经开源到openGauss社区,同时,在基于AI的SQL调优、故障诊断领域GaussDB也在重点投入,目标是最终实现数据库智能化。

 

GaussDB的出现,让我们看到了国内厂商实现数据库国产化的努力,从 0 到 1 是一个巨大的挑战,从 1 到高精尖,更是一个艰难的蜕变过程。希望在未来,搭乘大数据、云计算、物联网、5G通信等新技术的东风,国内厂商能够消化、吸收和借鉴国外领先的数据库技术和思想,以及自主创新的方式,让市面上出现更多符合中国人使用习惯的数据库产品!


点击阅读原文,回顾会议直播。

你可能感兴趣的:(华为云 GaussDB 数据库,会是新的国产之光吗?)