“东数西算”时代,海量数据谱写国产数据库新篇章

数字经济时代,数据成为了推动社会发展的生产关键要素和重要战略资源。据国际数据公司、中商产业研究院最新数据显示,中国的数据产生量约占全球数据产生量的23%。不过,国内数据中心市场存在一定程度的供需失衡,算力成本尚不能有效满足普惠发展的需求。为了在数字时代赢得大国间的科技竞争,织就一张高效“算力网”,2022年我国全面启动了“东数西算”工程建设。

今年2月,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。我国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式启动。

“东数西算”工程全面启动

“东数西算”中的“数”指数据,“算”指算力,即对数据的处理能力。算力如同农业时代的水利、工业时代的电力一样,是数字经济发展的核心生产力,是国民经济发展的重要基础设施。

“东数西算”时代,海量数据谱写国产数据库新篇章_第1张图片

图注:数据和算力,是数字时代的重要基础设施

“东数西算”工程每年带动的投资约4000亿元,通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部密集地区的算力需求有序引导到西部,使数据要素跨域流动,优化数据中心建设布局,促进东西部协同联动,助力我国数据中心绿色低碳水平的提升。

在“东数西算”工程中,数据库是为整个算力网络提供基础支撑的核心底座,其中数据的存、算、管、用,都离不开数据库的支撑。可以说,数据库是开启数据资产宝库的金钥匙,是基础软件皇冠上的明珠。

“东数西算”工程意味着,数据要素需要大规模、跨地域的流动,还要满足金融证券、工业互联网、灾害预警、智慧城市“大脑”、政务等宏大的关键业务应用场景需求,这些都对数据管理的高并发、低延时、高可靠、高安全等提出了严苛要求,例如热点数据的高性能存取、数据存储的安全保障以及在满足“算网共生、智能编排”的架构要求上,如何更有效地降低存储成本和能耗等。

海量数据聚焦数据库、数据计算、数据存储产品与服务,是国内首家主板上市的数据库技术领航企业,业务覆盖全国30多个省和直辖市,设立了华北、华东、华南、华中、西南、西北、东北7大售后服务中心,为2000多家大中型行业翘楚提供数据技术解决方案。在“东数西算”工程正式启动后不久,海量数据作为“东数西算”的核心概念股而广受关注。

海量数据为算力网络提供数据库核心底座

在“东数西算”工程中,对数据库的部署有几点共性需求。

  • 一、“东数西算”处理的数据量巨大,要求满足高并发能力。据国家发展改革委发布数据显示,截至今年4月,在全国10个国家数据中心集群中,新开工项目25个,数据中心规模达54万标准机架,算力超过每秒1350亿亿次浮点运算,约为2700万台个人计算机的算力,带动各方面投资超过1900亿元。
  • 二、其次是对低延时的要求。“东数西算”工程要重点推动东数西存(热点区域数据计算、西部备份存储)、东数西训(东部算法仓库、西部离线大数据分析),将实时性要求不高的业务如文档云、掌上保险、开发测试等应用部署在西部节点,促进数据中心集约化、集群化发展。数据要素的跨域流动,涉及到长距离的数据传输和调用,除对网络速度提出了较高要求外,对数据库的低延时、快速响应同样提出了高要求。
  • 三、“东数西算”工程关乎国家数据安全,不仅要选对面向未来的技术路线,同时要保障全栈技术自主可控。

相较于国产数据库赛道上的其他选手,海量数据从技术实力、产品性能、生态伙伴等各方面,拥有综合比较优势。

  • 第一,从技术实力层面看,海量数据在数据库领域积累了15年经验,公司自2007年成立至今,始终坚持自主技术研发和创新。目前,海量数据在北京、广州、南京、天津、西安、成都设立了6大研发中心,技术精英占比超过65%,核心技术人员大多来自于国际主流数据库公司人员。同时,公司设立了华北区、华东区、华南区、华中区、西南区、西北区、东北区7大业务中心,覆盖30个省会及直辖市,为2000多家大中型行业用户提供数据技术解决方案。
  • 第二,从产品层面看,海量数据的产品线包括了Vastbase数据库、Vastcube数据计算、Vastorage数据存储系列。其中,海量数据库Vastbase实现了从架构到引擎等多维度的优化,拥有NUMA架构性能优化、线程并发、CSN事务快照、增量检查点、AI原生、SQL-Bypass六大技术,体现在海量数据库中,就表现为高性能、高并发、高可用、高安全、高兼容、多模态的“五高一多”产品特性。  尤其在高性能方面,海量数据库表现优异。根据国内权威软件评测机构——中国软件评测中心测评结果显示:在两路鲲鹏服务器下,海量数据Vastbase2.0版本可以达到139万的tpmC值;Vastbase2.2版本可以达到154万tpmC值,这是一个表现相当令人惊艳的数字。另外,海量数据库在鲲鹏四路CPU的服务器环境下测试,取得了260万以上的tpmC值。  在高可用方面,海量数据库实现了RTO极致性,以海量数据库在客户比亚迪中的部署为例,实现了RPO=0、RTO<10s的指标,在数采同步等业务模块中,其整体性能较原系统提升了50%。
  • 第三,从自主可控的技术路线看,海量数据库Vastbase G100是基于openGauss内核推出的自主品牌产品。openGauss具备独立演进能力,是华为公司集合了全球11国专家智慧推出的产品,它的源代码放在中国,实现了完全的自主可控,同时建立了健康、繁荣的生态体系。基于以上多种因素,openGauss是面向未来的数据库主流技术,已经成为行业共识。

“东数西算”时代,海量数据谱写国产数据库新篇章_第2张图片

海量数据是openGauss社区理事会成员单位,在该社区的内核贡献排名第二。海量数据的研发费用从2017年的2520万元,提高至2021年的7361万元,年复合增速高达30.73%,同期研发费用率自4.86%提高至17.5%,处于行业领先水平。

“东数西算”时代,海量数据谱写国产数据库新篇章_第3张图片

在生态伙伴方面,截止2021年,海量数据与176家企业达成了生态合作伙伴关系,生态适配中的产品达到312件,产品证书共颁发218个。海量数据先后服务于多家全球500强企业,为数千家大中型行业用户提供产品和服务。

作为数据库技术的领航企业,海量数据将秉承“专注做好数据库”的初心,不断发挥产品和技术优势,积极参与“东数西算”工程建设,为各地算力枢纽节点和数据中心提供高性能、高安全、高可靠的数据库产品、服务和解决方案,助力“东数西算”工程打造数字新基建,促进东西部地区数字经济的平衡发展。

你可能感兴趣的:(大数据)