从350万行代码到1500万行,openGauss开源这三年

从350万行代码到1500万行,openGauss开源这三年_第1张图片

摘要:开源三年,代码总行数从350万行增长到1500多万行,这意味着openGauss功能丰富性、社区活跃度以及生态建设在不断发展壮大……

openGauss社区技术委员会主席李国良在接受老鱼采访时表示,openGauss内核180万行代码,其中155万行是自研的,自研率超过86%,剩下的25万行代码是为了兼容性保留的接口和公共函数代码openGauss在核心技术、性能优化和功能方面已经进行了深度的修改和增强。目前,openGauss内核每年新增40-50万行代码,李国良说。

据老鱼了解,openGauss的未来发展重点并非PostgreSQL兼容,反而是增强Oracle和MySQL的兼容性,因为,这将有望扩大其在数据库市场中的受众和应用范围。

这也反映出openGauss的愿景,即成为一个功能强大且具有广泛兼容性的数据库,能够满足不同类型和规模的应用需求。与此同时,保持与PostgreSQL的基本兼容性仍然有助于吸引那些熟悉PostgreSQL的开发者和用户。




openGauss的开源历程

2019年9 月 19 日,在华为全联接大会上,华为宣布将开源其数据库产品,开源后命名为 openGauss。

2020 年 6 月 30 日,华为兑现了这一承诺openGauss 正式开源,并成立openGauss开源社区,社区官网(http://opengauss.org)同步上线。

2021年3月30日,发布LTS版本,之后规划每6 个月一个小版本,每1年更新一个大版本,版本生命周期暂定3年。

目前,openGauss已经进入到5.0.0版本。

华为开源openGauss背后有着怎样的思考?当时,华为官方新闻稿显示,是希望通过开源的魅力吸引更多的贡献者,共同构建一个能够融合多元化技术架构的企业级开源数据库社区。

在老鱼的文章《黑马openGauss,能否一黑到底?》中,江大勇,openGauss社区理事会理事长,提供了关键见解。他强调了数据库的重要性,将其比作基础软件领域的皇冠上的明珠,并指出它是国内基础软件发展的最大挑战之一。

江大勇进一步解释了数据库开发的挑战。独立研发数据库内核需要长时间的开发周期和大量的人力资源,需要持续的长期投入。然而,如果采用通用的开源数据库,往往在性能、可靠性和安全性等方面难以满足企业级的需求。

中国数据库领域多年来投入了大量资源,但仍未能取得特别成功的突破。因此,华为选择通过开源的方式来向产业界开放其多年来在数据库领域积累的企业级能力,以此为基础构建生态系统,这被认为是数据库产业高效、稳健发展的有效模式。

江大勇明确了openGauss的战略,即专注于构建“高性能、高可靠、高安全、高智能”的数据库内核,并与合作伙伴合作,完善企业级特性,以实现逐步的商业应用。这一战略旨在满足企业对数据库的高要求,从而推动openGauss的商业化发展。




openGauss三年开源征程

开源三年来,openGauss取得的成绩令人印象深刻。数据显示,其用户社区已经从200多人壮大到接近5000人,增长超过20倍。代码总行数从350万行增长到1500多万行,增长了4倍多。这些数据反映了openGauss的快速发展和社区的壮大。

除了数据方面的亮眼表现,openGauss在多个关键领域也展现出了显著的竞争力。它不断推陈出新,提高了数据库性能和安全性,同时积极加强社区治理。

openGauss研发总监蔡亚杰告诉老鱼,在产品竞争力方面,openGauss一直注重内核持续创新,以构建核心竞争力。它紧跟多样性计算演进的趋势,以及数据库多模融合的需求,通过架构创新不断突破技术壁垒。openGauss的目标是通过内核和架构的双引擎驱动,提供坚如磐石的数据库基础技术。

例如,在架构方面,openGauss以用户需求为中心,推出了DataPod + DataKit组合,为构建全新的数据底座铺平了道路。DataPod涵盖了计算池化、内存池化和存储池化等三个层面,软硬件协同工作,全面优化,最终实现了全栈可观测、可追踪和性能最佳的资源池化架构。计算池化更是实现了32节点2100万tpmC的性能,存储池化则提高了存储效率50%,内存池化则实现了多节点数据的实时一致性。

此外,DataKit已经支持了100多个库的批量并行迁移,以及837个MySQL语法特性,其中包括每小时在线迁移1TB数据的全表并行迁移,其迁移效率在业界处于领先地位。

在内核竞争力方面,openGauss围绕高可用、高安全、高智能和高性能持续努力。它提供了高度灵活的两地三中心部署方案,已经在邮储银行等大型机构中得到验证。在安全方面,它实现了全密态方案,支持数据的端到端加密。在智能方面,openGauss支持AI4DB和DB4AI功能,使数据库能够自我调优、自我维护,同时还通过库内AI算子实现了SQL的自动生成,大幅降低了开发者学习AI的门槛。

在商业方面,openGauss通过多样化的版本形态,每年发布两个社区发行版,同时孵化商业发行版和行业自用版,加速了openGauss数据库技术在各行各业的落地应用。目前,openGauss已经广泛用于国计民生领域,取得了商业应用的成功实践。

蔡亚杰充满信心地表示,今年openGauss有望在非云集中式市场份额突破20%,迎来生态拐点,这对于openGauss将是一个重要的里程碑点。

在社区治理方面,openGauss秉承着共建、共治、共享的理念,通过全产业链的协同创新,快速培育了数据库的生态系统。在2021年,社区成立了社区理事会,并在年底升级了社区理事会和技术委员会。在2022年,openGauss还成立了品牌委员会和用户委员会,通过不断完善社区治理架构,促进了社区的快速、高效发展。




未来展望

未来,openGauss将继续布局在前沿技术领域。包括向量数据库的落地,以支持大模型的存储和计算需求。这将使openGauss更好地满足人工智能和大数据领域的需求。同时,openGauss不仅关注自身的发展,还积极参与中国国产数据库的未来规划,蔡亚杰说。

随着行业数字化转型逐渐深入,中国数据库厂家数量已经超过200家,导致市场碎片化严重,蔡亚杰表示,他看好国产数据库的未来,但未来中国数据库技术路线一定会收敛,国产数据库的市场占比会逐步提升,发展也会越来越好。

在谈到,openGauss在国产数据库发展中所扮演的角色时,蔡亚杰说,openGauss在国产数据库发展过程中扮演着重要的角色。作为一个开源项目,openGauss为开发者提供了一个开放的平台,为用户提供了高性能的数据库解决方案。同时,它也是中国开源社区的一部分,共同构建了一个强大的开源生态系统。

openGauss的崛起和开源之路,不仅代表着中国数据库技术的崭露头角,也反映了中国开源力量的崛起。openGauss的发展反映了中国数据库的未来,它代表了自主可控、自主创新的重要力量。

目前,openGauss已经成为一个有竞争力的数据库解决方案,它的未来充满了无限可能。



你可能感兴趣的:(openGauss,数据库)