群雄逐鹿,酣战墨坛。 2023年6月的 墨天轮中国数据库流行度排行 火热出炉,本月共有273个数据库参与排名。本月排行榜前十变动不大,可以用一句话概括为:OTO 组合连续两月开局,传统厂商GBase南大通用乘势而上,其余数据库暂居原位。
本月排行榜解读文章 「专家观点」 板块邀请到科大讯飞技术中心运维部高级DBA专家,Oracle ACE,中国数据库联盟核心伙伴/MVP,中国Oracle用户组(ACOUG)核心成员戴明明解读本期排行榜。
图1:2023年6月排行榜TOP10得分详情表
一、巨头齐聚竞前十
在本月排行榜前十中,除了传统中国数据库厂商 GBase南大通用反超 TDSQL,其余数据库都凭借深厚的积淀维持着上个月的排名。本月排行榜第四至七名之间分数差距较上月有所缩小,这一赛段后续或会迎来大洗牌。OceanBase 自2022年12月摘得桂冠后,连续七个月问鼎墨天轮榜首,且本月得分超越700,这表明其仍处于快速发展期。接下来具体看看排行榜前十名的得分以及排名情况。
- OceanBase 本月得分701.02分,连续七个月问鼎榜首,上月新增三篇论文。 其始终坚持科技创新,注重安全能力建设。近日,OceanBase 凭借领先的数据一致性、数据访问控制、数据加密、高可用等数据库原生安全能力,成功入选 IDC 发布的《中国数据库原生安全能力洞察 2022》研究报告。且其频频在业内大会上亮相,在数据库行业内的影响力逐渐扩大。
- 以647.12分获得墨天轮榜眼称号的 TiDB,自上月末成功中标建设银行国产数据库小机下移项目后,就吸引了众多潜在用户的目光。 其在宣发上持续秉持低调理念。经过多年的打磨,TiDB 企业级分布式数据库已经具备了成熟且可持续发展的生态系统,并在银行、保险、证券等金融机构中有着众多成功的落地案例。
- openGauss 本月以616.85分缩小了与第二名的差距,连续两个月稳居排行榜第三。 上月,openGauss 持续聚合数据库行业优势力量。openGauss Developer Day 2023在京举行、开源之夏2023正式开启,其持续密切联系厂商和从业者,深耕中国数据库行业生态建设。
- 达梦本月得分515.97分,在市场开拓方面有了重要进展。 上月,达梦陆续与国电南自、水利部南自所建立合作关系。根据公开的营收数据及第三方报告排名,从销售金额角度,达梦在政府端国产化份额中领先。在政府端先行先试的趋势下,达梦具备明显的竞争性优势。
- 人大金仓本月以495.43分维持着榜单第五的优势地位。 自2023年2月人大金仓上升两位至第五名后,其稳扎稳打,连续五个月稳坐榜单第五。上个月,人大金仓成功助力某大型运营商租赁核算系统、晋商银行新一代手机银行升级上线。作为数据库领域国家队,人大金仓坚持创新为先,深耕金融行业多年,已服务上百家金融机构。
- GaussDB 紧追不舍,以7.39分的微弱分数劣势位列榜单第六。 华为云GaussDB是华为基于多年研发经验,结合数据库云化改造技术,打造出的企业级分布式数据库。其已在多家大客户中规模化商用,历经华为终端云、华为流程IT、全球TOP银行、政企等严苛场景的考验。近年来,其瞄准金融行业,软硬结合,将数据库性能发挥到极致并拿下了重要领地。
- PolarDB 本月以469.39分排名第七,新增80篇专利、45篇论文。2017年9月 PolarDB 正式问世,其一诞生就集众多创新技术于一身。PolarDB 采用了自研的分布式存储引擎设计,底层使用了RDMA的高速网络,后续又借助开源放大优势。近年来,PolarDB 不断引入先进的技术,衍生了众多数据库学术成果。
- GBase南大通用产品齐全,本月以1.96分的分数劣势位列榜单第八。 上月,2023年第一期GBase数据库有奖征文大赛正在火热开展中,且陆续收到了众多用户的投稿,极大地丰富了相关内容。南大通用自研的 GBase 系列数据库已经为金融、电信、政务、能源、交通、国防、企事业等领域,上万家用户提供了产品和服务。
- 以305.1分位列榜单第九的 TDSQL 市场捷报连连。 近日,湖州银行新核心系统项目群成功投产上线。该系统基于腾讯云数据库 TDSQL 建设,是浙江首个基于国产分布式数据库投产的银行新核心系统。腾讯云目前已经与中国人民银行以及六大国有行建立了合作关系,头部商业银行中90%在数字化转型中采用了腾讯云的方案,其中7成涉及核心或关键业务领域。
- AnalyticDB 连续四个月蝉联榜单第十,本月得分225.70分,新增26篇论文。 AnalyticDB 是阿里云自主研发的云原生数据仓库,可以毫秒级针对千亿数据进行即时的多维分析透视。目前,AnalyticDB 在金融行业中已经有诸多实践落地,从点到面逐步提升金融机构数据能力。
二、群雄逐鹿争上游
在本月排行榜第十名至第五十名这一区间,超五成的数据库排名都处于上行趋势。小编仅在此筛选了部分数据库的得分和排名,一起来看看它们的最新动态。
图2:2023年6月排行榜优秀数据库得分详情表
- 金篆信科旗下 GoldenDB 分布式数据库本月排名较上月上升一位至第13名。自中兴去年4月设立数据库公司金篆信科后,GoldenDB 加速蓄力。上个月,GoldenDB 发布了 v7.1版本,此版本支持多模SQL引擎,支持更多类型数据的存储和使用。且其成功入围“2022年信息技术应用创新解决方案(典型解决方案)”。二十一年的厚积薄发,GoldenDB 逐渐占据优势地位。
- 神舟通用排名较上月上升一位,以1.42分的微弱劣势紧跟在 GoldenDB 之后。航天软件的成功上市,其拟募资1.52亿元用于神通数据库系列产品研发升级建设项目,给神舟通用注入了资本的活力。此外,随着国产化进程的加快,传统厂商神舟通用本就具备先发性优势,因此热度也在持续攀升。
- SelectDB 本月排名上升五位至第22。SelectDB 是飞轮科技基于 Doris 内核研发的云原生发行版,是运行在云上的实时数据仓库,在成立一年半内成功融资三次。2023年6月1日,SelectDB厂商「飞轮科技」完成新一轮数亿元融资。实时性作为 SelectDB 的关键特性,在目前数据量爆发式增长的背景下,其是符合行业需求的。
- YashanDB 本月排名较上月跃升16位进入了前三十的竞技圈。其排名自今年4月起就保持连续上升的趋势,作为深圳计算科学研究院自主设计研发的新型数据库管理系统,其在技术实力上是不容小觑的。这一支新势力在学院派的奠基之下热度居高不下。
- 本月榜单上的黑马 ByConity 是新增参与排名的数据库。ByConity 是字节跳动开源的云原生数据仓库,于2020年正式问世。其首次参与墨天轮数据库排名就取得了第31名的成绩。近日,云原生数据仓库 ByConity 正式宣布开源,这一举动将吸引更多的潜在用户了解 ByConity 。
- ArgoDB 是星环全新推出的一款分布式闪存数据库产品,它可以替代 Hadoop + MPP 混合架构,一站式满足企业对大数据平台的各种诉求。其本月排名较上月上升9个位次至第36名。近日,向星力·未来数据技术峰会 (FDTC)在上海举办,这一峰会吸引了众多的潜在用户了解星环科技旗下的数据库产品。
- KaiwuDB 是浪潮集团控股的数据库企业,本月排名较上月跃升34个位次,现位列榜单第49。面对资源按需弹性和数据多样化处理的新时代需求,KaiwuDB 1.0时序数据库运用实时就地运算等核心专利技术,专为工业物联网、数字能源、交通车联网、智慧产业等场景设计,真正能解决用户的痛点。
三、向量数据库风口已至
AI 技术不断向前发展,其将向量数据库推向新的风口。华福证券发布的《向量数据库:大模型引发爆发式增长》报告中指出,预计2025年向量数据库占非结构化数据处理需求约三成,数据向量化后存储将带来较大膨胀。中国数据库市场规模2022年约300亿人民币,预计到2025年将达到约500亿人民币。目前中国的向量数据库还处于萌芽时期。根据墨天轮排行榜6月最新数据,已有6个中国向量数据库参与排名。本月向量数据库排名前三分别是 Milvus、cVector、Vearch。
图3:2023年6月向量数据库排行榜详情表
- Milvus 是 Zilliz 旗下的一款为可扩展的相似性搜索而建立的开源向量数据库。其一直稳居墨天轮向量数据库榜首。它具备高可用、高性能、易拓展的特点,用于海量向量数据的实时召回。Zilliz 是向量数据库领域全球最早的开拓者,在全球拥有超过 1000 家的企业用户,是 OpenAI 和英伟达最近发布的向量数据库的官方合作伙伴,在一年前B+轮融资时估值就已经接近7亿美金了。
- 南京云创大数据科技股份有限公司发布的 cVector 向量计算一体机,这是一款自主研发的亿量级人脸特征向量高速比对计算一体机,支持亿级大规模人脸1:N比对场景。本月排名较上月上升4位位列向量数据库榜单第二名。
- Vearch 本月摘得向量数据库榜单探花,其是京东研发的一款分布式向量数据库,可用来存储、计算海量的特征向量,为 AI 领域的向量检索提供基础系统支撑与保障。该系统能够广泛地应用于图像,音视频和自然语言处理等各个机器学习领域。
近日多家向量数据库厂商传来融资喜讯,主要归功于 AI 创造的新机遇。向量数据库一个很重要的功能是拓展大模型的边界。随着向量数据库的引入,其内部存储的最新的信息向量能够极大地拓展大模型的应用边界。向量数据库可以使得大模型保持准实时性,提高大模型的适用性,并使得大模型能够动态调整。也就是说,向量数据库使得大模型的长期记忆得到了可能。
海量数据爆发产生巨大数据库需求。在互联网化趋势下,数据量呈爆炸式增长,同时随着数据大集中、数据挖掘、商业智能、协同作业等大数据处理技术的日趋成熟,数据价值呈指数上升趋势。未来向量数据库将成为数据库细分领域的另一佼佼者。
四、专家观点
科大讯飞 技术中心运维部高级DBA专家—— 戴明明(Dave)
Oracle ACE,中国数据库联盟核心伙伴/MVP,中国Oracle用户组(ACOUG)核心成员,CNDBA社区、安徽DBA俱乐部、openGauss合肥用户组发起人。擅长数据库架构设计、性能调优、故障处理,热衷于数据库技术的研究与分享,长期从事数据库技术的布道。
政策和市场的双重提振,技术和创新的不断推动。 墨天轮国产数据库热度排行榜6月版发布,看似本月排行榜的前十变动不大,其实排行背后反应的是信创背景下数据库厂商们在产品升级和技术创新上的不断努力,这点可以在排行榜的专利数和论文数上体现,榜单前十的数据库厂商占据主导地位。随着这些数据库产品功能的不断完善和迭代,可以预见的是,在政策支持和市场需求增长的背景下,会有越来越多的企业选择国产数据库。
从热度排行榜还可以观察到两点:
1、国产数据库的“马太效应”, 本月共有273个数据库参与排名, 但从排行的得分看,前十之后的数据库厂商得分差距急速拉大。实际上这里更多的是一种资源的体现,数据库的产品研发,生态建设都需要大量的资源投入,所以传统关系型数据库赛道上的竞争只会更加激烈。
2、目前国产数据库主要集中在关系型数据库领域,其他方向的数据库,如 NoSQL、大数据等还依赖国外开源,因此数据库的国产化全面替代还有很长的路要走。
个体点评:
- OceanBase
OceanBase 数据库发布之后就一直备受关注,也一直在产品功能上进行迭代,连续七个月问鼎墨天轮榜首,且本月得分超越700。 作为一款完全自主研发的原生分布式数据库,凭借产品的高性能和高可用,在金融、证券、互联网等行业占据了一定的市场份额,尤其是 OceanBase 4.0中引入的单机分布式一体化架构,会进一步促进 OceanBase 走向更多的行业。 - openGauss
openGauss是一款开源生态建设相当成功的数据库,越来越多的国产数据库厂商选择基于openGauss来进行二开。最新发布的openGauss 5.0.0 LTS版本对CM集群功能进行增强,尤其是VIP的支持(通过VIP连接主机,当主机故障时,CM选出新主后,VIP会自动漂移到新的主上),使用该功能的CM 高可用架构可以直接进行生产部署,替代了之前复杂的Patroni架构。 随着openGauss 功能的不断完善,相信基于openGauss的国产数据库厂商会越来越多。 - 达梦
达梦作为一款老牌的国产数据库,其与 Oracle 有着高度的兼容性和体系结构上的相似性,因此对开发和运维人员都相对比较友好,上手比较快。达梦有着完善的数据库产品体系,比如DW主从,DSC 集群,MPP,分布式DPC,因此达梦在政府等行业有着较高的市场份额,在当前信创热度不减的背景下,相信达梦会走的越来越远。同时,我们也应该看到达梦最近几年在人才培养、文档、书籍等生态方面做出的努力,达梦定期的举办公开课,出版了多本书籍(本人有幸参与了其中一本),也为达梦数据库的推广起到了重要的作用。 - Milvus
随着 AI 技术的不断向前发展,以及各种大模型的发布,直接将向量数据库推向了新的风口,Milvus 就是这个风口中的一支重要力量,专为向量查询与检索设计,于 2019 年开源,致力于存储、索引和管理模型生成的海量 Embedding 向量,能够为亿级向量数据建立索引。 目前 Milvus 在 GitHub 上的 star 达到了19.5k,并且版本迭代也很快,相信在大模型这波热度下,Milvus 会迅速占领更多的市场。
欢迎大家在评论区一起共话6月中国数据库排行榜。限于篇幅,笔者不在此罗列5月国产数据库大事记,感兴趣的朋友可以点此查看:《2023年5月国产数据库大事记》。
相关阅读
- 国产数据库流行度排行榜-墨天轮
- 国产数据库流行度排名规则-墨天轮
- 《往期国产数据库流行度排行榜解读》
- 2023:国产数据库名录和产品信息一览
《向量数据库:大模型引发爆发式增长》 - 《2023年5月中国数据库行业分析报告-时序爆发,实时共振.pdf》
原文链接:https://www.modb.pro/db/643222
更多精彩内容尽在墨天轮技术社区,围绕数据人的学习成长提供一站式的全面服务,持续促进数据领域的知识传播和技术创新。