数据智能产业创新服务媒体
——聚焦数智 · 改变商业
众所周知,数据库在信息技术领域具有重要意义,而长期以来,由于历史渊源,国内数据库市场一直都是国外厂商的天下。随着云计算的出现,中国数据库企业的机会来了,作为一条新的技术赛道,给阿里云PolarDB等国产数据库在全球竞争中脱颖而出创造了机遇。同时,我国蓬勃兴旺的数字经济,为数据库自主创新提供了发展的沃土。
从2009年阿里巴巴提出去“IOE”开始,十余年间,阿里数据库完成了从商用、开源到自研的发展路径。公开资料显示,目前阿里云在云数据库市场份额位居国内第一,据国际权威机构Gartner年度全球云数据库魔力象限评估报告,阿里云作为中国唯一的科技公司代表,于2020年和2021年连续两年进入领导者(LEADERS)象限,这标志着阿里云数据库稳居全球顶级数据库行列。
根据华泰证券最新的研究,数据与计算的双重变化加速云原生分布式数据库时代的到来:从数据层面来看, 随着信息技术及互联网快速发展,数据量呈现爆发式增长,数据模型不断丰富,大量非结构化数据产生;从计算层面来看,各行业领域对数据库技术提出了更多需求,计算载体更加多样,算力得到增强,计算场景向高并发、低时延演进;从技术层面,近年来分布式数据库架构已基本成熟。在这样的时代背景下,阿里云作为数据库领域的重要玩家,持续探索数据库的前沿疆域,推动数据库行业向前发展。
11月3日,在2022云栖大会上,阿里云全面提出数据库向云原生一站式数据管理与服务纵深发展战略,该战略由云原生化、平台化、一体化、智能化等“四化”组成,并结合“做深基础,做强核心,做好体验,做精场景”的“四做”战略,进一步为客户创造数据价值;同时,阿里云宣布,旗下的PolarDB、AnalyticDB、RDS等核心数据库产品已与自研CPU、CIPU、飞天操作系统进行深度融合创新,并全面Serverless化,对外更好地提供一站式数据管理与服务。
“四化”预判,阿里云把脉数据库最新发展方向
我国数字化转型向着纵深方向发展,产业界更加注重数据所能带来的实效价值,而其中数据库是挖掘数据价值的核心环节。基于此,阿里云将打造云原生一站式数据管理与服务作为战略,对准客户在云数据库持续升级的需求,不断为客户创造价值。
阿里巴巴集团副总裁、阿里云智能数据库事业部总负责人李飞飞认为,云原生数据库正在快速向一站式数据管理与服务演进,数据库一方面要确保数据业务永远在线,另一方面要让数据价值不断放大,前者强调的是稳、快、不挂,后者重在对数据库里的数据进行深层次的挖掘和发现。
李飞飞做了一个形象的比喻:“什么是数据管理与服务?数据管理就像一个菜场,对西红柿和鸡蛋进行管理,而数据服务则不仅仅对西红柿和鸡蛋的管理,还能够提供西红柿炒鸡蛋。”
阿里云数据库之所以有进一步升级的信心,与近年来阿里云在软硬件、算力等技术能力的迅速提升有着很大关系。
今年的云栖大会上,阿里云进行了一系列重磅发布,其中宣布倚天710已大规模商用,成为中国首个云上大规模商用的自研CPU。阿里云智能总裁、阿里巴巴达摩院院长张建锋表示,阿里云正在重构整个IT软硬件和终端世界,计算机软件研发范式也将发生颠覆性变化,新兴的软件开发方式正在崛起。
阿里云智能数据库事业部负责人李飞飞亦表示,随着数据库向云原生一站式数据管理与服务的纵深发展,将与自研CPU、CIPU、飞天操作系统等软硬件进行融合创新,通过深耕核心技术,持续释放云计算的资源池化潜力,让客户享受到更多云原生技术红利。
面向未来,阿里云数据库将整体向“四化”方向发展:云原生化(资源解耦、Serverless化)、平台化(基于云构建数据平台能力、OpenAPI标准化)、一体化(处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化)、智能化(AI for DB简化运维、In-DB ML挖掘数据价值)。
在云栖大会上,李飞飞并就此做了详细解释,他说道,“云原生化大家很好理解,从资源解耦,到现在的All in Serverless都是云原生化的重要体现;平台化的意义,我们认为数据库发展到今天,必须基于云平台构建具备一站式数据服务能力的数据库产品,才会有生命力和未来,阿里云数据库平台化的核心就是帮助客户减少业务烟囱。”“一体化就是多业务场景融合,多数据类型融合、便捷开发、敏捷使用,避免数据的搬迁。具体来说,包括离在线一体化、处理分析一体化、多模数据一体化、集中分布式一体化。最后是智能化,阿里云主要结合AI的能力,提供智能的运维,以及在数据库中提供AI推理的能力。”
来源:2022云栖大会
如今,阿里云数据库正在全面拥抱并推进 “四化”大趋势,充分利用阿里云底层软硬件的优势,引领产业进一步向着纵深方向发展。
阿里云数据库的“云原生化”与本次大会“计算、进化、未来”主题相呼应,历经十年的发展,目前阿里云已进入 " 全面云原生深度用云 " 阶段。随着倚天710和CIPU、飞天操作系统的完美协同,云数据库性价比提升就达到30%以上,单位算力功耗降低60%以上。阿里云数据库的基础服务能力获得大幅度提升后,使用户从购买资源向购买能力转变,加速数据业务上云,资源解耦、Serverless等核心能力越来越流畅地转化为用户的价值。
在平台化方面,阿里云数据库希望基于云为客户建立统一的数据管理和服务平台,并提供标准的API接口,方便企业调用各类数据库引擎。从现状来看,相当数量的企业仍未摆脱系统丛生,烟囱林立的局面,无法享受平台化带来成本降低、效率提升的好处。阿里云数据库认为,企业更了解自身的需求,因此阿里云为企业提供标准的OpenAPI接口,连接上阿里云一站式数据管理与服务,帮助企业进行全面管理,让企业从繁琐的系统运维中走出来,能够更多地关注自身的业务创新。
近年来,“一体化”概念提得很多,诸如“湖仓一体”、“流批一体”、“存算一体”、“HTAP”等等,尤其是“存算分离”的分布式数据库已经深入人心。那么,到底什么时候“分离”,什么时候“一体”,阿里云给出的答案是,“根据客户业务场景而具体规划,以简化开发、管理和运维、避免数据搬迁为目的”,例如集中分布一体化,李飞飞表示,“我们的客户并非是0或1选择,他们需要的是平滑地从集中式到分布式的过渡,根据业务场景和业务负载,可以自动的在集中式和分布式之间进行切换,业务和客户不需要再做痛苦的选择。”目前,阿里云在事务处理和计算分析一体化、集中分布一体化、离在线一体化、多模融合处理一体化等方面有诸多创新,取得了很好的应用效果。
来源:阿里云数据库,数据猿整理
最后是“智能化”,智能化的范畴很大,阿里云数据库想强调的是更能融入“一站式数据管理与服务”的智能化:一是融合AI能力的数据库自治服务,提升运维效率与体验;二是数据库内置机器学习功能,无需移动数据即可进行模型训练、生成推理和预测。
值得一提的是,随着技术发展的成熟,今年云栖大会特别强调Serverless的全面落地,并制定了ALL in Serverless战略。李飞飞表示,Severless是阿里云数据库的战略重点之一。在云原生数据库1.0时代,其按业务负载的变化进行自动弹性伸缩,实现分钟级别的弹性。进入到2.0时代,引入Serverless技术, 通过提前预测业务对资源需求的变化,可实现秒级弹性变配,曲线变得更平滑,且业务无损,如此可为用户提供具备秒级智能弹性扩容能力、随需而动的云原生数据库。
同时,Severless可以极大程度减少企业的成本,切实为用户带来价值的提升。用户无需关心和管理底层 IT 资源,只要聚焦业务代码,根据业务流量大小自动弹性伸缩,按使用量计费。据了解,真正的Serverless最多可帮助客户降低70 %的成本。“未来云将全面 Serverless 化,更加接近‘电网’ 模式,按计算的调用次数付费。”
李飞飞表示,随着弹性RDMA高速网络、新型内存、新一代云计算架构CIPU等技术在云平台的普及,Serverless技术使计算、内存和存储资源的三层解耦从理论走向实际,未来将成为云原生数据库发展的新趋势。
“四做”战略,把“四化”趋势预判落到实处
基于“云原生化、平台化、一体化、智能化”的趋势判断,阿里云数据库随即又提出了“四做”战略执行方案,即“做深基础,做强核心,做好体验,做精场景”,来承载上述四化的战略落地。
第一是做深基础。做深基础的涵义是向下延伸,阿里云数据库将与阿里云基础设施联合设计、深度优化,构建软硬协同的产品能力,实现垂直优化与技术创新。
李飞飞介绍说,今年阿里云的几个团队协同合作的基础上,推出了RDS on 倚天ECS,相对最新一代X86芯片,其性能平均有10%的提升,性价比有25%的提升,应用可无缝迁移,零适配成本,客户可充分享受ARM芯片带来的性能和性价比的全面提升;另一个核心产品是PolarDB,阿里云推出了自研智能存储的能力模块Smart SSD,通过在存储层挂载FPGA芯片,可透明地卸载诸如压缩等CPU密集的负载,实现了3倍压缩比,成本节省60%,同时做到数据库性能零损耗。并通过了非常严苛的国家安全评测中心主持的自主可控认证。
来源:阿里云、信通院《Serverless数据库技术研究报告》2022.11
第二是做强核心。做强核心是指持续聚焦数据库内核引擎、系统架构方面的创新,不断提升引擎的处理性能。前面提到Serverless化,阿里云推出的核心数据库产品All in Serverless即是做强核心的重要体现,Serverless功能在云数据库RDS、云原生数据库PolarDB、云原生数据仓库AnalyticDB上都进行了适配。
目前,阿里云数据库是首家通过信通院Serverless能力评测的云厂商,且凭借过硬的Serverless技术能力,参测的PolarDB、RDS数据库获得事务型数据库Serverless能力最高“先进级”评级;AnalyticDB数据库获评分析型数据库Serverless能力“增强级”评级。
来源:2022云栖大会
为实现“四化”中的一体化,充分体现一站式的能力,阿里云数据库则布局了“事务处理和计算分析一体化”、“集中分布一体化”、“离在线一体化“、“多模态融合一体化”等方面的相关产品。
李飞飞将达摩院数据库存储实验室的最新技术也纳入到“做强核心”环节。在安全可信领域,首次提出数据全生命周期安全管理,实现全链路敏感数据保护;在智能化领域,通过AI for DB和In-DB ML技术,将AI技术融入到数据库引擎,构建智能化运维体验,在数据库里完成简单推理;在“空天数据”领域,前瞻性地推出名为Ganos的引擎,可以对任何空天数据,包括建筑物进行抽象数据处理存储。李飞飞表示,“在达摩院的加持下,我们取得了下一代数据库多项核心技术的突破。”
来源:2022云栖大会
第三是做好体验。“做好体验本质是坚持客户第一,从源头服务好用户。不仅仅是做好服务,还应该从源头做好我们产品的体验,如此用户易用性就很强,不需要你来服务,或者尽可能少地需要你来服务他们。“李飞飞如是说。
“这里我们做了两个工作,一是用户和开发者不仅可通过控制台端到端地使用阿里云数据库产品,而且可基于OpenAPI、Terraform构建自己的自动化管控工具;二是结合AI,提供自运维、自服务、自修复的能力,即数据库自治服务DAS,大幅提升用户管理和运维数据库的体验;我们还提供一站式管理开发平台 DMS,包括数据库DevOps、数据传输与加工、数据应用与服务、数据资产和安全等四个核心能力,体现了真正的一站式数据管理与服务。”
第四是做精场景。“看似数据库是标品”,李飞飞说道,“但实际上数据库非常具有场景化,早期的数据库就是根据银行交易等特定需求而产生,发展到今天,随着技术的蓬勃发展,以及产业向纵深发展,更需要理解多场景的需求。所以,做精场景是深入理解千行百业共性的客户需求,解决普适性的客户痛点问题,面向行业场景提供多元解决方案。”
在政府行业,阿里云智慧医保平台数据库高效稳定地服务全国7亿参保人,1500万以上的参保单位,数十万的药店和医院;在金融行业,在金融行业,阿里云金融行业数据库解决方案在银行、保险、证券、互联网金融等场景逐渐落地,已全面服务于中国人寿、中华保险、申万宏源证券、中再集团等客户,助力业务走向平台化,交易业务敏捷化和规模化,数据分析业务在线化,集中化,实现跨部门共享,运维智能化;在互联网行业,通过云原生数据库PolarDB和云原生数据仓库ADB的弹性、高可用和容灾能力,结合DMS一站式在线数据管理平台,客户的Serverless架构成本下降50%;在汽车行业,基于云原生多模数据库Lindorm打造一站式车联网平台,通过云原生架构实现秒级弹性,性能提升3倍以上,成本降低30%以上。
发布“瑶池”品牌,带领行业挖掘数据宝藏
在云栖大会的最后,李飞飞说道,“我们汇集了天下不同的数据,数据就是今天这个时代最大的宝藏,就像在古代汇聚宝藏的地方,今天我们正式启动品牌‘瑶池’,用‘瑶池’来代表我们云原生数据库2.0一站式数据管理服务。”
来源:2022杭州云栖大会
从战略意义上来讲,阿里云数据库的全新品牌 “瑶池”涵括关系型数据库、NoSQL数据库、分析型数据库、数据库生态工具等版块,包含PolarDB、RDS、ADB、Lindorm、MongoDB、DMS等产品家族,为企业提供覆盖实时处理与存储、分析和发现、数据开发与治理的一站式数据管理与服务。
数据库上云的趋势已经非常确定。权威市场研究机构Gartner发现,中国数据库行业将加速增长并逐步向云端迁移,未来四年,中国数据库行业向公有云迁移的速度将超过全球平均水平。据 Gartner 预测,2022 年云数据库营收数据将占据数据库整体市场的半数以上。
在云数据库时代到来之际,引领中国云数据库创新的阿里云,再次做好了持续领跑的卡位。
文:陆易斯 / 数据猿
《2022中国企业数智化转型升级服务全景图/产业图谱1.0版》
《2022中国数据智能产业图谱1.0版》
❷ 创新服务企业榜
❸ 创新服务产品榜
❸ 最具投资价值榜
❺ 创新技术突破榜
☆条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》
联系数据猿