10月20日,2021云栖大会进入第二天,阿里云继续发布了多款重磅产品,其密度和力度均令人叹为观止。
加速数据中心清洁能源使用
阿里巴巴集团副总裁、阿里云基础设施负责人周明表示,阿里云将加速在新型数据中心内清洁能源的使用,位于河源的数据中心最快明年将100%使用清洁能源。
周明透露,“技术先进”和“绿色低碳”已成为新型数据中心的关键词,阿里云以低碳选址、清洁能源、液冷技术等融合AI应用,加速绿色节能技术创新及迭代升级,做到“少用电、用好电、用绿电”。
据介绍,阿里云工程师们研发出“将服务器泡在水里”的黑科技,一排排的服务器被浸泡在绝缘冷却液里,产生的热量可直接被冷却液吸收进入外循环冷却,全程用于散热的能耗几乎为零,节能效果超过70%,实现了数据中心100%无机械制冷。
经过多年“绿色IT”研发,阿里云已将数据中心的综合能耗降低70%以上,为国内首家全部达到国家绿色数据中心标准的云厂商。同时积极采用清洁能源,交易清洁电量与碳减排均居全国互联网行业首位,其中,位于河源的数据中心最快明年将100%使用清洁能源,未来将有更多阿里云超级数据中心采用清洁能源。
“绿色是检验数据中心的黄金标准。”周明表示,阿里云将持续加强绿色自研技术创新投入,积极开展清洁能源电力交易,推动数据中心碳减排。
新一代虚拟化技术:第四代神龙架构
阿里云宣布推出第四代神龙架构,这是飞天云操作系统新一代虚拟化技术,首次搭载全球唯一的大规模弹性RDMA加速网络,网络延迟整体降低80%以上。神龙4.0带来的计算架构革新,将云计算首次带进5微秒时延时代。
相比传统TCP协议,RDMA能大幅降低网络通信延迟。阿里云采用软硬一体化的设计思路,将弹性RMDA的加速能力融入公共云,让RDMA从HPC类应用,走向支持通用类计算场景,为Microservice,Serverless,Service Mesh等云原生技术大爆发提供技术支撑。
此外,第四代神龙还大幅提升了基础带宽、块存储、IOPS等核心性能。在深度学习场景下,第四代神龙可提升分布式NLP和视觉计算30%的训练性能;在大数据场景下,可提升Spark30%的计算性能;在数据库场景下,MySQL性能最高提升60%、Redis混合读写吞吐量可提升130%;NginxSSL建连每秒吞吐性能提升420%。
阿里云基础产品负责人蒋江伟表示,作为新一代虚拟化技术的代表,神龙在设计之初就是因云而生的,这次升级一口气在IO加速、芯片级安全、云原生弹性和高速网络四大领域做了非常多的优化,为数据库、AI、大数据等通用场景带来性能的飞跃。
全新开源操作系统“龙蜥”:投入20亿专项资金
阿里云发布全新操作系统“龙蜥”并宣布开源。同时,阿里达摩院操作系统实验室也宣告成立。
龙蜥操作系统定位于服务器端,支持X86、ARM等多种芯片架构和计算场景。在阿里巴巴内部打磨10年,有效支撑了历年天猫双11,性能和稳定性都经受住了严苛的考验。
同时,龙蜥针对云原生应用开发做了多重优化,为云上典型场景带来40%的综合性能提升,故障率降低50%,兼容CentOS生态,支持一键迁移,并提供全栈国密能力。
据悉,龙蜥操作系统完全开源,通过开源社区和操作系统厂商等形式提供服务。未来,阿里云计划为龙蜥投入20亿专项资金,并联合100家生态合作伙伴推动生态建设,提供至少十年技术支持。
阿里云PolarDB数据库:将云原生进行到底
阿里云宣布自研云原生关系型数据库PolarDB重磅升级,实现内存池化、多主架构、HTAP实时分析等创新功能,进一步引领云原生数据库技术的持续创新。
阿里云智能数据库事业部总负责人李飞飞表示,PolarDB将云原生进行到底!
本次技术升级中,PolarDB实现了三项创新:第一,业内首次实现内存与计算、存储的三层解耦,实现内存池化,使得弹性能力呈数量级提升,同时大幅度降低成本;第二,上线多主架构,进一步提升可用性、并发处理、弹性能力,高效应对像“双11”一样的流量洪峰;第三,成为真正的HTAP数据库系统,可同时处理OLTP和OLAP型混合负载。
公开资料显示,PolarDB数据库性能比MySQL高6倍,成本只有传统商用数据库的1/10,2020年获得中国电子学会“科技进步一等奖”。权威市场调研机构IDC 发布的2020年中国关系型数据库市场研究报告显示,阿里云以超过28%的市场份额,力压传统数据库厂商,排名行业第一。
为了更好服务政企市场客户,阿里云同日还正式发布重磅数据库产品DBStack。它跟强大的阿里云公共云数据库平台能力一脉相承,可以非常敏捷地部署在客户本地IDC或者IaaS平台上,助力金融、政务、运营商、交通等行业客户替换传统商业数据库,加速上云。
作为全球数据库领导者,为推动数据库产业发展与人才培养,阿里云还正式发布阿里云数据库ACP认证,包含关系型数据库和数据仓库两个方向,通过系统化培训与认证体系,培养更多数据库专业人才。
阿里灵杰:集成阿里整体大数据+AI能力对外开放
阿里巴巴集团副总裁、阿里云计算平台事业部负责人贾扬清发布“阿里灵杰”,集成阿里整体大数据+AI能力对外开放,让企业及开发者可“开箱即用”,能更专注于应用开发,能普惠化、插件式的业务交付。
据介绍,“阿里灵杰”包含机器学习平台PAI、云原生大数据计算服务MaxCompute、实时计算Flink版、大数据开发治理平台DataWorks、实时数仓 Hologres等产品,可调动规模高达10万台以上计算集群,拥有云边端一体的高性能训练和推理引擎,能提供毫秒级延迟的实时数据分析能力等,是中国最大的大数据+AI一体化平台。
据透露,基于“阿里灵杰”的分布式训练优化技术,达摩院多模态大模型M6已升级至全球首个突破10万亿参数的AI模型,规模超越此前谷歌发布的1.6万亿Switch Transformer模型。
此外,贾扬清还首次提出了大数据+AI一体化平台的“4S”标准,即大模型(Scale)、高效率(Speed)、易用性(Simplicity)、场景化(Scenario),分别对应平台计算能力,平台部署、开发、运维效率,平台API和SDK标准和易用性,平台场景化适配能力,为人工智能行业发展提供借鉴。
从飞天到倚天:阿里云底层自研技术大爆发
在2021云栖大会上,阿里云发布了倚天、磐久、神龙4.0、龙蜥、灵杰等多款重磅产品,阿里云“做深基础”成果浮出水面,底层自研技术迎来大爆发。
阿里云智能总裁张建锋表示,过去十二年,阿里云打造出中国唯一自研的飞天云操作系统。今天阿里云坚持自研,继续“向下生长”,从飞天到倚天,打造以云为基础的软硬件技术体系。“构建完整的技术体系,是我们在数字时代具备全球竞争力的决定性因素”。
• 倚天:为云而生的芯片
飞天云操作系统是阿里云的核心“引擎”, 为了提供更好的计算产品和服务,飞天向下延伸、定义硬件。19日,阿里巴巴发布首款通用芯片——倚天710,这是一款为云而生的芯片,针对云计算的特点做了大量优化,性能超过业界标杆20%,能效比提升50%以上。
架构层面,倚天710采用最新ARMv9架构,多达128核,主频最高3.2GHz,可同时兼顾性能和功耗。同时,集成了业界最领先的DDR5、PCIE5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。
• 磐久:自研云原生服务器系列
面向下一代云原生架构,19日阿里云还推出了磐久自研服务器系列,采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升50%。
针对云原生时代容器化、微服务、持续交付等特点,磐久系列采用软硬件融合方式实现极致性能,结合自研的MOC、FIC、AliFPGA、神盾卡等,满足云原生的创新开发对性能和稳定性的机制要求。在多核技术加持下,磐久系列的计算性能、IO吞吐、能效比的表现都居于业界领先水平。
• 神龙4.0:云计算进入5微秒时延时代
2017年,阿里云推出了第一代神龙架构,解决困扰云计算行业多年的虚拟化性能损耗问题,让云服务器突破性能极限。今天神龙架构演进到了第四代,首次搭载全球唯一的大规模RDMA加速网络,网络延迟整体降低80%以上,云计算首次进入5微秒时延时代。
神龙4.0可提升分布式NLP和视觉计算30%的训练性能、Spark 大数据30%的计算性能、MySQL 60%的性能、Redis 130%的混合读写吞吐量。
神龙4.0将弹性RMDA的加速能力融入公共云,让RDMA从HPC类应用,走向支持通用类计算场景,为Microservice,Serverless,Service Mesh等云原生技术大爆发提供技术支撑。
• 龙蜥:服务器操作系统开源
为给服务器提供更好的性能,阿里云发布全新龙蜥操作系统,并宣布开源。
龙蜥已在阿里巴巴内部打磨十年,历经“双11”大规模验证,性能和稳定性更优,给云上典型用户场景带来40%综合性能提升,可兼容CentOS生态,支持X86、ARM等主流芯片架构,并提供全栈国密能力。
未来,阿里云计划为龙蜥投入20亿专项资金,并联合100家生态合作伙伴推动龙蜥生态建设,提供至少十年技术支持。
• PolarDB自研数据库:首次实现内存与计算存储解耦
除了操作系统,阿里云在基础软件的另一个核心领域——数据库,也迎来重大突破。
作为阿里云自研数据库的明星产品,PolarDB首次实现了内存与计算、存储的解耦,内存进一步池化,形成三层池化,使得弹性能力有数量级的提升。
同时PolarDB还首次实现了多主架构,进一步提升可用性、并发处理、弹性能力,高效应对“双11”般的流量洪峰。
• 阿里灵杰:让大数据+AI“开箱即用”
同时,阿里云将大数据+AI一体化平台“阿里灵杰”对外开放,可帮助企业和开发者实现“开箱即用”。
“阿里灵杰”包含机器学习平台PAI、云原生大数据计算服务MaxCompute、实时计算Flink版、大数据开发治理平台DataWorks、实时数仓 Hologres等产品,可调动规模高达10万台以上计算集群,拥有云边端一体的高性能训练和推理引擎,能提供毫秒级延迟的实时数据分析能力等,是中国最大的人工智能平台。
“阿里灵杰”还首次提出了大数据+AI一体化平台的4S标准,即大模型(Scale)、高效率(Speed)、易用性(Simplicity)、场景化(Scenario),为人工智能行业发展提供借鉴。
• M6大模型:全球最大规模多模态预训练模型
基于“阿里灵杰”,达摩院开发了超大规模多模态预训练模型M6,主打多模态、多任务能力,其目标是打造全球领先的具有通用性的人工智能大模型。
据透露,M6的参数已从万亿升级至10万亿,成为全球最大的预训练模型,规模超越此前谷歌发布的1.6万亿Switch Transformer模型。
从芯片、服务器,到操作系统、数据库,再到大数据+AI一体化平台、M6大模型,阿里云围绕核心自研技术飞天,坚持做深基础的战略,向下生长,把软硬一体做到极致,为下一个十年建立了代际竞争力。