今天,阿里云峰会·粤港澳大湾区在广州开幕,阿里巴巴研究员、阿里云智能云原生应用平台总经理丁宇在论坛发言,他表示:
Serverless 引领云上开发新范式,通过丰富的原子化服务,全托管、高弹性、免运维的优势,以开箱即用的场景化能力,成本更优的按用付费模式,帮助企业跨越技术鸿沟,让创新触手可及。
过去十年,上云成为确定性的趋势。在上云阶段,企业关注点在于如何实现平滑上云,因此云厂商将云托管作为核心策略。随着越来越多的企业上云,甚至很多企业系统第一天就是在云上构建,企业的核心关注点转变为如何更好地利用云的能力,将产品快速推向市场,从而实现业务成功。
但是,如果算力的呈现形式仍然是服务器这样的资源形态,它的使用门槛依然很高。算力和业务相隔太远,企业需要有一整套支撑应用的基础设施来用好算力。让算力像电力一样的普及,云计算需要新的形态,就是 Serverless。
随着用好云成为关键,开发范式也将被重新定义。 通过产品服务化、全托管的方式,让企业和开发者可以专注于业务逻辑开发;并且云服务具备可编排、可复用的优势,让企业做得更少而收获更多;基于 Serverless 可以轻松构建高弹性应用,让企业从容应对流量波动。在 Serverless 开发范式下,企业新功能交付周期大幅缩短,进一步加速业务迭代,赢得市场先机。
作为云原生的重要技术组成,K8s 已经被开发者和企业广泛认可,然而其自身复杂性和陡峭的学习曲线依然让人望而生畏。
阿里云在 2018 年发布了首个 Serverless 容器服务 ASK,其本质是将容器的运行时和具体的节点运行环境解耦,让用户无需管理 K8s 节点和服务器,即可直接部署应用,大幅降低容器服务的使用门槛。
此次 ASK 的全新升级,进一步整合了阿里云基础设施的能力,在使用成本、创建效率、异构资源兼容、弹性供给保障等方面带来显著提升,解决开发者在使用 K8s 的复杂性挑战,也顺应了 AI 场景爆发下催生的新需求。
组件全托管,零 K8s 运维成本: ASK 新增对 CoreDNS、Metrics Server 等十多个 K8s 核心组件的托管支持,提供动态容量规划能力,客户无需自行部署维护,最大化降低运维复杂度。同时,ASK 也新增了智能化风险识别能力,支持自动化升级 K8s 版本,避免升级导致的应用故障或异常风险。
极致弹性,准确率提升 80%: ASK 提供首界首创基于容器镜像缓存的 AI 大镜像秒级拉取能力,AI 应用启动时间降低 90%。并且提供端到端的弹性加速,面向AI/大数据工作负载容器化进行全栈优化,通过数据集加速提升 30% 访问性能;此外,本次 ASK 还增强了智能弹性预测 AHPA能力,相比人工配置,弹性准确率提升 80%;同时新增对于 GPU 的支持。
普惠算力,降价 40%: 为了给客户提供更好的服务,释放技术红利,让算力更普惠,ASK 新增 U 实例规格支持,统一支持多款处理器,相比上一代主售实例降价高达 40%。 新增 SavingPlan 弹性版本,面向应用非固定波峰波谷场景,额外成本优化 10% 以上。为进一步让价格更透明,新增成本套件支持,清晰洞察弹性资源成本,让成本治理更便捷。
“数禾科技采用阿里云 ASK 部署线上模型,无需 K8s 节点管理,根据实时流量动态使用 POD,资源成本节省60%;通过 ASK Knative 服务,解决了数禾模型的灰度发布和多版本并存问题;得益于ASK 自动伸缩和缩容到 0 的优势,降低运行成本,大幅提升服务可用性。”丁宇介绍。
2023 年,生成式 AI 迎来了集中爆发,同时带动 GPU 需求不算上涨。阿里云函数计算拥有极致弹性的 GPU 实例,以及大规格的函数计算性能实例,这部分是承载 AI 应用稳定、高性能推理的重要环节。本次峰会,函数计算 GPU 迎来性能体验再升级:
用户配置更灵活: 函数计算提供业界最小的 GPU 虚拟化粒度,显存规格最小至1GB。CPU 与 GPU 解耦,允许用户独立配置,同时支持 GPU Turing/Ampere 两代卡型。
资源利用率更高: 底层技术架构从 ECS 架构过渡到神龙 GPU 架构,业界首创多租安全 GPU 共享虚拟化方案,综合资源利用率提升 80%。精细化匹配 AI 推理负载类型,算力规格最小达到 1/16 T4、1/24 A10。
技术更领先: 函数计算 GPU 冷启动时间从分钟级到秒级,性能提升 300%。行业首发 GPU 按需付费,切入准实时推理场景,支持 AIGC 热门场景,助力 AI 创业和生产力提升。
我们发现,在实际应用中,AI 应用开发技术的门槛对很多人来说依然很高;另外将 AI 应用部署到生产环境中需要考虑安全性、可靠性、可伸缩性、维护性等问题,也需要一定的技术能力和经验。
函数计算致力于为 AI 开发者、企业提供高效能、低成本的 AI 应用开发与部署服务。Serverless 架构具备高资源利用率与按量付费模式、服务端免运维等特性,让开发者真正实现 0 技术门槛开发 AIGC 应用。
整合 Serverless 应用中心、Serverless Devs 等完备的应用上云套件: 帮助开发者完成从 0 到 1 再到 N 的业务开发,并提供应用全生命周期管理能力。通过 Serverless 应用中心,用户在部署应用之前无需进行额外的克隆、构建、打包和发布操作,就可以快速部署和管理应用,轻松沉淀最佳实践。
构建完整的 AIGC 能力中心: 阿里云产品与 LangChain 等 AI 框架高度集成,开发者可以在 ModelScope、HuggingFace 等开源生态或社区选择模型进行开发、部署。
基于函数计算+Serverless 应用中心,开发者可以一键模型托管、5 分钟上手 AI 应用开发、研发效能提升 80%。
后续 Serverless 应用中心会持续沉淀各行各业的典型 AI 应用案例模版,让用户可以更简单地了解和掌握。目前 Serverless 应用中心已经接入了通义千问、文生图、图生图、图生文等 10 多款热门 AI 应用模版。
函数计算为 AIGC 的应用落地打开了一扇新的窗,“让每个人都可以开发 AIGC 应用。”丁宇介绍。
基于函数计算 FC+Serverless 应用中心能力,阿里云全新上线“函数计算一键部署通义千问预体验” ,成为业界首个能够试用通义千问的应用平台,与业务场景相结合,部署成功通义千问预体验应用即可获得 30 次对话机会。
除此之外,本次还上线了文生图、图生图、图生文、文生文等经典 AI 场景体验活动,让开发者 5 分钟完成 AIGC 应用部署,让创意更快落地。
此前,阿里云对外发布“飞天免费试用计划”,面向国内千万云上开发者,提供包括函数计算、ECS、数据库 PolarDB、机器学习 PAI 等在内 50 款全栈云产品的免费试用,全面支持 Serverless 的开发模式。
本次云原生产品免费试用再升级,不仅新增了 Serverless 容器服务 ASK ,同时即将上线云消息队列 MQ、Serverless 应用引擎 SAE、性能测试等多款产品,进一步丰富企业和开发者的使用场景。
除了免费试用计划之外,阿里云还构建了云原生社区、开发者训练营、培训体系、体验场景等丰富的内容,让开发者能够一键通过多个免费试用的产品搭建出想要的架构,快速体验云原生和 Serverless 的魅力。
丁宇说,Serverless 致力于让算力更普惠,让技术红利为更多人享用,让创新流动起来,让每个人都可以成为云原生时代的新开发者。