如果说,在数字化时代,阿里云给外界的标签是基于算力、数据等要素的基建角色,那么,在如今的智能化时代,基于自身强大的云计算能力和长期以往的AI技术积累,它的这种底座底色显然再一次被夯实、彰显。
宜昌城东大道,左侧是中国船舶柴油机有限公司,右侧是三峡大学,全场不到3公里。在过去的几年时间里,这条从宜昌东站延伸出来的路线,拥堵一直是它的代名词。
但在2022年,这个标签成为了过去式。“现在从宜昌东站出来之后,只要时速达到45km/h,基本可以一脚油门开到底。”在宜昌开出租车多年的周师傅告诉我们,“最近城东大道顺畅多了。”
作为闻名的三峡门户城市,宜昌重新刷新了自己的底色。
就在2021年11月,宜昌与阿里云合作建设的宜昌城市大脑数字模型正式上线,这个基于”云计算+AI“的数字底座具有数据存储、高效计算、数据治理、物联感知、人工智能、安全可控等六大核心能力,将固有的数字场景,如宜接就办、宜格服务、全市一个停车场、先看病后付费等全部搬到“云端”,这也标志着宜昌智慧城市建设从1.0迈向3.0时代。
城市是中国经济的最核心构成单元。在这个单元之上,一系列关于未来趋势的问题都在被誊写出有清晰的答案。在其中, AI是最为明确的一个。
如果透过更为“智能”的宜昌背后,不难看到的是,在城市、在具体的场景、具体的产业,以及最小颗粒度额度的“企业”,AI的浪潮都在纷涌而来。
什么是AI?如果说之前,它更多的代表单一的某项技术,落点是人们对“阿尔法狗”战胜世界冠军的惊叹,那么如今,这个技术和现实世界的距离正在飞速拉近——它的身影出现在工业生产线上,在道路驾驶上,在电力输送上,在企业营销和数字系统搭建上,在一众数字产品上。
AI,正在以“大模型”的姿态,从想象力演变为产业场景的真实生产力。
“面向AI时代,所有产品都值得用大模型重新升级。”这是阿里掌门人张勇在4月11日的阿里云峰会对外传递出的声音。此外据了解,更落地的动作是,未来阿里巴巴所有产品都将接入“通义千问”大模型。
通义千问,是阿里云发布的AI语言类大模型。在此之前,国外基于GPT大模型的ChatGPT已经在全世界掀起一波新的AI认知浪潮。这种认知浪潮对应的是一系列语言大模型背后的技术赋能,如数据分析、营销、翻译、会议整理等技能。
但纵观当下,相较于C端的热火朝天,B端似乎并没有激起太大的水花。那么,AI,或者是在AIGC背后的AI大模型,对产业数字化的B端市场,改变到底在哪?
客观来看,在一众技术方向上,B端的产业场景往往具备滞后性,即其对于某项技术或某个理念的应用要滞后于C端市场,比如营销,比如金融科技等等,相较于C端灵活迅速的反馈链条,B端市场或者产业场景往往因为其反馈链条过长,且长尾效应较重,风格偏向稳健而长期,采取的策略更多是“谋定而后动”。
但AI大模型却是个个例。更客观来说,尽管人们在C端感知较弱,但在ChatGPT之前, AI大模型早已经成为产业数字化的核心力量之一。如今伴随着人们对大模型关注,这种基于AI的智能化价值正在清晰地出现在聚光灯下。
以上文宜昌的城市案例为例,关于其“进化”的更真实表述正在被越来越多人知晓。比如停车场景,在“城市大脑”的AI等智能化手段干预下,宜昌全市已经有315个停车场实行了“先离场后付费”,使用该功能用户数达12万人,平均离场时间由20秒缩短为5秒。
再比如在电力应用方向,基于“AI + 云”的模式,通过AI预测、强化学习、知识图谱等AI技术,电力系统可以实现资源的智能化调度和分配,进而保证电力资源的稳定应用。
同样的场景还有自动驾驶,视觉检测、轨迹预测与行车规划等算法模型,都依赖于海量的数据训练集,在过往,这种海量数据的计算基于原有的CPU通用计算很难完成,但伴随着AI智算等模式的出现,大批量、低成本的数据计算训练成为可能。
如果说一众产业场景是AI已经发力的角逐场,那么在企业内部,它的价值也更在尝试进行着更为清晰的表达。
比如基于企业前端触角的营销、智能客服、智能导购,再比如企业中间流程的流程梳理、营销转化、数据分析,以及企业后端的客户服务、产品研发等环节,通过与AI的结合,这些既有的环节都可以基于数据进行更为智能的演绎。
从更大的视角来看,在大模型出现之后,AI重构的不仅是单个企业或者产业环节,其构建的更是一种基于数据驱动的思维,如果说过去多年时间AI技术被更多看作是“雾里看花”的标签的原因,是其很难在具体的业务场景内发挥出生产力的价值,那么在如今的大模型时代,从底层数据、技术到上层应用的门槛被打破重组,企业开始能够使用AI并将其转化为生产力的“发动机”。
在AI大模型的基础上,数据可以真正成为“发动燃料”,而不再是“只可远观”的金矿。而这种趋势下,也可以说,谁能率先打造出属于自己业务场景的AI发动机,谁就能领跑一步。
但这并不是一件容易的事情,对单个企业而言,在摩尔效应失衡的当下,可以说是极难。
更通俗来说,伴随着如今IT架构的升级以及线上化程度的加深,不论是在企业场景,还是产业场景,都无时无刻不在产生大量数据。此外,这些数据不仅量级大,同时其结构也更是杂乱无章,即结构化与非结构化数据并存。
在这种情况下,如果企业想要构建从0到1的数据深度模型,通用算力很难满足要求,必须具备强大的底层智能算力,与之对应的是企业必须要构建庞大的智算中心。
单从投入来看,对中国大部分企业而言,这都是一个不能接受的天文数字。
实际上,早在ChatGPT爆火之前的2022年11月,阿里云就正式提出“Model as a Service”理念,并推出国内首个AI模型社区“魔搭”,开发者可以在魔搭上下载各类开源AI模型,并直接调用阿里云的算力和一站式的AI大模型训练及推理平台。
更通俗的说法是,企业可以在开源的阿里云大模型的基础上,基于自身的企业细分场景进行专项的数据训练,通过微调构建出属于自身的产业模型,进行最终的数据的业务表达。
以前文中提到的自动驾驶场景为例,在过去的几年时间里,在自动驾驶业务的研发上,小鹏汽车同样面临数据量大、算力不足的问题,通过与于阿里云智能计算平台的协作,其训练效率得到极大提升。
一组数据是,在双方合作后,小鹏自动驾驶核心模型训练速度提升近602倍。
实际上, 基于开源大模型的路径已然成为不少企业的AI智能钥匙。根据不完全统计,如今“魔搭”已成为国内规模最大的AI模型社区,总用户量达100万,模型总下载量超1600万。
在庞大的AI生态环境背后,一个良性的飞轮效应正在形成。即在阿里云开源大模型的基础上,企业不再需要投入巨大算力、资金从0到1构建大模型,在既有大模型的基础上通过下游微调即可获得数据智能表达的能力。
而对阿里云大模型而言, 伴随着其接入数据量级的越来越大,模型本身的训练次数也越来越多,其模型的智能程度也将会越来越高,进而可以反哺下游企业,提供更为智能的底层服务。
对企业、对阿里云、对产业,这是一个三赢的AI路径。
这正是阿里云在推动的路径。更可以看作,阿里云正在将自己的角色定义为AI时代的底座。
“我们将开放通义千问的能力,为每一家企业打造自己的专属GPT,欢迎所有人用阿里云开发自己的大模型。”在上述的峰会现场,阿里云CTO周靖人表示。
在最近的一份采访里,周靖人曾对“通义千问”有一个定调,称其是“中间态”,用他的话说,通义千问是把过去阿里云积累的一部分工作向社会,向开发者开放。
诚然如此。如果说在中国的大模型领域哪家企业的积累和投入最深?阿里必然是其中之一。
从时间线来看,早在2019年,阿里云就开始了大模型的训练,在过去曾陆续发布语言大模型 Plug(后来的 AliceMind)、10 万亿参数的多模态大模型 M6,而这些在去年都被整合进“通义”大模型。
而从落地视角来看,基于自身的智能计算解决方案——飞天智算平台,配合自身强大的云计算能力,阿里云已然完成了多个场景的验证。
如前文提到的城市发展层面的宜昌智慧大脑,以及产业赋能层面的小鹏汽车、南方电网,同时再比如在科学领域,在复旦大学,阿里云还参与建设了中国高校第一个智能算力和通用算力相融合的科学计算平台CFFF,其将是国内最大的高校科研公共算力平台项目。
这些都构成并验证着阿里云在底座角色上的底气,而这些底气也构成着阿里云在推动AI路径的通畅。
关于AI模型社区“魔搭”一个更细节的成绩是,截止目前,在社区内,十亿参数以上的大模型有 30 多个,超百亿参数的大模型有 10多 个。
换言之,在阿里云成为底座的AI路径上,除了阿里云和企业之间的飞轮效应,也更催化出了企业和企业之间的连接和协同,共同解放着大模型的更强想象力。
这种想象力是基于大模型智能涌现本身,也更是基于阿里云的开源的“AI+云”底座加持之上。
如果说,在数字化时代,阿里云给外界的标签是基于算力、数据等要素的基建角色,那么,在如今的智能化时代,基于自身强大的云计算能力和长期以往的AI技术积累,它的这种底座底色显然再一次被夯实、彰显。
但实际上,从另一个角度来看,基于这种底层智能能力的加持和提升,阿里云也更在提高自己的想象力。
如果说在之前,市场对于云计算更多的价值定义是基于资源层、算力层,那么如今,在AI的加持下,阿里云以及一众云计算厂商的将自身底座的标签又一次做深做厚,延伸到了业务层、应用层。
这是云计算的新机会,是阿里云等一众中国云厂商的新机会,更是中国产业数字化的新机会。