百度和央视又联手在直播现场上演黑科技了。
百度CTO王海峰只说了一句话,就给主持人整出了个数字“孪生兄弟”。
更厉害的是,这位数字人刚一出生,开口就有“北大还行”内味儿了(手动狗头)。
这还没完,现场,中国火星探测工程和百度联合培养的火星车数字人祝融号也跟全国人民见了面。
一登场,就落落大方地与主持人谈笑风生了起来,各种“保送”、“火星种土豆”的梗那叫一个信手拈来。
谈到兴起处,还能即兴赋诗,引得主持人直呼“看给你厉害的”。
这就是百度世界大会直播现场,百度在台前贡献的又一科技盛宴。
而说起这场直播的高光时刻,可不仅仅是数字人,还有汽车机器人、昆仑芯2、小度智能巨屏电视等等一众新品、亮点。
当然,精彩纷呈的背后,一直是有技术底座为支撑的。并且,作为一家深耕AI技术十余年的公司,百度透过百度世界大会展现的深层布局和最新技术洞察,往往更值得关注。
比如,这一次跟主持人唠得有来有回的数字人背后,其实就是百度大脑的全新能力在做支撑。
王海峰介绍,这一百度AI核心技术引擎,如今已正式升级到7.0。
所谓“升级”,不仅有表面上功能的添加和性能的增强,更是瞄准了王海峰此前判断的AI行业发展两大趋势——融合创新和降低门槛。
在人工智能进入工业化大生产阶段的今天,某个具体技术上的单点突破固然是好事,能发论文、刷榜单、评奖项。但要想真正走入工业实践、落地应用,不靠多种技术的融合已经行不通了。
王海峰针对这种现象指出了4个具体融合方向:
知识与深度学习融合
跨模态多技术融合
技术与场景融合
软件与硬件融合
原因具体对应着AI发展到今天,从技术到应用上的4个现状。
第一个现状,AI这几年确实做到了大力出奇迹,但大力背后要付出高昂的代价。
千亿级参数的GPT-3在语言能力上的表现惊艳了世界一次,训练一次约消耗19万度电的成本又惊吓了世界一次,基于如此高成本技术开发出来的AI应用又有多少企业用的起?
于是在GPT-3之后语言模型的发展分成了两条路线。
一条继续在规模上加码,以谷歌的Switch Transformer为代表,一举把参数规模怼到万亿级。
另一条,就是百度大脑7.0的知识与深度学习与融合,尝试让AI在大规模计算之外掌握更多常识。
百度大脑7.0发布的知识增强大模型,靠引入大规模知识图谱,只用百亿级参数规模就在语言模型权威测评SuperGlue上登顶全球榜首,超越人类水平0.8个百分点。
百度能不依赖大力出奇迹而是转而依靠知识,还有个得天独厚的优势:它更懂中文,拥有全球最大的异构知识图谱。
于是除了在国际榜单登顶,这一知识增强大模型还一举刷新了54个中文 NLP任务基准。
学到了“撒贝宁是主持人”和“火星上没发现水”这样的知识,祝融号数字人才能在大会现场准确答题、流畅对话。
有这样能力的百度大脑7.0,成本更低,能力更强、更贴近市场,才能真正开始谈大规模落地。
第二个现状,AI要落地不能仅停留在幕后提供一些碎片性的技术支持,而是要更多开始和人类直接互动。
要想和人打交道,理解和生成文本只是一个方面。要看、要听、要把话说给人听,这就需要融合文本、语音、图像多模态的技术。
在直播上展示的“一句话生成数字人形象”,就是百度大脑7.0跨模态多技术融合的一次精彩演示。
先要听取指令,转换成便于计算的文本,这里用到语音识别技术。
理解指令含义,确定要生成的是什么样的数字人,这涉及到自然语言理解。
再去执行指令,提取相应的视觉特征并生成符合的模型,靠的是一系列计算机视觉技术,
像这样跨模态融合,数字人终于能以完整的姿态登上央视,给广大观众来一场别开生面的技术科普。
当然,向公众展示科技的魅力和价值,还只是AI要做的事中一个小的部分,对于AI而言,更重要的还是要到各行各业中落地做实事。
第三个现状,AI想落地就得在真实业务场景中真正展现效果、产生效益,不然谁来为AI买单?
AI现阶段的一个特点是只擅长解决特定任务。那么以大规模预训练模型为例,在预训练-微调的范式中,最重要的是要找到合适的预训练任务。
像百度之前的ERNIE2.0语言模型,就是靠指定了单词、句子结构、语义三个层级上的任务,再结合创新的连续多任务学习,在权威测试GLUE上超越了当时的强者BERT,为后面的知识增强大模型打下基础。
虽然这里说的是纯技术上的任务,不过假如换个思路,把跑测试冲榜单当成AI企业自己要面对的业务场景,那么AI要落地到更多行业中,应该去哪里寻找任务的答案就呼之欲出了:
到场景中去,把技术与真实业务场景相融合。
像这次百度世界大会现场,主持人和嘉宾的对话就是由如流智能会议纪要系统记录的,依托于AI技术,除了语音识别记录外,还能自动提取重要的内容形成摘要。
而现场同声传译系统展现的高质量、低延迟同传效果,则是百度大脑7.0机器翻译技术和同声传译场景融合的成果。
最后一个现状,AI真正落地到业务场景里不光是技术开发上的问题,还要考虑部署。
有了算法,接下来要思考如何更高效地使用算力。这就需要软件和硬件的融合,像苹果就是走了把算法和芯片深度整合的路,让手机发挥出电脑的实力。
硬件上,百度这次拿出的是自研AI芯片昆仑2代,采用全球领先的7nm制程和百度自研的2代XPU架构,并且已经实现量产。
昆仑芯2代除了性能比上代提高2-3倍外,场景上,它可以适用于云、端、边等多种场景,因而可覆盖互联网核心算法、智慧城市、智慧工业等诸多领域,并且在高性能计算机集群、生物计算、智能交通、无人驾驶等前沿研究中都有一展所长的潜力。
像这样,百度大脑7.0在软硬一体融合中释放出了更多可能性。
随着百度大脑在以上4个融合方向上持续升级,涉及到的AI技术越来越复杂。
但AI要服务的范围却越来越大了,从熟悉AI的技术公司、互联网公司扩展到了传统行业、公共事业和个人生活。
王海峰在这次百度世界大会上说:
百度的AI技术越来越强了,但应用的门槛反而是降低了。
如何做到的?
这得益于百度大脑的核心基座——飞桨深度学习平台。
百度飞桨作为开源平台向全社会开放,这个全社会可不是说说而已。
面对专业开发者,百度飞桨提供了产业级开源模型库、大规模分布式训练技术和多端多平台部署的高性能推理引擎。
面对成长期的开发者,百度飞桨也有AI Studio学习与实训社区,提供在线编程环境、免费GPU算力和开源数据及算法,更有AI学习路径和各类竞赛引导开发者学习成长。
面对入门开发者,百度飞桨还有EasyDL零门槛AI开发平台,不懂代码也能开发出自己的AI应用。
到目前为止,已有来自各行各业的360多万开发者通过飞桨平台开发了40万个AI模型,累计服务了13万企事业单位,涵盖工业、质检、农业、医疗、城市管理、交通、金融、体育等领域。
此外,百度飞桨还与多所高校合作,举办面向教师的深度学习师资培训,承办中国高校计算机大赛等多项赛事,为高校学生提供实习计划、就业指导。
本次百度世界大会上王海峰还宣布成立百度松果学堂,通过提供基础课程、技术竞赛、产业实训、科研基金,把未来5年培养500万AI人才的“口号”一步步落下来。
培养人才提升能力,从另一方面来讲,也是降低未来他们进入行业时的应用门槛。
说到最后,把降低门槛当成是在生态建设上的另一种融合创新也未尝不可。
说了这么多,百度大脑升级背后,百度的最新技术思考也就不难总结了。
核心其实就是,要进一步激发AI技术的价值,就需要把技术创新和产业发展有机融合在一起。
时下,数据资源已然是一种公认的关键生产要素。因此基于百度大脑这样的技术底座,百度智能云提出“数字化转型+智能化升级”,一步到位助力产业智能化的策略,事实上是在顺应数字经济发展的最新趋势。
简单来说,就是在诸如金融、医疗、制造、能源,乃至文娱体育这样的传统行业,不仅要搭建起自动化的系统来提高生产效率,还得把自身的数字资产充分利用起来,用智能化来激发新的增长点。
具体怎么做,百度也已经给出了实际案例。
刚刚在东京奥运会夺得7金5银的中国跳水队,背后就有一位隐形“AI教练”。
在这次百度世界大会上,百度创始人、董事长兼CEO李彦宏和中国跳水协会主席周继红现场连麦。周主席分享了百度智能云提供的“3D+AI”跳水辅助训练系统给日常训练带来的改变:
解决了跳水数据采集与分析方面的难题。有了这套系统,3秒就可以看到反馈,有时候出去开会、出差,也能看到队伍里的训练情况,反馈非常及时。系统可以切不同的角度,抠不同动作细节,一目了然。
在更贴近日常生活之处亦有验证。
例如在泉州水务集团,百度智能云联合埃睿迪基于百度大脑打造的泉州水务大脑,对生产流程实现了自动化控制和运维,大大减轻了人员管理压力。
在国网新疆电力,基于百度智能云和国网电力联手建设的“AI中台”,电站巡检机器人能够代替人捕捉巡检过程中的每一处细微差错,既缓解了偏远地区巡检人力紧缺、工作环境恶劣的难题,又有力为西电东送提供保障。
在旅游名城丽江,百度智能云建设的“城市大脑”正在致力于让居民和游客更加和谐相处:检测环境整洁度,通过紧急预案系统保障游客安全……
还有百度智能云牵手苏州工业园区打造的“智慧工厂”。在苏州常熟的恺博车间里,AI能够帮助质检工人“听音”、“识图”,提高制造效率和质量。还能对操作手册、维修历史记录等制造经验进行知识化处理,推动中国制造业从“制造”到“智造”。
实际上,这还只是个中典型,像这样的案例,如今可以说每天都在全国各地落地成真……
归根结底,这就是“融合创新”和“降低门槛”背后更深层的意义和思考:这样一条发展之路,其实就是在技术创新的基础上,如何更好地让技术本身和产业发展相结合,形成激发经济发展的新动能。
而这样的浪潮将推动中国的数字经济创造怎样新的成绩,令人无比期待。
你觉得呢?