科技唆麻(ID:techsuoma)原创
作者:科技唆麻
7 月 3 日,为其两天的百度AI开发者大会在北京国家会议中心开幕。今年的百度在向外界传达关于产业智能化的新思考与解决方案时,的确更加的具象与落地。
以大会重头戏百度大脑 5.0 为例,百度 CTO 王海峰将其称之为:
“百度大脑 5.0 全面升级成为软硬一体的 AI 大生产平台,希望能够深度赋能产业开发者,加速产业智能化进程”。
对比前两届的AI开发者大会,我觉得今年AI开发者大会的看点主要是在技术层面的重大突破和全产业的融合贯通,比如李彦宏开场对话的小度音箱,之所以能够做到双工免唤醒,并且能够识别哪些是对它说的,哪些不是,背后是百度AI技术重大突破和升级。
而今年最火的除了主论坛之外,还有各个分论坛,今年百度一口气推出了9个AI分论坛,包括百度大脑、自动驾驶、智能小程序、智能云和物联网等等。而其中最火爆的,则是第二天早上的百度AI+5G论坛。
可以这么说,AI+5G的分论坛,应该是整个百度AI开发者大会中最火爆,最炙手可热的分论坛。
火爆到什么程度呢,活动今天是9点30开始。到了10点多,场外依然还排着长龙,因为场地有限,加上场内人满为患,保安只能依照“出一个进去一个”的原则放人,想要进去至少要等40分钟,有的人排了50分钟,为的就是听一听架构师和专家们关于5G和AI的精彩论述。
事后,很多人评价这是一场全程无尿点的分论坛。
为什么5G会成为百度AI的催化剂?我觉得有两个方面的原因,一是5G和AI天然的融合性,二是百度AI在语音识别、语音合成视觉等技术上的巨大优势,以及AI在边缘计算的场景应用。
1.5G和AI天然的融合性
我印象比较深刻的是在第一天下午的分论坛上,一位演讲嘉宾说,如果说从3G到4G还是带宽的提升,那么从4G到5G,则引入了AI,AI已经变成不可忽视的技术。
事实上的确如此,5G的到来,不但加速了AI的落地,也会让AI在各个领域各个场景发生巨大的变革。
在分析之前,我们先来看看5G到底有什么不同。
5G和4G最大不同之处,除了速率提升100倍以上,更重要的是设备连接的密度提升了10倍以上,延迟降低了10~100倍,双方最大相对移动速度从350km,变成了500km。5G是历史上第一次把AI,从传统电信封闭化的基础架构,变成了全IT化,全云化,全虚拟化的结构。这个是非常重大的革命和突破。这些特性,几乎是为AI量身定做的。而根据第三方的预测,五年之后,2024年全球40%的人口都会使用到5G的技术,整体的流量会增长到5倍以上。
5G的出现,不但提供了更高的连接密度和数量,让万物互联成为可能,并且AI所需要的算力,以及产生的大量数据,也能借助5G进行不间断的同步和传输。
举个例子,一辆自动驾驶汽车上百个传感器或者摄像头,每一个摄像头在一秒钟会产生20兆到30兆的数据量,每天八小时大概能产生40TB的数据,都放在云端计算的话,整体的所消耗的带宽大概需要10个GB的贷款,这在过去4G时代,是根本不可能计算并处理完这么多数据的。
2.其次是百度AI的技术优势
最新发布的百度大脑5.0,再次向外界了展示了百度在AI方面恐怖的掌控力。
随便举个例子,百度的语音合成技术,已经能够实现风格迁移、音色模拟和情感拟人,仅仅需要20句,就可能合成模拟一个人的专属声音。
这个差距有多大呢,形象点说,当别人还在刀耕火种,百度已经坐上了轰鸣的小火车。
百度副总裁侯震宇在 AI+5G 论坛致辞中表示:
“OICT三大赛道(IT/CT/OT)在 AI 赋能下即将发生巨大的变革。百度已拥有强大的软硬一体 AI 大生产平台,我们相信百度 AI 和 5G 相加,能够给消费互联网和产业互联网,to C 和 to B,带来大量的机会和挑战。”
简单来说,在 5G 应用场景爆发的前夜,百度在“软”和“硬”两方面已经具备了强大的技术优势和跨平台跨场景的整合能力。
先说说百度的听和说。
无论是家居、车内还是工业生产等场景,腾出双手的语音交互无疑是最佳的交互方式。但具体到实际使用场景,则面对准确性与效率两大门槛。
而百度通过流式多级的截断注意力建模(SMLTA)方法,使得识别准确率相对于上一代的 Deep Peak 2 提升了 15%。不仅可以准确识别长句,即使中英文混合语音也能实现极高的准确率。百度语音技术部高级总监高亮的那段“Rap”就是极好的范例。
现在的百度语音识别技术已经能够做到从感知层到识别层,并且能够做到中文化混合识别。
关于说。百度发布了风格迁移的语音合成技术 Meitron。通过基于整个音库独立输出音色、韵律和情绪三个网络,百度 AI 不仅做到了声音“像”,还有风格的高度高度相似。目前仅用 20 句话即可制作专属声音。
如果说语音更侧重于解决人机交互的问题,那么视觉则瞄准了物与物之间的连接。
百度AI 在视觉方面,实现了从感知到反馈的一整套技术解决方案。现场则通过复原圆明园的案例,进行了 AI+5G 落地应用的相当形象的展示。
只需要通过一台普通的智能手机,百度 AI 便能对场景完成建模,游客站在断壁残垣之上,通过手机便能观看到复原后的场景。
基于视觉VPAS模型在 5G 条件下的 AR 离线建模渲染能力,实现对场景的复原和跟踪。这一技术的难点在于,不仅根据用户位置的变化实时计算调整,更需要与用户交互避免延时,甚至造成复原穿帮。
如果说,基于飞桨框架在训练侧、推理侧以及基础设施的赋能,以上这些强大能力都能很好地被合作伙伴、百度内部的工程师所使用,更强调百度的开放的话;那么在最核心的芯片上的实质性进展,则显示出百度 AI 对产业的野心。
一方面,AI计算需求推动下,AI芯片已经几乎成为标配;另一方面,算法复杂程度不断提升,计算类型与场景多元化加深,对功耗、成本、可靠性的要求进一步提升;另外,AI计算对于内存带宽要求的不断提高更不能忽视。
而百度自研的 XPU 架构便是瞄准趋势而生,实际上,XPU 架构的诞生最早能追溯到 2013 年,百度AI 芯片资深主任架构师欧阳剑强调:
“由XPU架构驱动的百度AI处理器昆仑将让计算更加智能。百度完全自主知识产权、基于业界最先进的XPU架构研发的昆仑芯片工程样片,已经流片成功并顺利通过全部测试,即将实现量产。”
这意味着,进入 5G 时代后业界一直呼声很高的终端-边缘节点-云数据中心(D-E-C)全场景,在百度这里已经具备了相当深厚的积淀。
终端与云的布局对于百度而言已经相当深厚,这一次论坛百度进一步公布了边缘计算的布局。
3.推动AI+5G融合的边缘计算行动计划
这次分论坛的另一大成果便是百度联合中国联通、中国移动、中国电信、中兴通讯、爱立信、Intel、浪潮、富士康工业互联网等合作伙伴,共同发起百度AI边缘计算行动计划。
什么是边缘计算,简单来说,就是利用设备端最近的计算能力,无需上传到云端,在本地就可以完成简单的AI需求。
两年前,一款名叫「Prisma」横空出世,用户只要将自己拍摄的照片交给这个 App,就会得到一张可媲美历史名画的「艺术照片」。其实本质上就是利用基于云端的卷积神经网络算法,但这个app虽然得到全球用户的青睐,但因为每张图片都要上传到云端服务器,通过云端的卷积神经网络算法来处理这些照片,速度缓慢,因此用户体验非常差。
这便是一个典型需要边缘计算的场景。
在 AI+5G 的大趋势下,边缘计算正面临着三大场景趋势。其一,终端正不断智能化,数据量与计算类型对于算力提出更高要求;其二,越来越多的产品形态加入用户时间的竞争;其三,工业端的数字化进一步推进。
边缘计算对于AI的发展落地非常重要。以农业为例,现在很多城市都在利用农业无人机喷洒农药,但城市上空的网络环境很差,借助边缘计算架构,能够实现无人机上直接运行识别算法,避免了数据传送到云端、识别结果发送到设备的延时。通过这种“精准用药”,农户的农药使用量降低了50%,提高了经济效益。
再比如,而当车辆面对并道、超车等情况时,车辆短时间被便需要完成车速、车距、角度等大量复杂的实时计算,云端处理过程中的些许延时便可能酿成车祸,因此车载系统的边缘计算能力便非常重要。
4.以及
5G商用已经箭在弦上,而AI+5G广阔的想象力,一定会产生巨大的变革,未来,AI+5G、边缘计算所产生的聚变反应必将超乎想象,深刻影响金融、制造、零售、教育等各行各业的发展模式,这让我想起一段话,在百度AI开发者大会官网上的一段话:
1769年,蒸汽机的发明改变了众多行业的生产方式,煤炭正在重塑一家家企业的生产效率,钢铁成为创业者新的生产资料。那时,年轻人放下手杖和礼帽,拿起扳手与图纸,勾画出轰鸣咆哮的工业时代。
250年后,人工智能技术正在帮助无数企业改变沉静已久的生产方式;众多开发者和企业正在通过百度大脑,百度智能云把Al和数据变成新的生产资料;农业、工业、教育、医疗……百度的Al能力开始改变众多行业的效率。智能家庭、无人驾驶、云……Al的马达声鸣响,分贝竟似不亚于蒸汽机、内燃机、电气系统这些大名鼎鼎的前辈。
未经授权禁止转载,如果转载,请联系ID:spymagicv