无人驾驶出租车推出、联手华为麒麟打造芯片、无需唤醒语音交互能力,AI识别搜索,高颜值数字人……
这就是百度AI开发者大会上的一系列黑科技进展。
而且也能窥见百度正在展开的变革。
以前世界大会只秀“我怎么样”,开发者大会开始展现“我们一起能怎么样”,如今则声势浩大亮出风向:百度+AI开发者,产业会怎么样?
答案是三个字:智能化。
李彦宏振臂挥手,希望带领AI开发者,成为产业智能化的变革者。
那么百度这次,究竟准备了哪些最新的AI开发者装备?
详情传送如下。
今年大会全程由百度AI“小度”主持,首先登台的是一身白衬衫的李彦宏。
百度创始人说,今年是第三次举办AI开发者大会,所谓一生二,二生三,三生万物。
AI也是一样,正在唤醒万物。
首先分享在AI语音交互——智能音箱方面的进展。
时隔半年,小度又长新本事。
李彦宏现场亲自演示,选择“极客模式”,然后无需唤醒词——双全工状态——能实现免唤醒词连续对话。
不过,赢得满堂彩的是“拒绝反应”。即小度知道什么时候该应答和执行任务,什么时候只需要听着,不搭话、不反应。
李彦宏说, 小度的进化只是AI变革的小小缩影。
AI更大的作用力,正在展现在各行各业,且只要变革某个小小环节,就能带来大大不同。
这就是AI助力下的产业智能化。
依然举个例子,从百度最领先的自动驾驶说起。李彦宏展示出全L4自主泊车方案。
目前百度科技园,已经实现了该套方案。
然而就在此时,意外状况发生。
李彦宏只是说了一句“what's your problem?”并淡定继续演讲:
在AI前进的道路上还是会有各种艰难坎坷,我们前行的路不会改变,我们坚信AI会改变每个人的生活。
这一表态也赢得现场掌声和鼓励。
接着一切继续。李彦宏通过小度音箱现场连线吉利控股集团董事长李书福,双方秀了一把“车+互联”的场景。
李书福也来到现场,说吉利车+百度AI,能够极大提升车的智商和情商。
百度和吉利也就此正式达成智能出行合作。从吉利博越PRO开始,吉利汽车将开始搭载全面融合小度车载OS能力的GKUI19吉客智能生态系统。
交通产业的智能化变革,不止于车。
李彦宏还介绍了智能红绿灯等基础设施方面的进展。
百度创始人曾在去年百度世界大会上提到,通过智能红绿灯全局控制,可以减少20%~30%左右的拥堵等待时间。
比如在保定,智能红绿灯的运营对提升交通效率有明显的效果。
实测显示,在早晚高峰期间,市民的行程延误时间减少了20%~30%,在缓解突发交通拥堵方面,效果尤为显著。
如果说上述新进展更多是让产业和生活更智能,那接下来的几项新进展,则能展现出AI美好的那一面。
首先是AI寻人。李彦宏说,百度AI寻人已帮助超过6700个家庭重新团聚,将覆盖民政部全国1600家救助站。
百度董事长还专门强调,在走失人员中,寻找儿童的难度最大:很多孩子在走失的时候只有几岁,失踪多年后,容貌发生了变化,这给寻人带来了很大的困难。
百度AI寻人接入民政部救助管理体系后,家属只要在全国救助寻亲网上传一张照片,就能完成与民政部救助系统内滞留人员的比对。就算拿来比对的是一张多年前的照片,AI人脸识别也能快速、准确辨认出他现在的样子。
另一项是AI助盲。
这是两位百度工程师发现的语音技术应用的新场景。
他们有一次到盲人按摩店,发现因为视力障碍,盲人按摩师的工作有许多不便。他们想到百度的AI语音技术可以帮助他们,于是自掏腰包,给店里装上了小度音箱,改造了空调、隔断帘和灯带,盲人师傅们只要喊一声“小度小度”,就能开关空调、调节温度、定闹钟。盲人师傅的工作和生活因为AI很大的改变。
目前,百度AI助盲行动已经开始向更多城市推进。
李彦宏也以Do better结束演讲:
技术是百度的信仰,“用科技让复杂的世界更简单”是百度的使命。百度人在技术创新的同时,也在积极用技术去解决多种社会问题,用科技让世界变得更美好。
Do Better,科技为更好!这是科技存在的意义,也是每一个百度人不分昼夜、努力创新所追寻的意义。相信和大家一起,汇聚起科技的力量,就一定可以让这个世界变得更好。
自动驾驶方面的大进展:Apollo Go。
百度副总裁、智能驾驶事业群组总经理李震宇感慨,今年是Apollo开放的整整2周年。
这两年来已经证明:无人车时代不可能一蹴而就,弯道超车。
但开发者的创新,还是极大超出了想象。
他首先介绍了Apollo的新物种。Apollo已经与众多开发者在9大场景,完成多样化的“新物种”创新并相继落地,包括无人零售车、景区智能漫步车、智能清扫车、无人挖掘车以及本次大会首次亮相的酷黑自动驾驶教学小车。
其中,阿波龙已搭载4万名乘客,在25个城市落地运营;新石器无人零售车已提供零售服务16万次;金瑞麒智能漫游车已签约43个景区。
同时,Apollo的Minibus量产解决方案也与多家车企达成合作。与江铃合作的江铃特顺-园区接驳车已进入南昌园区试运营。
值得一提的是,全球顶级汽车制造商丰田也加入了Apollo计划 。
李震宇给出小预告:
未来由丰田提供车辆,搭载Apollo minibus(企业版)解决方案的 e Palette 将面世。
技术推进方面,除了李彦宏介绍的自主泊车方案,以及国产自主车企吉利汽车的小度车载OS能力,RoboTaxi——Apollo Go也被正式推出。
首先,前提是中国首条L4乘用车生产线也打造完成。
百度与一汽红旗联手,在吉林长春落地。该乘用车生产线即Robotaxi前装产线,可实现流水线生产,装配差异<1mm,3.6分钟就下线一台L4无人驾驶乘用车。
直接受益的是长沙。百度和一汽红旗的L4乘用车,将以RoboTaxi车队的形式在长沙展开试运营,年内就能体验,这也是中国首批规模化的RoboTaxi。
毫无疑问,Apollo Go直接对标就是Waymo One,而且无论是百度Apollo,还是车厂一汽红旗,都是中国自主厂商方面的合作。
李震宇现场放出Apollo Go的打车小程序界面——自动驾驶的终极形态,终于在现实中揭开面纱。
下一步,百度自动驾驶还会利用自身技术,率先帮助长沙完成“城市级”智能化升级,实现百公里城市道路车路协同升级改造和5G的铺设。
此外,Apollo 5.0也正式发布。
包括Apollo开放平台以及Apollo企业版两大升级。
其中阿波罗开放平台全新开放数据流水线,使开发者可以通过云端30分钟完成一辆车的动力学标定,一周可完成百辆标定。
Apollo企业版则全新发布无人驾驶出租车、智能信控两大量产解决方案,重点升级无人驾驶小巴、自主泊车、小度车载OS三大能力。
除了车端智能,百度Apollo也从交通产业全局看问题。
李震宇指出,提升城市智能化交通控制效果,关乎感知、研判和控制三大因素。
在控制方面,Apollo实现了全场景实时控制。有了智能信控系统实时调控红绿灯,就相当于每时每刻都有一个智能交警帮助疏导城市交通了。
目前,百度智能信控系统在保定的实践中,已帮助交通延误时间减少20-30%。
最后,再次被强调的是“道路千万条,安全第一条。”
大会现场,百度联合安波福、奥迪、宝马、大陆、戴姆勒、FCA、HERE、英飞凌、英特尔、大众11家公司42名专家发布了《自动驾驶安全第一》白皮书,系统应对安全挑战。
这也是全球第一份全产业链自动驾驶安全文件。
百度副总裁\智能生活群组的负责人景鲲感慨,三年前在AI开发者大会上,许下打造语音交互平台的梦想,志在家居产业的智能化升级。
而现在,最新进展能说明一切。
首先,小度助手(DuerOS)已经无处不在,智能音箱不再只是音箱了。
截止到2019年6月,小度助手激活设备量已经超过4亿台,月交互次数已经超过36亿。
另外据Canalys等三家机构报告显示,2019年第一季度小度智能音箱出货量已经位列全球第三,中国第一,成长非常迅猛。
其次就是DuerOS 5.0。
核心能力就是李彦宏开场演讲的全双工免唤醒和“拒绝回应”的技术集成。
最后,最让景鲲自豪的是,小度助手拥有了中国最大的语音交互开发者生态,目前有3万3千名开发者。
景鲲还透露,面向开发者,小度助手还会进一步推出免编程等语音交互技能开发能力。
值得一提的是,小度新品也随之发布:
家庭AI中控:小度智能音箱大金刚。
一方面,可以替代家里的所有遥控器。
还是一款可以看电视的智能音箱,拥有投屏能力。
该能力由百度和爱奇艺联合开发,全称智能电视DLNA投屏。
不需要特别硬件和协议,就能匹配市面上的大多数电视,可以观看爱奇艺内容资源。
售价,199元。
第二款产品,小度智能音箱Play.
这是一款面向年轻用户群体的专门音箱。
而且还由李彦宏的00后女儿Brenda代言。
最后,还有一款带屏智能音箱小度在家的迭代:4G版,可移动,支持Nano sim卡。
这次百度开发者大会上,百度副总裁景鲲提出了商业化的尝试:从联合会员到付费技能。
这也是智能音箱行业首个商业化的方案。
当然,无论是Apollo,还是小度助手,都只是垂直产业和领域中,百度大脑的落地体现。
百度CTO王海峰,履新后首次公开演讲,推出最新的百度大脑5.0版本。
有意思的是,在演讲前,百度的机器人表演了一段传统项目:茶艺。这个机械臂不仅会倒茶,还能和王海峰熟练地对话,并且精准识别茶杯位置。
小小的机械臂背后,融合了计算机视觉、语音交互、自然语言处理等多种AI技术。
其后王海峰正式发布百度大脑5.0。
百度CTO说,这是一个软硬一体的AI大生产平台。在百度的定义中,要将AI技术用于工业大生产,需要满足标准化、模块化、自动化。
百度大脑在语音、视觉、语言和知识等核心算法法再度重磅升级,发布6大技术突破。
在语音识别上,百度首个流式多级的截断注意力模型(SMLTA)的语音识别服务上线,让识别过程中的延时更短,准确率提高了15%~20%。
更重要的是,它在中英文混合识别上的效率更高了,无疑是解决了很多海归高端人才交流的痛点,交流过程中也不用担心中English混说了。
比如百度语音技术部高级总监高亮,在开发者大会现场秀了一段“Rap”:Hello Everyone,中英混合说是我们的everyday work,Explore技术的depth和scope是我们的responsibility……
技术人员在交流过程中英文混杂是很常见的,但是这段话还是被百度输入法流畅、精准、及时地识别出来。
至于语音识别,百度这次展示出了人文关怀一面。
百度根据一位老军人战友生前的讲话内容,实现了阴阳两隔的人之间的交流,这项技术在央视播出后感动了很多观众。
此外,王海峰还发布了知识增强的语义理解框架ERNIE和基于知识图谱的视频语义理解技术,以及业界首创的高准确度、低时延的机器同声传译技术。
去年百度发布了AI芯片昆仑,经过一年的时间,这款芯片已经流片成功。今年,百度又推出另一款AI芯片百度鸿鹄。
这是一款面向远场语音交互的芯片,双核DSP核心,平均功耗仅100mW,可以用于车载语音交互、智能家居等环境。
深度学习正在推动AI进入大生产阶段,对于百度而言,不得不提的就是飞桨(PaddlePaddle)平台。
在本次大会上,飞桨也迎来重要合作方:华为。
王海峰与华为消费者BG软件总裁王成录联合宣布:百度飞桨和与华为麒麟芯片合作,共同开拓AI的无限可能。
双方将国产深度学习平台用在国产自研芯片,二者将充分发挥各自在软、硬件方面的优势。
最后,王海峰博士展示飞桨平台在工业上的应用:百度自己用它来更智能得采集地图数据,杭州气象部门用它来快速训练天气推理模型。
但他也强调,这只是AI推动产业智能化的小小举例。
更大的红利,更深刻的变革,要由AI开发者带到各行各业,真正推动产业迈向智能化。
“夯实移动基础,决胜AI时代”是百度的战略。
而百度App就是“移动基础”的几种体现,其负责人沈抖,也带来新进展。
这位百度SVP上台之后并没有直接开始谈产品,而是以技术开场。
他率先展示的是超级分辨率,一种通过深度学习来提高图片和视频分辨率的计算机视觉技术。
左侧是原始视频,右侧是使用超级分辨率技术处理过的视频,只有原视频不到一半的流量。
依靠这项技术,百度在NTIRE(计算机视觉low-level vision领域中影响力最大的竞赛)中夺得了冠军。
沈抖介绍称,在图像和视频场景下,依靠超级分辨率技术,他们可以将实时分辨率可以提升2-4倍,并且为开发者节约50-75%的带宽成本。
但只是依靠强大的云端算法,其实没有办法完全做到在移动端实时地提升分辨率。
百度何以可能?离不开飞桨移动端部署库——百度深度学习平台飞桨的子集。
沈抖说,针对移动端的特定场景,他们做了非常多的优化,框架体积缩小至300K;通过汇编指令级速度的优化,在保持低功耗的情况下实现了超高的性能;这个框架还能支持8种软硬件平台,做到了移动端的跨平台覆盖。
飞桨移动端部署库已经在百度APP 、百度地图、百度网盘和自动驾驶等产品大规模使用。也就是说,它的可靠性已经过数亿用户验证。
之后,围绕着飞桨移动端部署库的能力,沈抖才开始介绍起了自己的核心产品,百度APP。
沈抖首先介绍的是视觉能力,旨在帮助用户更便捷、准确地看懂身边的世界。比如,用百度APP识别植物。
沈抖介绍称,百度APP已经可以智能识别两万多种植物,每一种植物都会展示相关的百科词条。
不仅仅只是识别单个物体,百度APP还可以同时识别多个物品。然后,沈抖把手机对准了一个化妆柜。
基本上,每次都能够同时识别出2-3种化妆品名字,并且在手机移动的过程中连续稳定地追踪,点击后还能出现商品详情。
沈抖说,百度APP可以识别上百万种美妆类产品,并且可以找同款,比价格,看评价,然后直接在小程序中下单。
而且在识别玩具手办上,效果也非同寻常。
沈抖介绍称,这种不需要任何的手指操作,就能像人眼一样看清、看懂的黑科技,是百度APP上最新的“动态多目标识别”能力。
基于飞桨移动端部署库,他们把原来云端200多层的视觉算法模型优化到10几层,实现了100ms以内识别物体,8ms内做出物体位置追踪更新。
相比之下,人类肉眼识别物体,一般需要170ms到400ms,追踪物体刷新需要40ms左右,这意味着百度APP的识别速度已经超过了人眼。
沈抖透露,通过400亿的训练数据,百度APP已经能识别超过1000万种物品,不管是识别速度还是识别范围,都保持了业界领先。
然后,百度APP超级探索代言人邓伦上场,集中演示了一波百度的智能搜索能力。并直接展示了百度APP应对垃圾分类的能力,比如5号电池是什么垃圾?
此外,也有其他的一些提问:科比和樱木花道谁高?库里的场均得分和詹姆斯的谁多?等等。
沈抖也介绍了这背后的实现逻辑:
通过自然语言处理技术、知识图谱等技术,百度APP能把口语化描述的问题解析成机器可理解的逻辑表达式,并找出问题中的关键点,在互联网上找到基础信息并执行计算,最终把结果呈现给用户。
能看,能听,会看。也少不了能说。沈抖也展示了百度APP基于语音合成的播报文章功能,他说,只需要少量语料数据,就可以实现的不同风格声音合成,复刻真人主播的朗读效果。
最后,沈抖也给出百度APP最新业绩:
百度APP的日活用户规模达到1.9亿,已经成为国内最大的综合性内容消费和服务平台;
百度移动生态也在不断壮大,百度移动应用的月活跃设备已达11亿台。
在2018年开发者大会上首次亮相的智能小程序,也迎来年度总结。沈抖表示,借助智能小程序,百度致力于打造服务闭环,在平台内部完成用户的所有需求,与用户之间有了新的连接。
然后,也介绍了上海车展、广东卫视、有赞以及中关村在线等案例。现在,百度智能小程序已经聚集了超过15万开发者;月活用户已经超过2.5亿。
最后压轴登场的是百度副总裁、智能云总经理尹世明。
Last but not least.
AI进产业有多热闹,看百度智能云的发展速度就知道。
百度智能云是百度AI落地的载体。以场景AI平台,让开发者更便捷地开发AI应用。
以建筑工地监控为例,上传生产视频、标注数据,再到完成模型训练,只需不到10分钟的时间。
在营收方面,百度智能云单季度收入突破10亿,是用时最快的云厂商。云计算专利方面,与AI相关的专利方面,全国第一。
不过别以为AI驱动产业智能化,就与你的日常无关。
在发布会最开始,李彦宏还发布了百度、浦发银行联合培养“数字人”。
颜值高,拥有超级大脑,非常聪明,而且完全不怕996,可以不吃饭不睡觉7x24小时上班,随时随地提供服务,还善解人意、始终情绪稳定。
目前,数字人在金融领域牛刀小试。
接下来,会在旅游咨询、医疗健康、移动通讯等领域,数字人都将大显身手。
对每个用户来说,数字人都是私人订制、终身服务的。她不会忘记任何事情,只会越来越聪明。
从产业智能化,再到每个人受惠,前景迷人……
剩下的,就是更多AI开发者投身其中、参与进来,实现一个时代的变革了。
你觉得呢?
— 完 —
AI社群 | 与优秀的人交流
AI内参 | 关注行业发展
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !