大数据文摘记者 魏子敏 龙牧雪
“(今年七月份)我确实吃到了一张罚单。”
在2017百度世界大会的现场的开场演讲中,李彦宏称,“无人驾驶车有没有吃到罚单”是过去四个月被问最多次的问题。“但是如果无人车的罚单已经来了,无人汽车的量产还会远吗?”
李彦宏称将在2018年量产无人驾驶汽车,而除了无人车,百度本次世界大会还重磅发布了第一款智能硬件产品——与渡鸦科技合作推出的智能音箱Raven H。这是百度入局智能家居的重要动作。陆奇称这是一款能够带回家的AI大脑,百度打造自己的硬件产品是建立平台生态的一部分。
本次百度世界大会定位明确,Bring AI to Life,在硬件和生态上还发布了一系列重要动态:大会的主题是技术创新和产品创新,李彦宏陆奇等相继登场,介绍了百度AI产品化,以及商业化落地的进程。李彦宏称百度将在月底发布无需唤醒词的语音交互产品,陆奇也宣布了DuerOS2.0将发布,手机百度10.0发布。
李彦宏:我们仍然处在AI时代的黎明
按照惯例,开场演讲依然由李彦宏给出,李彦宏称将在2018年量产无人驾驶汽车、百度将在月底发布无需唤醒词的语音交互产品。大数据文摘记者速记了演讲精华如下:
各位上午好,欢迎来到2017百度世界,我们一年一度的百度技术和产品创新大会,今年的差别是推迟到冬天召开了,因为7月份召开了开发者大会,7-11月短短4个月发生了一些改变,我们诞生了不少新的技术和产品。7月份,我想给大家留下最深刻印象的东西,或者我被问最多的问题是:你有没有吃到罚单。那我今天告诉大家:确实吃到了一张罚单,但是如果无人车的罚单已经来了,无人汽车的量产还会远吗?
我们希望更早地生产无人车
从7月到现在,Apollo目前的一些数据:6000多个开发者投票支持apollo,1700多家合作伙伴使用apollo开源代码,100+合作伙伴申请开放数据。
但是我们并不满足,我们希望更早的生产无人车,首款无人驾驶小巴车,将于2018年实现量产。
2018年量产无人驾驶小巴车,这是它的长相▲
我们的合作伙伴,江淮汽车、北汽都会在2019年生产基于apollo的自动驾驶汽车。大家如果去了奥森,会发现扫地车已经是基于apollo的自动驾驶车自动运行了。
打造一座世界领先的智能出行城市:雄安
而AI除了对汽车,对人类生活方方面面都有影响。
我们目前在跟雄安合作,希望打造一个没有安检、拥堵的新的千年大计的城市:一座世界领先的智能出行城市。未来的城市和今天的相比很不一样。
李彦宏展望雄安新区未来:没有拥堵,没有雾霾,没有排队,没有繁杂的流程▲
这些进展都是去年百度世界大会讲的一个事情支持的:百度大脑。
百度大脑包括语音识别、图像识别、自然语言处理、用户画像。▲
从去年到现在,百度已经开放了核心的80+核心AI能力,通过API形式供大家使用。而百度大脑广泛赋能,日调用次数2188次。
大家可能注意到今天的大会两边屏幕有文字上屏,准确率在会场环境下达到95%,英文翻译也很不错,到什么程度呢?如果用大学英语6级翻译测试题测试,15分的题目可以达到13.6分,已经超过了平均大学生的成绩。
电视,从听话到聪明
人工智能除了在手机汽车等场景的使用,在家庭里也有很好的使用。比如电视,很多人都不怎么使用遥控器,按钮太多了。但是当电视和人工智能结合,电视就可以变成聪明的电视。
(VCR)电视里正在播放战狼二,出现吴京出场的那一段,可以语音向电视提问:最左边的男演员是谁?这首背景音乐是什么?谁作曲?帮我收藏,帮我搜索所有吴京电影,要和战狼同一题材的。
所以大家可以看到,电视虽然不用学习遥控按钮,但是它的聪明程度更加符合人类需求,这里边当然包含了百度大脑的很多能力:语音识别和视频搜索。
未来,无唤醒词,才能成为自然语音交互
我们现在看到很多智能音箱,虽然不需要按住,但是需要一个唤醒词,一般是四个字,这不符合人与人交互方式,我跟你说话的时候不需要拉你的手,也不需要没句话都叫你的名字,更不需要每次都叫四个字。
那如何更自然的交互,李彦宏又展示了一个VCR,并预告说,这个月底将发布百度手机语音版本,可以自然的和手机交互。
李彦宏在餐厅环境下边吃饭边听新闻,用语音发出指令“下一条”,“返回”,“声音大一点”▲
AI让每个人安全回家
百度apollo疲劳驾驶检测:在司机使用手机时,车载AI会提醒你不要用手机;检测到打哈欠,会提醒注意行车安全;检测到疲劳驾驶,小度为你推荐一首歌曲为你提神;戴上墨镜,靠红外检测依然可以检测到疲劳驾驶,并且导航到最近的休息区。未来,希望AI不仅仅是导航,而是可以直接将车开到最近的休息区。
我们仍然处在AI时代的黎明,这让我想起了2006年第一次百度世界大会举办的时候,那时候百度的理想或者说使命是“让人们平等便捷的获取信息”。12年来,这一点已经很容易实现。今天随着技术演进,每天都有新的电器工具被发明,但是每次发明一个新的工具,我们都要学习如何使用这个工具,世界正不可避免的日益复杂。但是随着AI时代的到来,我们相信可以用技术的方式改变这些,让机器学会听人的话,让人的负担更少,用人工智能的技术,让复杂的世界更简单。
12年前,百度更懂中文。
而今天,百度更懂你。
陆奇介绍百度AI战略布局
百度COO陆奇接下来登场,他称今天大会的主题是技术创新和产品创新,我们将介绍AI产品化,加速AI商业化落地,让AI更快走入人们生活。
“百度是AI公司,百度有最早的投入,最强的技术,最完整的布局:百度大脑、AI技术平台百度智能云,让AI更快产品化。比如apollo,由于生态,其商业化的速度越来越快,2018年后,我们将有多款基于apollo技术的汽车进入量产。”
陆奇讲解百度AI战略布局▲
陆奇称今天下午也将发布小度车载系统,DuerOS for Apollo带来一系列强大的能力和体验。DuerOS可以打造一个全新的新一代的智能电视产品,同时,更重要的是AI把移动互联网代入了全新的时代,我们叫做新移动时代:手机有更强的感知和计算能力,百度的核心产品,手机百度,爱奇艺等等将更进一步充分利用这一系列能力,引领新一代用户体验,特别是手机百度,将把搜索和个性化推荐有机结合起来,打造新一代更懂用户的体验。
百度发布第一款智能硬件产品:
Raven H-家庭生活中的搜索引擎
图:2001太空漫游里的超级电脑HAL 9000距离我们依旧遥远,不过在外形上,不论是天猫精灵还是苹果HomePod,都似乎在致敬HAL。
硬件的布局通常被视为一种抢占语音交互入口的行为。国外的厂商如亚马逊、谷歌、苹果、索尼,国内的如阿里、京东+科大讯飞、小米甚至喜马拉雅都在抢占智能音箱的市场。2015年售出250万台、2016年520万台,亚马逊Echo一直是音箱领域的霸主。而谷歌在今年10月初的发布会上,在原有的Google Home之外,发布了两款智能音箱Google Home Mini和Google Home Max,定位低端和高端消费者,直接对应亚马逊的Echo Dot和苹果的HomePod。天猫精灵更是成为了今年双十一的销量明星,截至11月11日8时53分,天猫精灵总销量图片100万台。
百度入局智能硬件的野心传言已久,本次大会上,百度智能硬件事业部总经理、渡鸦科技创始人吕骋发布智能硬件产品Raven H:这个在百度邀请函上出现的白盒子,也是百度第一方智能硬件。
"现在市面上的智能音箱可能分为卷纸、垃圾桶、保温杯和空气净化器。“这位90后的创业者一上台,就diss了目前市面上已经有的智能音箱的设计。“但能让用户像对iPhone那样发出WOW的感慨,似乎还是遥不可及。”
“我们回想一下iPhone的诞生。在iPhone之后,所有手机几乎都长一个样。因为iPhone把手指交互做到了极致。说到人工智能时代,大家的第一反应就是智能音箱了。“而吕骋认为,目前的所有音箱都没有达到苹果一般的体验。”
渡鸦在设计上破费心思周章,联合瑞典Teenage Engineering团队,为这款产品“站定了颜值制高点“。
而在产品性能上,以下数据值得参考:
此外,本款硬件还联合了全球一众重磅合作伙伴,称,选择了“鱼市里面最好的鱼”,用最好的食材做出食品。
此外,吕骋还详细介绍了从材料、喷漆工艺、音质上的巨大投入和效果。
吕骋在现场展示raven H智能音箱▲
交互来看,吕骋称,目前阶段,市面上音箱所遵循的voice only原则是违背用户使用习惯的。Raven H保留了Touch模块,既是屏幕,也是可卸下来使用,触摸操作。Touch被取下后,可以按住说话,双击暂停,滑动切歌,解决了智能音箱的操作距离问题。
技术上,Raven H全面接入了DuerOS 2.0,以及亿万级的数据请求。5米内的唤醒率做到了95%,误唤醒率0.042次/小时。速度上,平均1.4秒的平均响应速度。
在歌单上,定位了7700+定位场景。“来首摇滚”,“换首中文的”,“这首歌是哪张专辑的?”,“这张专辑还有什么好听的歌?”“我要听陈奕迅、莫文蔚、梁静茹的歌“,吕骋现场演示了与Raven H的互动,以及唱出一段”跑调“的音乐片段让Raven H找到相应歌曲。
Raven H还引入了一种新的交互模式--如意说。高度自定义可以给H随意改名,换嗓音等。
Raven H定价1699元,相比天猫精灵在刚刚过去的双十一上99元的低价,这一价格公布时立刻引起了现场一阵惊呼。“我知道其他老板卖多少钱,但是我们希望家庭大脑这样的产品成为未来家庭的必需品。“
渡鸦还与洲际酒店集团达成合作,打造智能客房。
作为果粉,吕骋在发布会上也推出了one more thing环节,Raven H摇身一变现身可以跳舞卖萌的智能机器人,并换声吕骋的声音共同主持。
这款智能音箱目前已经在渡鸦官网发售。
百度副总裁沈抖发布手机百度10.0
此外,百度副总裁沈抖介绍并发布了手机百度10.0。沈抖首先指出了今天信息搜索的几大痛点:今天的手机在AI推动下有了本质飞跃,现在手机有了听说看的能力和计算能力,在中国,平均一个网民花费3.5个小时在手机上。但是,有一系列挑战出现:首先,大量出现的信息,其中和我们真正相关的信息并不多。我们选择信息的能力和手段并没有显著提高。其次,信息服务不够好,不能帮人们高效获取信息。互联网的出现,解放了人们的认知能力,但还远不够。即使到了智能手机时代,触屏手机出现,还是不能很好的发挥人类最自然的交互方式,语音交互。
“我们真正需要的是我们自己的信息。概括来说,AI赋能的新移动时代有3个特征:更简单的获取——给合适的人推荐合适的信息;更自然的交互——跟人当时社会环境和认知能力相符合的交互;更真实的体验——能够在信息时代与物理世界交互,身临其境由超越现实。”
百度副总裁沈抖发布手机百度10.0:搜索+信息流,有事搜一搜,没事看一看▲
更简单的获取:
(这里播放了一段现场记者认为略尴的VCR:百度手机新体验-一名保安,通过手机百度长成研发工程师的过程。)
沈抖介绍了近年来百度搜索技术的进步:通过超链分析的技术,基于超链的信息组织结构,可以准确判断网页的去哪维度,帮助用户平等便捷的找到信息,找到所求。到了移动时代,视频图片不再基于超链,而是基于知识图谱。百度有世界上最大的知识图谱,有超过一亿节点,超过一千亿的属性和关系。百度比世界上任何一个其他平台更有能力理解用户意图,为中国7.5亿网民在200万维度上进行了精细刻画,形成了完整的用户画像。有了知识图谱和用户画像,百度更有能力理解用户真实需求。
更自然的交互:
最近爆发的短视频有巨大的潜力,但是有两个问题:这个视频值得看吗?看完意犹未尽是否有类似的。手机百度完美解决了这一问题。百度对长短视频进行了自动匹配:为1000万+段视频,匹配到了100万小时长视频,99%准确率。
(接下来又播出了一段vcr:小朋友和大人的搜索结果不一样)
百度语音交互的多维度语音信号:性别-地域-年龄-语速-轻声,带来定制化结果。
更真实的体验:
最后,沈抖现场演示了AR交互感受兵马俑,与兵马俑对话,并游览兵马俑一号坑。
课程推荐
数据科学实训营第4期
报名优惠倒计时第5天!
如果,你正在求职、跳槽、研究,需快速提升实战技能
如果,你渴望大展身手,搏一席之地
如果,你想在数据时代掌握主动权
那么,你需要实训营助你一臂之力!
扫描海报二维码,获取成长机会!
往期精彩文章
点击图片阅读
谷歌发布TensorFlow Lite:移动端+快速+跨平台部署深度学习