2014 年 5 月 29 日下午,初代微软小冰首次亮相,当时的“奶茶妹妹”章泽天还是小冰团队的一名实习生;三年过后,霸道总裁刘强东已经“明令禁止”朋友称呼章泽天为奶茶妹妹,而作为京东的老板娘,章泽天随手办个晚宴就能请来半个时尚圈的名流。与此同时,我们也迎来了已经完成蜕变的微软小冰。
记者 | 周翔
第五代小冰
第二阶段是初级感官,即在人工智能系统中,用一种核心引擎(如小冰的EQ核心对话引擎)将上述各种交互统一起来,使不同感官可以混合运用。例如,在文本对话过程中自然切换至图像、语音,再切换回文本。小冰从 2015 年第三代发布起,进入这一阶段。
第三阶段是高级感官。小冰的首席架构师周力表示,今日发布的第五代小冰率先进入这一阶段。
全双工语音感官
实时流媒体感官
据介绍,微软是行业内唯一一个推出了高级感官实际落地产品的人工智能企业。
生成模型
在今天的发布会之前,微软正式对外公布的小冰商业化案例有两种:
日本版小冰在日本为境内第二大连锁店LAWSON提供对话式人工智能托管,并在对话中引入LAWSON线下店内服务,线上至线下消费的转化率超过50%,而此前通过其它途径进行的转化率仅为8%左右。
在中国,小冰则为广大内容提供商提供微信、微博公众号托管。目前已有约10%的媒体、自媒体公众号由小冰提供人工智能托管解决方案。
然而,作为一家上市公司,已经打磨了 3 年的第五代微软小冰面临着一个严峻的问题:如何加快商业化的步伐?今天,微软终于给出了答案,一个是与 IoT 设备厂商合作,一个是大规模、低成本的内容生产。
IoT 设备
根据小冰产品总监彭爽的说法,从两年前开始很多厂商都来找过小冰团队,希望和小冰在 IoT 上有所整合,但是他们团队一直都保持克制,而这主要是出于两方面的考虑:
一方面,两年前 IoT 这个行业还不够成熟。
另一方面,我们一直在问自己,也在寻找一个说服我们自己的产品方案。
此外,彭爽也表示,为了进军 IoT 领域,他们特意绕开了三个大坑:
第一个现象,功能上的堆砌。认为只要功能足够丰富就有了人工智能,甚至有一些智能音箱会让用户在上面去上网买东西。问题在于为什么用户要放弃很方便的手机不用,逼着自己一遍遍地跟音箱来说话买东西,这背后反应的并不是用户的需求。
第二个现象,过分的重视交互。认为只要有了对话、有了语音交互就有了人工智能。交互也好、语音也好,虽然都是人工智能的重要组成部分,但是并不能形成核心,特别不能形成用户之所以使用 IoT设备的一个核心,反正到今天为止我是没有见过有人跟自己家的冰箱、空调聊天的。
第三个现象,因为有越来越多的厂商进入到这个领域,而他们特别希望有丰富的功能,所以人工智能的厂商倾向于投其所好地给他们提供这些对话的接口、语音的接口、图象识别的接口,甚至把这些接口打包起来形成SDK给他们提供,并且称其为给硬件设备赋能。在我们看来这样的赋能没有解决本质的问题,也就是为什么人们为什么从本质上需要 IoT 设备,使用 IoT 设备的问题。
在小冰团队看来,IoT 应是 AI 的一个载体,而不是反过来,把 AI 视为 IoT 的一个功能。真正能普及的 IoT 设备,成功的可能性只有两个:或者把 IQ 做到极致,让用户通过 IoT设备体会到比其他现有方式更加便捷高效的益处,或者把EQ做到极致,让人们能强烈地认知到她在这个设备里的存在,产生情感纽带。微软小冰的 IoT 方案属于后者。
在今天的发布会上,彭爽表示,小冰已与小米IoT开放平台有机融合,小冰可以控制小米米家平台上的全部 35 种智能设备。该产品目前已在小米米家平台上线。此外,微软还宣布了与 Yeelight 及东方明珠等合作伙伴正在进行的联合研发,具体产品预计得两个月之后才会正式公布。
此外,微软今天还同时发布了小冰电台,它可以基于多重来源,面向任何主题,自动创造永不间断的电台节目。同时,它还能在交互过程中实时改变节目内容。小冰电台的 IoT 版本正在研发中,而微信小程序版本已于发布会结束后上线。
内容生产
今年 5 月,微软宣布小冰用多个化名在各诗歌论坛和刊物上发表诗歌,并出版了首部人工智能创作诗集。本次发布会上,微软公开:小冰已进入多个创造领域试水,包括有声少儿读物、歌曲、新闻等。
小冰内容及运营总监徐元春以《格林童话》举例,“210 集的《格林童话》有声读物的内容大概是 50 小时,我们选择了和小冰水平类似的有经验的人类做比较,他们完成这样一个作品需要200 个小时的工作时间,而小冰从头到尾只需要 24 分钟。从成本的角度来说,人类完成这样一个作品需要用超过 6 万元的费用,而小冰分摊下来的所有成本大概只有 7 毛钱。在同等质量的前提下,人工智能创造无论从成本上还是时间上,正在给内容产业带来非常大的变革。”微软宣布即日起开始大规模生产有声读物并投入市场。
歌曲方面,小冰的最新训练达到了 48kHz 采样率,同时大幅度扩展了音域,正在不断接近人类歌手。根据现场的演示,小冰唱歌的自然度确实要比初音未来好很多。
此外,小冰还通过聆听分析歌曲旋律,结合对不同城市标志性建筑的学习,创作与该城市及歌曲心情有关的视觉作品。通过这一技术,微软与 SELECTED 合作推出“天际线”服装。
智媒体商业平台解决方案 3.0
小冰的野心不仅仅是 IoT 设备以及内容生产,而且还要变革媒体的生产和消费方式。
Bing中国及微软小冰商业平台负责人曹文韬表示,过去一年来,该解决方案的2.0版本已从微信、微博双平台,逐渐演进为接入和即将接入近11个端媒体。
随着微软小冰与Bing搜索引擎的加速整合,升级后的智媒体商业平台解决方案 3.0,包括媒体生产力、媒体知识图谱、智能交互、全平台互动等六个新模块。
其中,通过 Bing 搜索引擎的全球大数据能力,新的解决方案可为媒体构建出一个基于全球新闻数据源的媒体知识图谱,从而能准确挖掘全球资讯中每一篇内容背后的知识与含义,并构建出彼此的关系,从而帮助媒体更全面快速地梳理时间和内容背后的故事。
小冰的成长史
作为第一个由中国团队领导,并推向全世界的微软产品,小冰在诞生之初就获得了微软内部华人高层的支持。
就在小冰公测的前一个月,李笛来到了时任微软全球执行副总裁陆奇的办公室,向他介绍这款产品,最终得到了陆奇的拍板。
“小冰这个项目是当微软全球执行副总裁陆奇直接拍板决定的战略级试验,陆奇很有意思,他去百度之前,不管是什么活动,只要是微软最重要的活动,哪怕是 Office 的发布,他都穿着小冰的体恤,上面写着微软小冰。”
2016 年 8 月,第四代小冰发布会召开前夕,因为自行车事故受伤的陆奇还在台湾进行就诊,却仍然坚持要赶回北京为小冰站台,在发布会结束后,陆奇立马换上了腿部护具。
当然,除了陆奇之外,至今仍在微软的沈向洋也是小冰的坚定支持者。在陆奇离职之后,小冰团队一直是跟沈向洋沟通。而且,在今天的第五代小冰发布会上,沈向洋也亲临现场,为小冰站台。
虽然陆奇在参加完第四代小冰发布会不久,就因为身体原因离职,并在次年 1 月加入百度。但是这似乎并没有影响到小冰在微软内部的战略地位。
除了国际化拓展,在这三年多的时间里,这位“早熟的少女”从主持人,到歌手,到客服,各种跨界,并且在每个领域都小有所成。如今,小冰又开始进行全面的商业化试水,显然,小冰目前正在快速道上正向行驶。
编者手记