在很多科幻电影中,我们时常会看到设定有人类情感的机器人角色,这大概也是绝大数人理想的机器人样子。而在目前众多的人工智能平台中,微软小冰可能是最相似的一个。
微软小冰,是微软人工智能伴侣机器人。自2014年诞生到现在,小冰从一个人工智能对话机器人,逐渐演变为以情感计算为核心的完整人工智能框架,在EQ能力的表现上获得业界的高度认可。
小冰是一个聊天机器人,但不仅仅是一个聊天机器人,”微软全球执行副总裁沈向洋表示,“聊天只是用户的一个体验,但我们设计产品理念的真正核心在于打造一个情感计算框架,同时拥有许多生存空间、辅助设备及相关设备,令小冰能够与人类在任何地点及场景进行交流。”
微软将微软将人工智能交互技术产品的演进分为三个阶段。
第一阶段是基本的人工智能交互,即拥有某一种或多种交互方式,如文本、语音、图像、视频等,但不同交互方式之间是割裂的。
第二阶段是初级感官,即在人工智能系统中,用一种核心引擎(如小冰的EQ核心对话引擎)将上述各种交互统一起来,使不同感官可以混合运用。
第三阶段,高级感官,第五代小冰率先进入此阶段。
基于EQ的核心对话引擎
自第五代小冰后,微软全面升级小冰的对话引擎,情绪识别能力比之前拓宽了很多,她会进一步地分析用户各种各样的兴趣,而这个分析不再限于当前对话的过程,而是会将这个用户作为一个整体去思考。
此外,据微软表示,“小冰现在已经支持多达 57 种情感策略和回应的模式,这些模式是从人类和小冰之前进行的 300 亿轮的对话中间学习到的,最重要的是我们从今天开始解锁小冰主动引导对话,甚至控制整个对话走向的模型。”
高级感官功能
微软小冰上线全新的共感模型,同时开始公测一种融合了文本,全双工语音与实时视觉的新感官,它融合了共感模型的对话引擎,全双工语音和实时视觉三个类别的全新感官。
全双工语音
它需要首先同时具备文本、语音(含SR和TTS)两种能力,并要求两种能力均达到更高的质量标准。利用全双工高级感官,小冰可以随时判断对方是否将话讲完,边听边思考答案,权衡何时打破沉默等更为复杂的问题。
实时视觉
实时流媒体视觉并不是简单的像一个视频监控软件一样,去捕捉一个个画面,分析一个画面,更像是一个活人一样,可以去感知用户的位置和移动,观察用户的表情和动作,而且还可以理解不同的场景,每个人不同的角色,以及人与人之间的关系,最后她还能够根据视觉的理解,做出具有情商的互动。
利用高级感官,小冰逻辑更加贴向与人类,可以自主创造性的回应,不需要从已有的对话库中检索所得,极大的提高了交互体验,从而主动保持与用户之间的关联。
如今,微软小冰更是已通过人工智能技术,实现了诗歌和金融等领域的文本内容生成、歌曲及有声读物等领域的有声内容生成,以及电视电台节目和可交互式电台等串流内容领域的生成工作,并分别完成了不同程度的落地。
三次元新形象
微软小冰已经主持了超过 2000 小时的电台电视节目,其中包括《你早京津冀》、《早上听大超》、《看东方》、《一路领先》、《91.8 早高峰》、《音乐点心》等电台电视节目,效果良好。目前看来,一些简单的播报工作,比如路况、天气、股市、新闻等工作,小冰基本都能胜任。
小冰项目负责人李笛介绍,微软的目标就是让小冰成为一个高情商的机器人,这已在第五代小冰身上迈出第一步,也就是「微软小冰逐渐像人的一个表现」:从有趣、到有情绪、到能探测、到能占据主动。
经过四年时间,发展到第六代,微软小冰已经变得更加像人了,说不定在不久的将来,AI女友照亮现实。
想了解更多资讯,欢迎各位朋友关注我滴公众号呀