人工智能=人工智障?对话交互如何打破这个魔咒?

让语音助手发100元红包给好友,结果它真发了“100元红包”几个大字......

让智能客服帮我推荐一下衣服尺码,结果告诉我“亲,这个问题我还不会,输入人工客服帮您转人工”......

有个能说会道叫Sophia的机器人被授予沙特公民身份,结果却发现是一个背后由人来操控发言的木偶......

会聊天的人工智能为什么经常被大家吐槽是“人工智障”?智能对话交互为什么经常“踩雷”?有什么办法,能让对话交互不那么智障吗?

交互模式的转变:从被动到主动

从1960年命令式交互,到1984年图形用户界面交互,长久以来,人机交互一直延续着人类输入、机器反馈的交互模式,人类始终占据主动,而机器是被动的。

随着近年来对话式交互的出现,人机交互的模式逐渐出现转变:从人类“将就”机器,变为机器“顺从”人意。

机器的情境感知和自主认知能力的提升,使得能够“贴心”地主动服务于人类,例如在车载场景中,AI 助手主动询问目的地进行导航,或是在购物场景中,智能客服主动为用户推荐合适的商品。

主动交互的本质,其实是收集用户的意图,并把用户的表达转变成语义结构,根据语义结构的内容和业务逻辑连接不同的功能。

GUI vs CUI

目前市面上的互联网产品,基本采用了 GUI(Graphical User Interface,图形化交互界面)的交互形式,用户进行任何操作,都需要知道你要的功能藏在菜单系统的什么地方,再经过层层点击,获取功能。

例如手机淘宝 app,就是一个典型的层层嵌套的 GUI 交互范本:

而通过自然语言进行对话交互,是唯一的不需要学习的主动人机交互方式:你永远都知道如何用语言表达出你想要做的事情。

基于对话交互的 CUI(Conversational User Interface,对话用户界面)比起用 GUI 的方式,大大降低了学习和使用门槛,越来越多的人都可以通过自然语言来进行对话交互,让信息触口可及。

对话交互的现状

近期,奇点机智作为对话交互领域的 AI 百强企业,受邀参加在纽约举办的世界级对话机器人大会 chatbot conference 2019, 会中表明,当下对话机器人应用的两大热门方向是市场营销/客户服务,以及企业自动化进程

从行业角度来看,对话机器人已经出现在各行各业以及我们生活的方方面面。根据 IDC 预测,对话式 AI 将在未来五年内为金融、零售、医疗等传统行业带来价值提升,提升幅度将分别达到64%、62%、48%。

技术上,随着 EMLO、GPT、BERT、GPT2 等一系列模型的出现和应用,以及计算能力的提升, 让对话交互进入到高速发展与普及的时期。对话机器人也从 FAQ的方式把一堆信息只要相关都返回给用户,到成为能结合语境对话的助手、为用户选择合适的细节信息进行反馈。

对话机器人为什么容易变“智障”?

与图形用户界面(GUI)相比,对话用户界面(CUI)存在着更大的挑战。

其一,在图形用户界面下,用户只能严格按照界面定义的菜单和次序进行逐步操作。但对话界面下,用户可能不按次序出牌,想到什么说什么。

因此,在定义对话的过程中,可能存在这样的问题:在用户对话的路径或者先后顺序千变万化,很难覆盖所有的路径

以“推荐餐厅”为例,大部分对话平台工具是按照命令式来定义静态对话路径,比如按照餐厅类型、距离远近、评分高低的顺序进行定义。但当用户不按理想次序进行对话时,比如用户说“帮我推荐个离我最近的、大众点评口味9.0以上的餐厅,不要日料”时,机器人很可能因为没有覆盖这个路径而显得“智障”。

“智障”对话案例

其二,在对话界面下,用户可以用成千上万种不同的说法表述同样的语义,这是自然语言的魅力,同样也是对话交互的难点。

以 HR 机器人例,当用户说:“查询4月份的税后薪资”,机器人可以成功执行,但当用户的表达发生变化,说“帮我查上个月工资”、或“上次我的薪水发了多少”时,它可能就听不懂了,但其实都是对应到“查薪资”这个意图。

另外,语音识别、自然语言理解技术虽然有显著进步,仍存在一定使用门槛,另外很多场景的对话逻辑相对复杂,这些因素都在为对话机器人变“智障”添油加醋。

能否打破“人工智障”的魔咒?

听懂人话,是打破人工智障魔咒的第一步,那么首先就要解决上文提到的“难以覆盖所有对话路径”以及“表达方式千变万化”的问题。

为了解决这两个问题,奇点机智推出了对话机器人开发维护平台“对话流”,为产品经理和对话体验设计师打造一站式的对话体验定义维护环境。

我们发现,在定义对话、收集用户信息的过程中,应该专注于收集什么,而不是如何收集。基于这点发现,奇点机智独创了通过声明式来定义动态对话路径的方式,只需考量向用户收集什么信息,无需覆盖所有路径,可以有效提高开发效率及产品灵活性。

对话流隐藏了语音识别、自然语言理解等繁琐的技术细节,能够将用户同一语义的不同表达对应到相同的意图,零认知也可利用前沿技术,有效降低开发成本和周期。

人类对话的本质,说到底是思维的交流或交换。虽然机器与人的思维高度还存在很大距离,但让机器理解人类并且说人话是创建好的对话体验的开端。

要打破智能对话产品“人工智障”的魔咒,建议企业选择合适的垂直领域并设置好边界,注重对话系统后的思考及解决问题的能力,而不是为了拥有 AI 而植入智能对话。

你可能感兴趣的:(人工智能=人工智障?对话交互如何打破这个魔咒?)