聊天机器人-对话系统技术原理

对话系统概述

  1. 开放域的对话系统
    主要支持闲聊的对话方式,用户通常不具有明确的目的性。在衡量对话的质量上以用户主观体验为主,在实现上主要为基于海量FAQ的检索方式以及端到端的方式

  2. 面向任务的对话系统
    对话过程通常具有明确的目的性,主要以完成任务为主,实现上分为基于规则基于数据两种方式。衡量面向任务的对话系统的对话质量时,至少需要知道用户所指定的任务是否被系统正确完成了。

问答系统是单轮对话,面向任务的对话系统是多轮对话。后者需要维护一个用户目标状态的表示,并且依赖于一个决策过程来完成指定的任务,因此问答系统更加关注对话过程,包括目标状态表示状态迁移,保证目标状态沿着能够完成任务的方向前进。

平时我们所说的SDS(Spoken Dialogue System),默认指的是面向任务的对话系统。

任务对话系统形式化定义

为了方便进一步讲述,接下来对面向任务对话系统的任务进行形式化定义,

符号 解释
用户的对话历史语句
系统的对话历史语句
第n轮的用户对话语句
第n轮的系统对话语句
第n轮的用户动作
第n轮的对话状态
第n轮的系统动作

给定前轮的对话历史信息,包括用户的对话历史语句
、系统的对话历史语句及第n轮的用户对话语句,求。

一个典型的对话系统结构

一些关于对话系统(Dialogue System),尤其是面向任务的对话系统(Task-Oriented Dialogue System)的设计、讲解或者论文中,我们经常会看到类似:自然语言理解(NLU)、对话管理(DM)、对话生成(NLG),这样的Pipeline。


图1:一个典型的对话系统结构 A Survey on Dialogue Systems: Recent Advances and New Frontiers [Chen et al., 2014]

一个完整的系统也确实如图所示,是由语言理解、状态跟踪、策略学习、对话生成这些模块组成的。这些模块本质上是为了解决完整的对话系统问题,而拆解出的一个个子模块,这些模块的串联,组成了整个对话系统的Pipeline。

image.png

目前主流的任务对话系统实现为模块方式,由于现有训练数据规模的限制,端到端的方式仍处于探索阶段

程序实现

这里我们用python的类来实现每个部件的接口,其中每个接口最重要的方法是forward,可以认为是一个一个的pipeline直接传递的东西。

例如,我们假设我们构建了各个部件的类:

nlu = NLU()
dst = DST()
dpl = DPL()
nlg = NLG()

# utterence是用户输入的文字
def chatbot_pipeline(utterence):
      x = nlu.forward(x)
      x = dst.forward(x)
      x = dpl.forward(x)
      x = nlg.forward(x)
      return x # 这里的x已经是系统输出的响应文字了

1. NLU

输入一句用户的自然语言(utterence),输出对应的Domain, Intent, Slots

class NaturalLanguageUnderstanding(object):
    def forward(self, utterence:str) -> UserAction:
        user_action = UserAction()
        # 处理逻辑
        return user_action

2. DST

输入一个历史对话状态和NLU的输出,输出一个新的对话状态【对话状态更新模块】

class DialogStateTracker(object):
    def forward(self,
                init_state: DialogState,
                history: List[DialogState],
                user_action: UserAction) -> DialogState:
        new_ds = DialogState()
        return new_ds

DST的主要问题是如何更新当前的对话状态

3. DPL

输入一个当前对话状态,输出一个系统行为【对话策略模块】

class DialogPolicyLearning(object):
    def forward(self,
                history:List[DialogState]) -> SystemAction:
        system_action = SystemAction()
        return system_action

4. NLG

输入一个系统行为和参数,输出一个自然语句

class NLG(object):
    def forward(self, system_action:SystemAction) -> SystemResponse:
        system_response = SystemResponse()
        return system_response

你可能感兴趣的:(聊天机器人-对话系统技术原理)