对话管理及对话管理主要包括的方法

  • 对话管理: 以NLU的内容作为输入,NLG的内容作为输出,如下图:
    在这里插入图片描述
    (小白话: NLU的内容作为对话的上半句,经由对话管理,NLG的内容作为对话的下半句。)

  • 对话管理主要包括的方法及特点:
    对话管理及对话管理主要包括的方法_第1张图片
    数据驱动的方法举例:
    基于强化学习的马尔可夫决策过程(MDP:markov decision process)框架下建模对话管理:
    强化学习(RL: reinforcement learning)把对话策略的学习看作一个序列决策的问题,将对话的合理性和目标抽象成强化学习中的回报函数。(通过优化算法,选择使得长期回报最大的系统动作)
    将对话过程看成MDP,其基本思想如下:
    对话管理及对话管理主要包括的方法_第2张图片
    设系统在某个时间点的状态为st,系统根据策略Π选择在当前状态下应该执行的动作at,此时外部世界会根据当前状态,系统动作和状态转移函数,随机转移到新的状态st+1,同时获得回报R(st,at)。
    MDP以最大化整个对话过程的期望长期回报为目标来求解最优策略。

你可能感兴趣的:(面向任务的对话系统)