对话系统-“任务型”多轮对话(三):对话策略(DP/Dialogue Policy)【根据前面的对话状态决策要采取的最优动作(如:提供结果,澄清需求..)】【基于规则(工业界用的多;可控);基于模型】

对话策略模块的主要功能是根据前面的对话状态决策采取的最优动作(如:提供结果,询问特定限制条件,澄清或确认需求等)从而最有效的辅助用户完成信息或服务获取的任务。该模块基于用户输入的语义表达和当前对话状态输出下一步的系统行为和更新的对话状态。

举例
text=“人民币对美元的汇率是多少”。“查询(槽位1=人民币,槽位2=美元)”这样的形式将作为对话管理模块的输入,这时候状态追踪模块就要根据前几轮的信息,结合该输入判断该轮的查询状态,确定查询的槽位,以及与数据库的交互。如得到想要查询的确实是人民币对美元的汇率信息。这时候,根据现有的对话策略判断当前的槽位状态,最后给出对话管理模块的输出,如查询结果(源货币=人民币,目标货币=美元,汇率=1:0.16)




参考资料:
任务型多轮对话系统概述

你可能感兴趣的:(#,NLP应用/对话系统,人工智能,自然语言处理,任务型多轮对话,对话策略)