UCAS - AI学院 - 自然语言处理专项课 - 第14讲 - 课程笔记

人机对话

概述

  • 图灵测试是通过人机对话的形式实现
  • 人机对话:让计算机能够理解和运用人类社会的自然语言,实现人机之间的自然语言通信
  • 人机对话涉及语音识别、语音合成、自然语言处理、知识工程和情感认知等研究领域,是典型的交叉研究方向

任务型对话系统

  • 以完成特定任务(Task Completion)为主要目的的人机交互系统
  • 对话理解
    • 根据历史对话记录对用户当前输入的对话内容进行语义分析,识别出对话任务的领域和用户意图,并抽取出完成当前任务所必须的若干必要信息
    • 领域分类:确定任务所属的领域
    • 意图识别:进一步确定用户的具体意图
    • 槽位填充:从用户对话中抽取出完成该任务所需的槽位信息
      • 不同意图对应不同的语义槽
      • 意图识别与语义槽填充互相影响
      • 联合建模可以减少错误累积同时提升两个任务的效果
  • 对话管理
    • 根据用户当前输入的自然语言理解结果,对整个对话状态进行更新,并根据更新后的对话状态决定接下来系统需要采取的行动指令
    • 对话状态跟踪:在每轮对话结束时对整个对话状态进行动态更新
    • 对话策略优化:根据更新后的对话状态决定接下来系统将采取的行动指令
    • 对话管理方法
      • 有限状态机 FSM:将对话过程看成是一个有限状态转移图
        • Pros:可以通过对目标任务的理解制定明确清晰的状态转移图,并采用基于规则的方法控制对话过程
        • Cons:真实对话中往往会出现诸如反复询问或插入题外话的异常情况,该方法缺乏对此类异常的有效应对机制
      • 部分可观测马尔科夫决策过程 POMDP:将语音识别和语言理解不确定性引入模型
        • 最大化 reward函数
      • 深度学习 DL:将神经网络用于对话状态跟踪任务
        • 强化学习方法决定接下来系统需要采取的行动指令
        • 最大化 future reward
  • 回复生成
    • 基于对话管理模块输出的系统行动指令生成自然语言回复,并返回给用户
    • 模板方法
      • 使用规则模板完成从系统行动指令到自然语言回复的转化
      • 规则模板通常由人工总结获得
      • 能够生成高质量回复,但模板扩展性和句子多样性明显不足
    • 数据驱动方法
      • 使用统计模型完成从系统行动指令到自然语言回复的转化,目前深度学习方法是主流

聊天型对话系统

  • 一种人工智能交互系统,其工作方式是通过语音或文字实现人和机器在任意开放话题上的交流

  • 基于规则的方法

    • 预先定义好一系列的规则则,例如关键词回复、条件终止判断以及一些更复杂的输入分类器
    • 给定对话输入,首先规则系统对输入进行自然语言解析,在解析
      过程中抽取出预定义的关键词等信息,然后根据所抽取的关键信
      息,通过定义好的模板进行回复
    • Pros:回复可控,每条回复的规则均由设计者撰写,并且回复触发的相关逻辑也被精心设计
    • Cons:由于人类语言的复杂性,聊天的规则是无法穷举的,从而
      导致基于规则的聊天机器人难以覆盖所有开放领域的聊天话题,
      很多话题没有合适的回复,系统的可扩展性较弱
  • 基于检索的方法

    • 利用成熟的搜索引擎技术和人类对话语料构建的对话系统

      UCAS - AI学院 - 自然语言处理专项课 - 第14讲 - 课程笔记_第1张图片

    • 匹配模型:实现对用户信息和回复候选的语义理解,对二者语义上构成回复关系的可能性进行打分,产生最终的候选排序

    • 为了更好更一致地处理多轮对话,可以采用一个循环神经网络将整个上下文(包括当前消息和历史对话)和回复编码成上下文向量和回复向量,然后基于这两个向量计算匹配分数

    • 通过卷积神经网络将候选回复和上下文中的每个句子在不同粒度上进行匹配,然后再利用循环神经网络对句子间的关系建模,进一步提升检索式聊天机器人对上下文的理解能力

  • 基于生成的方法

    • 利用自然语言生成技术对给定对话上下文直接生成一句完整的话语进行回复

    • 主要采用基于编码-解码的Seq2Seq模型

    • 该算法可以产生训练集中没有出现过的回复

      UCAS - AI学院 - 自然语言处理专项课 - 第14讲 - 课程笔记_第2张图片

    • 主要问题:容易产生普适回复

    • 普适回复的解决方法:通过优化目标函数对普适回复进行惩罚,以减少普适回复生成的概率,或采用个性化建模回复生成模型

问答系统

  • 为用户提出的自然语言问题自动提供精准答案
  • 基于知识图谱的问答
    • 实体链接 - 关系分类 - 语义分析 - 答案查找
    • 语义分析:问答文本 - 查询表达式
    • 答案排序:检索
  • 基于文本的问答(机器阅读理解)
  • 基于社区的问答
  • 基于视觉的问答

系统搭建方法

P58-P59

你可能感兴趣的:(UCAS-课程笔记,人工智能,自然语言处理)