RASA智能聊天机器人,理论与技术

一,智能聊天机器人

 

  • 一种通过自然语言模拟人类进行对话的程序
  • 可以代替企业中相对固话、重复的人力密集型任务或流程

-问题咨询:基于业务知识库进行业务问题解答

-数据检索:纵跨各业务系统或数据库,检索数据或文档

-业务处理:对接相关业务系统转达指令,完成相应业务操作

  • 典型业务场景∶

-业务咨询问答机器人、智能客服机器人、行政助理机器人、产品推荐机器人

  • ….对外提供客户服务,对内进行业务辅助
  • 智能化的机器人可以带来全方位的效能提升,降本增效

------------------------------------------------------------------------------

聊天机器人的本质:会话式UI

  • 提供了一种新的交互方式:会话式UI(CUI , Conversational User Interface)
  • 会话式UI:通过会话形式将已有数据、功能、服务展示给用户

RASA智能聊天机器人,理论与技术_第1张图片

目前聊天机器人分为两大类 : 基于检索  VS  生成模型

RASA智能聊天机器人,理论与技术_第2张图片.尽管目前生成式模型是学术界的研究热点,但是在实践中使用检索模型是更加合适的选择

-------------------------------------------------------------------------------

趋势:会话式UI与业务集成

  • 由于具有高度一致的基础:

--交互媒介(基于自然语言)

--交互模式(聊天会话)

  • 不同系统的CUI具有高度可集成性
  • 业务会话式UI 集成,一统各类业务系统,打造专属业务助理

----问题咨询、数据查询、指令执行、个人行政业务支持等等RASA智能聊天机器人,理论与技术_第3张图片

    二,机器人核心技术

  • 聊天机器人最核心部分是对话引擎,对话引擎包括:
    1. 自动语音识别(ASR)
    2. 自然语言理解(NLU)
    3. 对话管理(DM)
    4. 自然语言生成(NLG)
    5. 文本到语音合成(TTS)
  • 本质是自然语言处理技术(NLP,Natural Language Processing)

--研究如何让计算机读懂人类语言,既要能让计算机理解自然语言文本的意义,也能以自然语言文本来表达给定的深层的意图、思想等。

--自然语言(中/En )→模型→机器能处理的数据形式(向量)

--模型通常经机器学习在大量数据基础之上归纳得到,反应了领域数据的规律

--向量中每个数值的大小、顺序编码了自然语言的语义信息

--基于NLP,计算机可以计算文本的相似度、提取其中关键信息、进行文本分类等

机器人原理

智能机器人是由多个子机器人(问答机器人,闲聊机器人,任务机器人等),人工后台以及文档库之间协作完成任务,最终选择最有答案进行返回

RASA智能聊天机器人,理论与技术_第4张图片------------------------------------------------------------------------------

 

QA机器人    

  1. 假设用户输入问题为Q,QA数据库中的QA对为(Q1,A1)(Q2,A2)……(Qn,An)
  • QQ相似度计算:计算Q’与每个QA对中问题的相似程度
  • QA匹配度计算:计算Q’与每个QA对中答案的匹配程度
  1. 综合相似度和匹配度,找到最合适的一组QA对(Qi,Ai)

本质:基于检索的问答模型

核心问题:文本语义相似度问题

文本相似度

解决1:

NN模型(RNN/CNN)

双层编码(Decoder)的长短期记忆模型(LSTM)

需要一定文本数量

解决2:

       拆分成子问题(小规模语料)

       短文本语义表征(TF-IDF,word2vec)

       语义距离计算(余弦COS,Feed-forward NN)

QA机器人原理(QQ匹配)

原理:句向量化、相似度计算、相似度排序

RASA智能聊天机器人,理论与技术_第5张图片

 

word2vec ------词向量化

doc2vec,bert -----句向量化

simbert --- 句子相似度

-------------------------------------------------------------------------------

闲聊机器人原理

闲聊机器人:主要是进行客观话题讨论,用户对聊天机器人进行一些情感表达,回答问候,情感和娱乐等信息

  • 基于预置规则匹配:公司合规用语要求
  • 基于海量闲聊语料:满足大多数闲聊应答

可以用文本生成,对于回答的准确没什么要求

需求:简单闲聊,结果可控,快速开发

RASA智能聊天机器人,理论与技术_第6张图片

 

任务机器人原理

任务机器人(Task-Bot):基于意图识别与语义槽提取的任务机器人

  • 意图识别
  • 关键参数提取
  • 多轮会话&对话管理  
  • 配置化
  • 对接外部系统

多轮会话—用插槽slot实现-----location,time时间地点都满足才会提交这个插槽

任务机器人原理:

  1. 意图识别 设置可能问法
  2. 槽值提取 设置槽值和提示问法
  3. 触发任务 返回值提取和返回答案
  4. 多轮对话上下文自动补全 话题追踪

---------------------------------------------------------------------------

场景机器人原理

基于预置规则驱动完成场景任务 事先根据业务制定好的,引导

KG机器人原理

基于知识图谱推理给出结果,也是基于检索机器人的一种

  1. 定义领域知识图谱模型
  2. 提取表单条款 导入知识图谱
  3. 分析查询转换,图查询

---------------------------------------------------------------------------智能客服机器人    财富智能助手机器人    保险智能机器人     AIOps运维机器人

文章内容未更新完,会持续更新,个人理解。

你可能感兴趣的:(RASA,智能聊天机器人,多轮对话机器人,python)