ChatBot聊天机器人学习1

1、Bot定义

能执行大量自动化、高速或机械式、繁琐的工作的计算机程序,包括但不仅限于聊天功能

2、Retrieval-based

KE(知识网络)基于信息的提取。(检索的过程中有延迟,设置比较快捷的检索方式)

2.1 Intent(意图)

把一些相似功能的命令分在一起,例如“how are you ?”和"how do you do?"都是打招呼意图,把他们放在同一个节点(因为他们回答的都差不多),后面的分支是对应的回答,例如“I AM FINE”。通过这种方式,可以使得问题泛化,就是对于用户来说,类似的问题都能得到自己想要的答案,问的方式比较灵活。(设置文本分类器

3、Generative(生成模型,类似rnn)

能生成人没有预先设定好的内容。

必读:A Neural Conversational Model

运用Neural即神经网络,训练两组对话,film dialoge(电影对白)、IT support(IT对话)。即,获取电影行业和IT行业的相关知识

3.1中英文处理区别

英文对话一般是有空格的,要把空格截掉,提取出每个单词

中文对话要用第三方的中文分词库,也起到分割的作用,类似区分主谓宾

第三方中文分词库:第三方中文分词库下载

4、知识框架(总结)

ChatBot聊天机器人学习1_第1张图片

 可以通过google的search搜索所有问题,再把结果都反馈给chatbot

5、LONG VS SHORT

5.1第一维度(回答文本长度)

回答是比较短的例如Y/N,还是比较长的对话例如今天是晴天。

但有个问题,机器生成的回答语法可能有问题,要么就是,人为提前设置,要么就是,用大量数据训练回答方式。

5.2第二维度(scope范围)

一问一答,短范围。

记住以前发生过什么,长范围。

5.3LSTM

推荐阅读:LSTM的基础干货,带脑子用心看

LSTM的设计者提出了“长短期记忆”的概念——只有一部分的信息需要长期的记忆,而有的信息可以不记下来。同时,我们还需要一套机制可以动态的处理神经网络的“记忆”,因为有的信息可能一开始价值很高,后面价值逐渐衰减,这时候我们也需要让神经网络学会“遗忘”特定的信息

6、学术界的挑战

6.1语境

(1)语言语境

一文读懂Embedding的概念,以及它和深度学习的关系

(2)物理语境

涉及到周围的物理环境

你可能感兴趣的:(ChatBot,机器人,学习)