机器阅读理解machine comprehensive

梗概

(1),word continuous representation

将词向量表示成连续的向量形式,通过wordembed模型

(2),word continuous representation to sentence continuous representation

将词连续向量转换成一个句子连续向量,通过卷积或lstm来实现。

机器阅读理解machine comprehensive_第1张图片

具体应用有:

通过句子的语义连续向量和recurrent continuous translation来机器翻译。

通过句子的语义连续向量对句子所表达的主题进行分类;

通过句子的语义连续向量进一步compositionality来得到discourse或conversation或paragraph的continuous representation

(3),Cloze test  or cloze-style query

Today, I went to the ________ and bought some milk and eggs. I knew it was going to rain, but I forgot to take my ________, and ended up getting wet on the way.

 

相关模型:Text Understanding with the Attention Sum Reader Network

机器阅读理解machine comprehensive_第2张图片

 

(4),Attention mechanisms 

原理:由于将一个sentence转换成一个向量可能丢失信息,尤其是对于句子太长的情况下。因此有人提出对每个词都转换成一个上下文相关的向量,因此一句话有n个词将转换成n个向量,而不是一个向量。在应用中再根据相关性计算出句子向量与当前翻译的词的相关性,来动态的构造出句子向量的representation。

应用:机器翻译、机器问答系统。

 

2,具体流程

(1)将句子或文本转换成

机器阅读理解machine comprehensive_第3张图片

(2)将问题转换成一个向量

(3)计算问题和各ci的相似度,取最大值的位置,即是问题的答案

机器阅读理解machine comprehensive_第4张图片

 

你可能感兴趣的:(自然语言处理应用)