论文阅读:Memory Networks

一、论文所解决的问题
实现长期记忆(大量的记忆),并且实现如何从长期记忆中读取和写入,此外还加入了推理功能
为什么长期记忆很重要:因为传统的RNN连复制任务都不行,LSTM估计也够玄乎。
在QA问题中,长期记忆是很重要的,充当知识库的作用,从其中获取长期记忆来回答问题
上面这个问题就是,当遇到有若干个句子并且句子之间有联系的时候,RNN和LSTM就不能很好地解决,以为是长期依赖,需要从记忆中提取信息
二、论文的解决方案
(0)整体架构一览
实际上所谓的Memory Network是一个通用的框架而已,内部的输入映射、更新记忆映射、输出映射、响应映射都是可以更换的

论文阅读:Memory Networks_第1张图片
(1)特定于自然语言的实现
the I module takes an input text.
The text is stored in the next available memory slot in its original form
The G module is thus only used to store this new memory, so old memories are not updated.
论文阅读:Memory Networks_第2张图片
论文阅读:Memory Networks_第3张图片
论文阅读:Memory Networks_第4张图片


三、论文中的方案解决该问题,解决到了什么程度?

其实论文中主要就是提了一个大的框架,而框架中的每一个模块都是可以变更的,这样可以适应不同的应用,但是实质上并没有较大的创新,本质上还算是一种RNN类型的网络。


四、实验
(1)实验结果
论文阅读:Memory Networks_第5张图片

你可能感兴趣的:(论文阅读)