【算法类】【论文笔记】Siamese Recurrent Architectures for Learning Sentence Similarity

0、 Siamese Recurrent Architectures for Learning Sentence Similarity

1、摘要

【算法类】【论文笔记】Siamese Recurrent Architectures for Learning Sentence Similarity_第1张图片
论文主要用了一个简单的LSTM模型,通过对单词进行编码,最终计算相似性的一个方法,本篇论文的创新点是将wordnet中的同义词加入进行word2vec训练,并将预训练的结果输入到LSTM进行训练。

2、方法

2.1生成词向量

第一步利用wordnet将单词的同义词随机替换训练集中的数据,利用Word2vec生成词向量。

2.2相似性计算

【算法类】【论文笔记】Siamese Recurrent Architectures for Learning Sentence Similarity_第2张图片
这里LSTMa和LSTMb利用的是共享参数,最后计算相似性用的是Manhattan距离。

3实验

【算法类】【论文笔记】Siamese Recurrent Architectures for Learning Sentence Similarity_第3张图片

4、写在最后

这篇文章验证了一个问题就是在预训练词向量效果好的情况下,简单的LSTM是可以提取复杂的语义信息。同时,这篇文章模型很依赖外部数据。

你可能感兴趣的:(论文笔记)