python根据词向量计算相似度_基于词向量的词语间离和句子相似度分析

基于词向量的词语间离和句子相似度分析

苟瀚文

1

苟先太

2

【摘

要】

分析了词向量在自然语言处理中的作用。使用已经训练好的词向量进

行了简单类比推理、词语间离和句子相似度分析。给出一种结合词向量和传统

语义解析两者优点的句子相似度计算

WCos

公式,通过传统语义分析将程度词

单独提取处理,使用权值修改对照表进行权值设置,然后对余弦相似度公式进

行修正。该方法在句子相似度分析方面明显优于单纯依赖于词向量的句子相似

度分析方法。

【期刊名称】

黑龙江科技信息

【年

(

),

期】

2018(000)033

【总页数】

2

【关键词】

词向量;句子相似度;分析

https://www.zhangqiaokeyan.com/academic-journal-cn_heilongjiang-science-

technology-information_thesis/0201270267826.html

1

介绍(机器中自然语言常见表达方式)

自然语言处理(

Natural

Language

Processing

NLP

)是人工智能中最为困

难的问题之一。机器对自然语言中的词语和句子相似度的认知是

NLP

里面的一

本基本问题。为此,首先需要把词语进行符号数学化或词语数值化表达。机器

中常见语言表达方式分为两类:

第一类:基于语义和语法的传统表达方法,其中以

WordNet

为代表

[1]

WordNet

网络中,一个多义词将出现在它的每个意思的同义词集合中,因此

其在同义词寻找方面有一定的优势,但其难于使机器准确理解和度量词语间的

你可能感兴趣的:(python根据词向量计算相似度_基于词向量的词语间离和句子相似度分析)