GloVe模型_3分钟热情学NLP第9篇

3分钟热情学NLP第9篇,GloVe模型

GloVe的全称叫Global Vectors for Word Representation,它是一个基于全局词频统计(count-based & overall statistics)的词表征(word representation)工具,它可以把一个单词表达成一个由实数组成的向量,这些向量捕捉到了单词之间一些语义特性,比如相似性(similarity)、类比性(analogy)等。通过对向量的运算,比如欧几里得距离或者cosine相似度,可以计算出两个单词之间的语义相似性。

模型目标:进行词的向量化表示,使得向量之间尽可能多地蕴含语义和语法的信息。
输入:语料库
输出:词向量
方法概述:首先基于语料库构建词的共现矩阵,然后基于共现矩阵和GloVe模型学习词向量。

实现步骤


glove实现步骤

参考:https://blog.csdn.net/coderTC/article/details/73864097

你可能感兴趣的:(GloVe模型_3分钟热情学NLP第9篇)