【word2vec】:三种不同格式的词向量的保存与加载

1.以model.save()方法保存词向量

保存词向量

import gensim
model = gensim.models.Word2Vec(documents, size=300)
model.train(documents, total_examples=len(documents), epochs=10)
model.save("../input/Word2vec.w2v")

加载词向量

import gensim
word2vec = gensim.models.word2vec.Word2Vec.load("./input/Quora.w2v").wv

2.保存为二进制的词向量

保存词向量

model.wv.save_Word2Vec_format(embedding_path,binary=True)
model.wv.save_Word2Vec_format(embedding_path,binary=False)#非二进制

加载词向量

import gensim
word2vec = gensim.models.KeyedVectors.load_word2vec_format(embedding_path,binary=True)

3.使用numpy进行保存和加载

保存数组数据的文件可以是二进制格式或者文本格式,二进制格式的文件可以是Numpy专用的二进制类型和无格式类型。

使用np.save()保存npy文件,np.load()加载npy文件。

你可能感兴趣的:(【word2vec】:三种不同格式的词向量的保存与加载)