word2vec.load()报错的解决方法

很感谢 https://www.cnpython.com/qa/49234.终于解决问题了。记录一下。
在网上找了一些大的词向量模型,load的时候一直报错:

# 最初使用的load方式
from gensim.models import Word2Vec
model = Word2Vec.load('./model/baike_26g_news_13g_novel_229g.model')

load .model后缀时报一下错:

AttributeError: 'EuclideanKeyedVectors' object has no attribute 'negative'

查资料说换成.bin后缀的就行了,结果又报错:

_pickle.UnpicklingError: invalid load key, '6'.

中间又改了些什么,报错:

AttributeError: 'Word2VecKeyedVectors' object has no attribute 'vocabulary'

最后将代码改成下面这样,好了。

from gensim import models
model = models.KeyedVectors.load_word2vec_format('./model/word2vec_779845.bin', binary=True)

原因:
为了在不同的训练算法(Word2Vec、Fastext、WordRank、VarEmbed)之间共享词向量查询代码,作者将词向量的存储和查询分离到一个单独的类keyedvorters中。将word2vec类中的两个方法和几个属性弃用了。

old new
Word2Vec.load_word2vec_format KeyedVectors.load_word2vec_format
word2vec_model.save_word2vec_format word2vec_model.wv.save_word2vec_format
model.syn0norm model.wv.syn0norm
model.syn0 model.wv.syn0
model.vocab model.wv.vocab
model.index2word model.wv.index2word

你可能感兴趣的:(python,自然语言处理)