gensim.models word2vec 参数

文章目录

  • 前言
    • 1、min_count
    • 2、sg

前言

使用gensim.models word2vec的一点参数记录


1、min_count

  word2vec保留的最小词频数,当语料库中的词词频小于min_conunt时Word2vec会自动删除这个词,在最终生成的模型中,不会含有这个词的词嵌入向量

2、sg

  0, 则是CBOW模型;1则是Skip-Gram模型;默认是0即CBOW模型,其中Skip-Gram模型更适合稀疏向量,而稠密向量CBOW模型更好一些。
  这里是另一篇博文详细记录了gensim.models word2vec的参数

你可能感兴趣的:(机器学习,word2vec,人工智能,nlp)