python文本向量化_text2vec, chinese text to vetor.(文本向量化表示工具,包括词向量化、句子向量化)...
text2vectext2vec,chinesetexttovetor.(文本向量化表示工具,包括词向量化、句子向量化)Feature文本向量表示字词粒度,通过腾讯AILab开源的大规模高质量中文词向量数据(800万中文词),获取字词的word2vec向量表示。句子粒度,通过求句子中所有单词词嵌入的平均值计算得到。篇章粒度,可以通过gensim库的doc2vec得到,应用较少,本项目不实现。文本相