《学术小白学习之路10》论文常见方法:Doc2vec-句向量模型实现

1. 数据

用于文献的摘要的相似度的计算

## 导包
import pandas as pd
import jieba
import gensim
from gensim.models import Doc2Vec
from gensim.models.doc2vec import TaggedDocument

《学术小白学习之路10》论文常见方法:Doc2vec-句向量模型实现_第1张图片
再定义停用词典,用于分词,还可以自己定义一个分词词典

## 读入数据
papers = pd.

你可能感兴趣的:(学术小白学习之路,学习,笔记)