keybert:基于bert模型的关键词抽取工具

github:https://github.com/MaartenGr/KeyBERT

guides:https://maartengr.github.io/KeyBERT/guides/quickstart.html

使用向量计算抽取关键词,只需要预训练模型,不需要额外模型训练。

流程:
1.没有提供分词功能,英文是空格分词,中文输入需要分完词输入。
2.选择候选词:默认使用CountVectorizer进行候选词选择。
3.  model:默认方式,候选词向量和句向量的距离排序。
    mmr:最大边际距离方法,保证关键词之间的多样性。考虑词之间的相似性。
    max_sum:候选词之间相似和最小的组合。

你可能感兴趣的:(深度学习,自然语言处理)