Python 基础 jieba库——关键词提取

定义

关键词提取就是把这篇文章意义最相关的一些词抽取出来。

import jieba
import jieba.analyse
import nltk
paragraph = "生活对我们任何人来说都不容易。 我们必须努力,最重要的是我们必须相信自己。 \
我们必须相信,我们每个人都能够做得很好,而且,当我们发现这是什么时,我们必须努力工作,直到我们成功。"
words_list = jieba.lcut(paragraph)
print(jieba.analyse.extract_tags(paragraph,topK=5))
['我们', '必须', '努力', '相信', '任何人']
  • 基于TF-IDF算法进行关键词提取
  • topK表示最大抽取个数,默认为20个
  • withWeight表示是否返回关键词权重(指某一因素或指标相对于某一事物的重要程度),默认为False
  • alllowPOS默认为(‘ns’,‘n’,vn’,‘v’)即仅提取地名、名词、动名词、动词。

你可能感兴趣的:(python,基础,python,算法)