使用 tf-idf 提取关键词

tf-idf 的简要介绍:
tf:term frequency。某个关键词在整篇文档中出现的频率
idf:inverse document frequency。逆文档频率。某个词在所有文档中出现的频率。

tf 公式:
t f i j = n i j ∑ k n k j tf_{ij} = \frac{n_{ij}}{\sum_k n_{kj}} tfij=

你可能感兴趣的:(nlp,tf-idf,关键词)