[nlp] TF-IDF算法介绍

(1)TF是词频(Term Frequency)

词频是文档中词出现的概率。

[nlp] TF-IDF算法介绍_第1张图片

(2) IDF是逆向文件频率(Inverse Document Frequency)

包含词条的文档越少,IDF越大。

你可能感兴趣的:(nlp,自然语言处理,tf-idf,人工智能)