Python文本分析-常用中文停用词表(Chinese Stop Words)

在做jieba中文分词处理,进行文本分析,必不可少的停用词处理,国内比较常用的中文停用词库,有以下几个:

  • 中文停用词表
  • 哈工大停用词表
  • 百度停用词表
  • 四川大学机器智能实验室停用词库

而@elephantnose 对以上4个词库进行了合并去重,共计2311个,可在github直接下载使用~~

链接:GitHub链接

你可能感兴趣的:(数据挖掘与分析,NLP自然语言处理,自然语言处理,python,数据挖掘)