【NLP】中文知识抽取工具

分词+词性标注

  • ‌jieba:多种分词模式,老牌健将
  • ‌LAC:百度出品,感觉最好用【推荐】
  • Spacy:全能选手,分词差了点

依存句法分析:

  • ‌Spacy:画图很棒

实体识别:

  • ‌LAC:配合自定义词典准确率很高

关系抽取:

  • ‌DeepKE:涵盖多种深度学习模型,如BERT,CNN,Transformer等,需要自己训练

标注工具:

  • ‌YEDDA:若只实体抽取,则很不错
  • ‌MarkTOOL:关系抽取首选,国产之光,免费好用。

标点符号恢复:

  • auto_punc:百度出品

文本纠错:

  • pycorrector

你可能感兴趣的:(算法篇,自然语言处理,nlp)