命名实体识别学习记录(spaCy/OpenNLP..)

命名实体识别学习记录(spaCy/OpenNLP..)

  • spaCy
    • 环境
    • 功能实现
  • NLTK
    • 环境
    • 功能实现
  • Stanford NLP
    • 环境
    • 功能实现

spaCy

API文档

环境

只列举不是一查就能查到的命令:

  1. 下载en_core_web_sm:本人唯一成功的方法是本地下载,然后pip install + 本地路径。(conda显示安装好了但不行)
  2. 下载textacy:python -m pip install textacy
    但有 verb_phrases = textacy.extract.matches(doc, patterns=patterns) TypeError: ‘module’ object is not callable的报错,说明库找不到
    发现是新版的函数库有区别的原因,通过查看库的源代码,将上句改成下句即成功。
    旧版:verb_phrases = textacy.extract.matches(doc, patterns=patterns)
    新版:verb_phrases = textacy.corpus.extract.matches.token_matches(doclike=doc, patterns=patterns)

功能实现

参考博客 2.4-2.8跑通 含名词与动词识别

NLTK

命名实体识别学习记录(spaCy/OpenNLP..)_第1张图片

环境

  1. 报错NLTK:Resource punkt not found. Please use the NLTK Downloader to obtain the resource
    解决:在gitee下载packages 记得把zip解压成dir

功能实现

NLTK+Stanford NLP的代码

Stanford NLP

环境

按照文章里下载并改成本地路径即可

功能实现

NLTK+Stanford NLP的代码

你可能感兴趣的:(机器学习,学习,python,开发语言,nlp)