python nltk中使用StanfordNER

nltk就直接pip安装就行。

参考链接:

https://blog.csdn.net/Abner_Z/article/details/45481321

http://www.zmonster.me/2016/06/08/use-stanford-nlp-package-in-nltk.html

Stanford提供的功能:

分词: StanfordTokenizer

词性标注: StanfordPOSTagger

命名实体识别: StanfordNERTagger

句法分析: StanfordParser

依存句法分析: StanfordDependencyParser, tanfordNeuralDependencyParser


1、命名实体识别: StanfordNERTagger

①下载StanfordNER工具包:

http://nlp.stanford.edu/software/CRF-NER.html

②下载一个第三方工具包Pyner:

https://github.com/dat/pyner/archive/master.zip

③安装Pyner:解压下载的Pyner,命令行中将工作目录切换到Pyner文件夹下, 输入命令 :python setup.py install 完成安装。

④解压StanfordNER工具包,命令行中将工作目录切换到StanfordNER文件夹下,输入以下命令以服务的方式运行StanfordNER,命令:

java -mx1000m -cp stanford-ner.jar edu.stanford.nlp.ie.NERServer -loadClassifier classifiers/english.muc.7class.distsim.crf.ser.gz -port 8080 -outputFormat inlineXML

python nltk中使用StanfordNER_第1张图片

⑤将解压后目录中的 stanford-ner.jar 加入到 CLASSPATH 中去;同时将 stanford-ner-2015-12-09.zip 解压后目录中的 classifiers 目录加入到环境变量 STANFORD_MODELS 中去。

不知道问什么我加了环境变量还是一直报错。。。。那就在程序里写路径吧

from nltk.tagimport StanfordNERTagger

eng_tagger= StanfordNERTagger(model_filename=r'D:\software\Python\Stanford\stanford-ner-2018-10-16\classifiers\english.all.3class.distsim.crf.ser.gz',path_to_jar=r'D:\software\Python\Stanford\stanford-ner-2018-10-16\stanford-ner.jar')

print(eng_tagger.tag('Rami Eid is studying at Stony Brook University in NewYork'.split()))

输出结果:

你可能感兴趣的:(python nltk中使用StanfordNER)