Stanford CoreNLP Python接口处理

Stanford CoreNLP的源代码是使用Java写的,提供了Server方式进行交互。stanfordcorenlp是一个对Stanford CoreNLP进行了封装的Python工具包,GitHub地址,使用非常方便。

安装stanfordcorenlp包之前:
1:下载安装JDK 1.8及以上版本。
2:下载Stanford CoreNLP文件,解压。
3:处理中文还需要下载中文的模型[jar文件],然后放到stanford-corenlp-full根目录下即可(注意一定要下载这个文件哦,否则它默认是按英文来处理的)。

然后就是正常的流程

pip install stanford-corenlp

网上找了很多都是有点麻烦的配置,自己误打误撞弄出一个简单的分享一下,有问题可以留言讨论,

直接上代码:

import corenlp
client = corenlp.CoreNLPClient(annotators='tokenize ssplit pos'.split())
str = 'proved to be fake, made-up'
ann = client.annotate(str)
sentence = ann.sentence[0]
for token in sentence.token:
    print (token.word, token.pos)

接下来就会报错了,点进报错文档,锁定报错地点

文档时:client.py
地点:124行

锁定前三行
client.py

然后开始改代码

124行:我直接注释掉了

改后client.py

125行:将原来的{CORENLP_HOME}替换成你下载的 Stanford CoreNLP文件,解压后的文件目录路径。
改后client.py

126行:将原来的os.getenv("CORENLP_HOME")替换成你下载的 Stanford CoreNLP文件,解压后的文件目录下的stanford-corenlp-3.9.1.jar路径
改后client.py

然后再次运行前的代码,成功完成:

proved VBN
to TO
be VB
fake JJ
, ,
made-up JJ

希望可以帮助到你。
版权声明:本文为博主原创文章,未经博主允许不得转载。

你可能感兴趣的:(Stanford CoreNLP Python接口处理)