近期正在学习python的NLP处理是,使用了NLTK的库,但在使用这些库的同时需要使用很多NLTK的插件包,
网上流行的是
import nltk
nltk.download()
之后弹出一个下载框,Server Index 将默认地址改为http://www.nltk.org/nltk_data/
选择下载所需要的插件包。
我使用浏览器访问了这个地址,找到了所需要的按照包,点击里面”download“,结果打开的还是https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml地址,就访问不到了,也就下载不了了,不知道是不是我这边网络问题,限制了我们访问这个地址,反正就是在线不能安装punkt这个包了。
既然在线安装不了,我就是用离线的方式了,首先下载punkt的包,这个可以在网上找到好多推荐一个”https://pan.baidu.com/s/1OwLB0O8fBWkdLx8VJ-9uNQ“,密码:mema
把刚刚下载的包,解压到tokenizers文件夹下即可,之后开发正常使用了。