nltk包下载慢的解决方案(总结)

nltk是常用的自然语言工具包,但是由于默认的服务器是基于https的,很难连接。在下载nltk包的尤其是使用nltk.download()图像化界面的时候,经常会碰到无法连接的情况,或者连接很慢。下面介绍两种方法解决这个问题。

方法一:在弹出的NLTK Downloader界面将Server Index里的内容改成NLTK官网http://www.nltk.org/nltk_data/这个服务器。替换后如下图:

nltk包下载慢的解决方案(总结)_第1张图片

方法二:下载第三方扩展包

step 1 : 下载扩展包,以下途径任选其一。

(1)百度云:https://pan.baidu.com/s/1LWM3o7iRZMF8XaD91vx9Dw;提取码:cnpf。
(2) 码云: nltk_data: NLTK Data - Gitee.com
(3)github: GitHub - nltk/nltk_data: NLTK Data
(4)github镜像站:https://gitee.com/qwererer2/nltk_data/tree/gh-pages/
step 2 : 文件夹解压,将里面的packages重命名为nltk_data,放在Download Directory路径里。

※ 注:如果不清楚Download Directory路径路径在哪,可通过以下步骤查找路径

① 输入以下代码

import nltk

nltk.find('.')

② 打印结果:

Searched in:

'C:\Users\15839/nltk_data'

'E:\python_env\nlp\nltk_data'

'E:\python_env\nlp\share\nltk_data'

'E:\python_env\nlp\lib\nltk_data'

'C:\Users\15839\AppData\Roaming\nltk_data'

'C:\nltk_data'

'D:\nltk_data'

'E:\nltk_data'

③ 将nltk_data文件夹移到上述任意文件路径即可。

step 3 : 解压nltk_data文件夹里面对应的每个语料库的压缩文件,即zip文件解压才能用。

step 4 : 打开jupyter,输入以下代码,若出现下图所示画面,说明安装成功。

import nltk
from nltk.book import *

nltk包下载慢的解决方案(总结)_第2张图片

 

你可能感兴趣的:(自然语言处理,python,开发语言,nlp,自然语言处理,人工智能)