离线下载安装 NLTK 的 nltk_data 模块

客户开发环境用的服务器无法连接外网,但我们需要在这台Linux服务器上使用 NLTK,因为无法联网,只能离线安装。
方法如下:

1、先去Github下载,点击右侧的clone or download 里面的download zip。安装包有点大,别急。

https://github.com/nltk/nltk_data/tree/gh-pages

下载得到nltk_data-gh-pages.zip文件。下载完成后还是pscp到服务器上,然后unzip解压。 oo 别忘了你把整包都下下来了,要把package里的内容挪到根目录下。

将文件中的packages文件夹重新命名为nltk_data

查询nltk搜索的目录

nltk.data.find(".")

将nltk_data放置在任意一个路径下即可

Searched in:

- 'C:\\Users\\********/nltk_data'

- 'C:\\nltk_data'

- 'D:\\nltk_data'

- 'E:\\nltk_data'

- 'D:\\Anaconda\\nltk_data'

- 'D:\\Anaconda\\lib\\nltk_data'

- 'C:\\Users\\********\\AppData\\Roaming\\nltk_data'

**********************************************************************

测试是否成功

你可能感兴趣的:(离线下载安装 NLTK 的 nltk_data 模块)