快速下载NLTK数据集nltk_data的方法

NLTK是一个非常实用的自然语言处理工具箱,但是其中的数据集下载比较麻烦,而且非常容易中断,有没有快速下载此数据集的方法呢,笔者提供了以下三种方法供大家参考。

一、github方法(可以需要代理支持)

打开网址:GitHub - nltk/nltk_data: NLTK Data 下载压缩包后进行解压。

二、使用代理的方法

电脑科学上网后,在cmd下运行python,import nltk, nltk.download(), 实现自动下载,如果速度快的话,很快就可以下载到本地,这种方法好处是不用自己再安装了,简单方便。不好的地方是得科学上网。

如果有代理的ip,用户名和密码,也可以采用官方网站提供的方法如下:

>>> nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD'))
>>> nltk.download()

三、直接下载NLTK数据集

为了帮助大家下载,我已经把数据集下载好保存到了网盘,大家可以到到下载地址下载:百度网盘 请输入提取码  (提取码:rt27)

如果安装遇到问题,可以参考下面的文章

(26条消息) 【NLP】NLTK的安装和数据包的下载_sunflower_sara的机器学习园地-CSDN博客_下载nltk

你可能感兴趣的:(python,自然语言处理,人工智能,nlp)