python nktl语料库下载问题

在执行代码如下代码时报错:

from nltk.corpus import stopwords
stops = set(stopwords.words("english"))

报错提示需要先下载stopwords

import nltk
nltk.download('stopwords')

下载 corpora/stopwords.zip/stopwords
参考链接:https://www.nltk.org/data.html

于是执行两行命令,一直报错Urlopen error,后来直接执行nltk.download()跳出一个报错窗口和一个下载器窗口,(无奈还是无法直接下载。。。),如下
python nktl语料库下载问题_第1张图片
后直接下载所需语料库,并将它解压到文件夹/home/username/nltk_data/corpora/目录下,OK,可以成功from nltk.corpus import stopwords.

stopwords语料库下载地址:

  1. nltk_data: http://www.nltk.org/nltk_data/
    2.github: https://github.com/nltk/nltk_data/tree/gh-pages/packages/corpora

其他语料库的下载安装,如果直接download()不成功,就是下载包,然后解压到…/nltk_data/corpora/目录下,也不是多么麻烦~

你可能感兴趣的:(安装问题)