nltk.download(‘stopwords‘)报错,解决方案

nltk.download(‘stopwords’)报错,解决方案如下

#报错信息如下
[nltk_data] Error loading stopwords: <urlopen error [Errno 11004]
[nltk_data]     getaddrinfo failed>

False

1.解决方案

手动下载数据,并放在指定位置

下载地址:https://files-cdn.cnblogs.com/files/douzujun/stopwords.zip

下载解压之后放在哪里???

根据提示信息:

please use the NLTK Downloader to obtain the resource:

nltk.download('stopwords')

searched in:

- '目录1'
- '目录2'
- ...
- 'D:\\installation\\anaconda3'
- 'D:\\installation\\anaconda3\\share\\nltk_data'

根据上述提示信息,我们将下载的文件解压:(上述任何一个满足即可)

例如:

  • 步骤1:我在D:\installation\anaconda3’目录下新建文件夹:nltk_data

  • 步骤2:在nltk_data文件夹中新建文件夹:corpora

综上:最终解压之后的文件放置位置为:

'D:\\installation\\anaconda3\\nltk_data\\corpora'

测试可用。

nltk.download(‘stopwords‘)报错,解决方案_第1张图片

或者参考官方文档,

NLTK 3.5 官方文档参考连接:https://www.nltk.org/data.html

nltk.download(‘stopwords‘)报错,解决方案_第2张图片

你可能感兴趣的:(数据分析&挖掘,深度学习,nltk,stopwords,停用词)