使用NLTK.download()时出现的问题

使用NLTK.download()时出现的问题如下:
使用NLTK.download()时出现的问题_第1张图片

  • 解决方法:*
    本来NLTK可以通过简单的nltk.download()下载所需要的文件,但是,这会出现网络问题,非常慢,甚至直接连不上。所以我们需要离线下载nltk_data。

一、下载数据文件

官方数据在https://github.com/nltk/nltk_...中,不过,在github上下载文件也挺慢的。所以,这里我们可以去码云上找到对应的项目https://gitee.com/qwererer2/n...(链接如果失效可以在码云自行搜索nltk_data)。 下载得到nltk_data-gh-pages.zip文件。

重点: 别忘了你是把整包都下下来了(我们需要的是其中的package),要把解压出来的文件夹package挪到对应的nltk搜索目录下。并且将packages文件夹重新命名为nltk_data。(我在这里被坑了)

二、将nltk_data文件夹移到对应的目录

nltk的搜索路径为:

import nltk
nltk.find('.')

Searched in:

'C:\Users\15839/nltk_data'
'E:\python_env\nlp\nltk_data'
'E:\python_env\nlp\share\nltk_data'
'E:\python_env\nlp\lib\nltk_data'
'C:\Users\15839\AppData\Roaming\nltk_data'
'C:\nltk_data'
'D:\nltk_data'
'E:\nltk_data'
将nltk_data文件夹移到上述任意文件路径即可。

你可能感兴趣的:(数据挖掘自然语言处理)