【NLP环境nltk.download遇到bug问题】[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data]

最近遇到一个问题,甚是头疼,nltk库想要正常运行会有非常多的不会自动download依赖需要download,运行时便会如此报错:

【NLP环境nltk.download遇到bug问题】[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data]_第1张图片

这个指令是对的,但是如果当我们运行这个代码: 

import nltk
nltk.download()

出现了 这样的输出:

Out[22]:Flase 

那我们不得不怀疑人生了,这其实是网络配置的问题。按照接下来我的方法,包你小小bug,束手就擒。 

解决方案

Step1:打开一个文件夹,进入下面这个路径

C:\Windows\System32\drivers\etc

 

Step2、以管理员身份打开hosts.txt

       有手就行,不用演示。

Step3、在文件内容中最后一行添加以下内容

199.232.68.133 raw.githubusercontent.com

有一种特殊情况,hosts.txt打开后是空白,不用担心,直接拷贝进去就行,也就是所谓的最后一行就是第一行。 

运行成功截图,开心死咯!

【NLP环境nltk.download遇到bug问题】[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data]_第2张图片

完了,这个问题解决了,又遇到新的问题了,不过好在我有 

【NLP环境nltk.download遇到bug问题】[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data]_第3张图片彻底根除!

直接去官方下载咯!

NLTK Data 

点击download,在

C:\Users\xxx\AppData\Roaming 

路径下创建文件夹 nltk_data,在nltk_data文件夹中再创建文件夹 tokenizers,把下载好的 punkt.zip 解压到

C:\Users\xxx\AppData\Roaming\nltk_data\tokenizers 

路径,效果如下:
【NLP环境nltk.download遇到bug问题】[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data]_第4张图片

另外, 

【NLP环境nltk.download遇到bug问题】[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data]_第5张图片 

你可能感兴趣的:(#,NLP,自然语言处理,bug,人工智能)