解决NLTK语料库下载出错及nltk_data路径等问题

一、解决NLTK语料库下载问题

NLTK有许多可供使用的语料库,但直接通过官网下载会出现某些问题
下载语料库代码

import nltk
nltk.download("all")

代码中添加的参数可参考官方链接

  1. 问题一:下载速度过慢,考验你的耐心
  2. 问题二:下载速度过慢导致下载中止,再次运行命令会导致下图情况
    解决NLTK语料库下载出错及nltk_data路径等问题_第1张图片

解决方案:通过百度资源下载nltk_data
链接:nltk_data
提取码:ucun

二、nltk_data路径问题
1.直接解压在C盘根目录下(C:\nltk_data)

测试代码

from nltk.book import *
from nltk.corpus import reuters
files = reuters.fileids()
print(files)
2.放在任意目录下:

测试代码

from nltk import data
from nltk.corpus import reuters
#每次访问数据需要添加数据至路径当中
data.path.append(r"F:\About-Python\NLP_env_1\note\nltk_data")
files = reuters.fileids()
print(files)

输出结果
解决NLTK语料库下载出错及nltk_data路径等问题_第2张图片
遇见问题级解决方案持续更新中

你可能感兴趣的:(自然语言处理)