nltk包的下载与离线导入

课程中需要导入nltk包中的Reuters语料库,但是原始代码是在线下载的,国内连不上服务器,挂梯子都不行
原始代码如下:

from gensim.models import KeyedVectors
from gensim.test.utils import datapath
import pprint
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = [10, 5]
import nltk
nltk.download('reuters')
from nltk.corpus import reuters

之后在网上搜寻了方法:

  • 去github上下载nltk_data语料库,最好挂梯子
  • 将文件夹中的packages文件夹重命名为nltk_data放入任意一个硬盘根目录
import nltk
nltk.data.find(".") 
from nltk.corpus import reuters

done

nltk包的下载与离线导入_第1张图片

你可能感兴趣的:(CS224n&NLP学习笔记)