自然语言处理工具包nltk下的nltk_data安装

python安装nltk需要先安装numpy.
安装好nltk后,根据NLP任务针对需要的模块通过如下命令安装:

import nltk
nltk.download('***')

注意:此处若出现类似Resource punkt not found. Please use the NLTK Downloader to obtain the resource.的错误,是由于资源在国外,由于访问限制问题,这时只需要使用VPN即可。
我们也可以安装使用下载器来下载需要的包,在python命令行模式下输入一下命令:

import nltk
nltk.download()

会出现如下界面
自然语言处理工具包nltk下的nltk_data安装_第1张图片
注意:这里的安装目录是可以更改的!下面的目录均可:

Searched in:
    - 'C:\\Users\\RegentWan/nltk_data'
    - 'D:\\workspace\\Anaconda3\\nltk_data'
    - 'D:\\workspace\\Anaconda3\\share\\nltk_data'
    - 'D:\\workspace\\Anaconda3\\lib\\nltk_data'
    - 'C:\\Users\\RegentWan\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'

根据需要选择自己想要的data即可,若选择all,会将所有的均下载,耗时会比较长。
也可以通过此链接(https://download.csdn.net/download/Zeno_wrj/12788168)获取云盘资源直接下载,解压到上述任一目录中即可。

通过如下代码验证是否成功:

from nltk.book import *

可以随时查看哪些包已经下载完成,可以根据进度条查看时间。
自然语言处理工具包nltk下的nltk_data安装_第2张图片
下载完成后,如下图所示自然语言处理工具包nltk下的nltk_data安装_第3张图片

你可能感兴趣的:(python,常用技巧,笔记,python,nltk,自然语言处理,nltk_data)