nltk安装及下载过慢问题

为了使用nltk除了需要下载安装nltk外还需要其扩展包。

1. 安装nltk:

pip install nltk

如果出现以下问题:

  Resource punkt not found.
  Please use the NLTK Downloader to obtain the resource:

  >>> import nltk
  >>> nltk.download('punkt')
  
  For more information see: https://www.nltk.org/data.html

  Attempted to load tokenizers/punkt/english.pickle

  Searched in:
    - 'C:\\Users\\sss/nltk_data'
    - 'E:\\software\\pycharm\\Anaconda\\setup\\nltk_data'
    - 'E:\\software\\pycharm\\Anaconda\\setup\\share\\nltk_data'
    - 'E:\\software\\pycharm\\Anaconda\\setup\\lib\\nltk_data'
    - 'C:\\Users\\sss\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'

就是说你没有下载NLTK,程序尝试去下面给出的路径中去查找你的nltk_data数据包,但是没有找到。下面就需要下载nltk_data数据到以上任意一个文件夹中。

2. 下载拓展包:nltk_data

方法一:

import nltk
nltk.download()

运行代码之后会出现安装界面,按照要求选择合适位置安装即可,只是速度很慢。

方法二:

去github直接下载nltk_data将该目录下的packages文件夹完整下载下来,可放置在上面提到的任意一个路径中,并修改名字为nltk_data。

方法三:

去网有提供的百度网盘提取码:cnpf下载下来,加压后可放置在上面提到的任意一个路径中,并修改名字为nltk_data。(随便提一下,百度网盘在设置-传输中提供了一个加速的功能,开启后可以在一定程度上提速)

注意:如果程序你确实放在了该目录下,但是程序提示没有找到,那么就根据提示去看下,有的包需要进一步解压。
例如, 提示:

Attempted to load tokenizers/punkt/english.pickle

punkt就需要进一步解压,解压后如下:
nltk安装及下载过慢问题_第1张图片

你可能感兴趣的:(软件安装与使用)