解决NLTK包下载出错问题及NLP环境测试

Python 2.7
IDE Pycharm 5.0.3
NLTK 3.2.1


前言

需要用到自然语言处理了,安装调试过程记录一下,省的下次再找


【注意:软件安装需求:Python、NLTK、NLTK-Data必须安装,NumPy和Matplotlin推荐安装,NetworkX和Prover9可选安装】

安装详细过程可见Python与自然语言处理(一)搭建环境总结的很好,我这里简要说明和补充:


安装Python

滚粗,自己百度


安装NLTK

Pycharm自带NLTK包,如果没有,请在cmd窗口输入命令:pip install nltk,下的应该蛮快的。不知道pip是什么?滚粗!


安装NLTK-Data

你可以作死的尝试


>>>import nltk
>>>nltk.download()

先点击Refresh,刷新下,之后选中all-corpora点击左下角下载就好,至于路径

要么在C盘中,要么在Python的根目录下!C盘根目录最靠谱!

解决NLTK包下载出错问题及NLP环境测试_第1张图片
这里写图片描述

这是官方正统下载方式,但是肯定会出错的!不仅下的慢,而且下一半就出错!老纸试了三次!

这里才是正确的下载方式:最好的方法是用使用@V_can打包好的的包网盘下载下载地址1:云盘密码znx7,下来的包nltk_data.zip 解压到C盘根目录下,这样是最保险的,防止找不到包。下载地址2:云盘密码4cp3


NLTK测试

测试环境是否安装好请按照下列步骤(全部在python console中完成,就是输入一行输出一行的那种IDE):

In[4]:from nltk.book import *
# 只输入import nltk 会出错的,但却有很多博客上都这么写,我也母鸡

之后会出现如下显示:

*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908

继续测试输入:

In[5]:text1

会输出:

Out[5]: 

再测试输入:

In[6]: text1.concordance("monstrous")

输出:

Displaying 11 of 11 matches:
ong the former , one was of a most monstrous size . ... 

ok,这里就演示那么多,到此,NLP的环境就装好了,调试完毕,可以用于自己的实验了。


总结

写的东西不重复,实践过正确,有重点,对别人有帮助,这个才是最重要的。


致谢

@monkey131499--Python与自然语言处理(一)搭建环境
@V_can--Python与自然语言处理_第一期_NLTK入门之环境搭建

你可能感兴趣的:(解决NLTK包下载出错问题及NLP环境测试)