一、首先,关于安装:
pip install nltk
二、接着,安装完之后,按着教程敲出一段代码运行,例如:
#coding:utf-8
import nltk
text = 'hello,world.'
# text = '你好,世界'
sens = nltk.sent_tokenize(text)
words = []
for sent in sens:
words.append(nltk.word_tokenize(sent))
print words
tags = []
for tokens in words:
tags.append(nltk.pos_tag(tokens))
print tags
什么意思呢?是指,你缺少这个叫wordnet的东西。
解决方法:
下载完即可使用