词汇工具Toolbox和Shoebox

一个ToolBox文件由一个大量条目的集合组成,其中每个条目又一个或多个字段组成。大多数字段可选或者是重复的。对应单词的属性都是(属性,值)对。如图:

from nltk.corpus import toolbox
#rotokas为罗托卡特语
words = toolbox.entries('rotokas.dic')
for word in words:
    print(word)
运行结果

kaa这个单词,ps为(part of speech,词性),V表示动词,ge=gag(英文注释为gag)
当不给toolbox.entries()参数的时候就会出现下面的错误。

TypeError: entries() missing 1 required positional argument: 'fileids'
虽然是一个错误不过让我们知道了参数的类型,以此也能够猜测toolbox应该是有对应的属性或者方法可以调用的,写了个程序测试下。结果并没有看来是猜错了......


测试toolbox.fileids()

你可能感兴趣的:(词汇工具Toolbox和Shoebox)