python版本的双数组trie树使用学习笔记 (double array trie ;DATrie)

 

#pip install datrie
import string
import datrie

trie = datrie.Trie(string.ascii_lowercase)
trie[u'foo'] = 5
trie[u'foobar'] = 10
trie[u'bar'] = 'bar value'
trie.setdefault(u'foobar', 15)

print(u'foo' in trie)
#查找单词的所有前缀:
print(trie.prefixes(u'foobarbaz'))
print(trie.prefix_items(u'foobarbaz'))
print(trie.iter_prefixes(u'foobarbaz'))
print(trie.iter_prefix_items(u'foobarbaz'))

#查找单词的最长前缀:
print(trie.longest_prefix(u'foo'))
print(trie.longest_prefix(u'foobarbaz'))
print(trie.longest_prefix(u'gaz'))
print(trie.longest_prefix(u'gaz', default=u'vasia'))
print(trie.longest_prefix_item(u'foobarbaz'))



#检查trie是否具有具有给定前缀的键
print(trie.has_keys_with_prefix(u'fo'))
print(trie.has_keys_with_prefix(u'FO'))

#从trie获取具有给定前缀的所有项
print(trie.keys(u'fo'))
print(trie.items(u'ba'))
print(trie.values(u'foob'))

#从trie中获取以给定前缀开头的某个单词的所有后缀 
print(trie.suffixes())
print(trie.suffixes(u'prod'))

#保存并加载trie(值必须是可选择的) 
trie.save('my.trie')
trie2 = datrie.Trie.load('my.trie')

#以下是datrie包中的两个trie类: datrie.Trie and datrie.BaseTrie. datrie.BaseTrie速度稍快,占用的内存更少,但它只能存储整数-2147483648<=x<=2147483647。datrie.Trie速度稍慢,但可以将任何Python对象存储为值。
#如果不需要值或整数值可以,则使用datrie.BaseTrie
import datrie
import string
trie = datrie.BaseTrie(string.ascii_lowercase)

#如果内置的trie方法不适合,可以使用datrie.State 和datrie.Iterator。迭代器实现自定义遍历。 
state = datrie.State(trie)
state.walk(u'foo')
it = datrie.Iterator(state)
while it.next():
    print(it.key())
    print(it.data))

 

你可能感兴趣的:(python)