术语trie取自retrieval,也被称为数字树、字典树或前缀树,是一种有序树数据结构,哈希树的变种。
与二叉查找树不同,树中节点不存储与节点关联的键,而是通过树中的位置定义键。一个节点的所有子孙节点拥有与该节点相同的字符串前缀,根节点与空字符串相关联。并不是每个节点都与值关联,仅叶节点和部分内部节点与值关联。
trie 中的键通常是字符串,但也可以是其它的结构。trie 的算法可以很容易地修改为处理其它结构的有序序列,比如一串数字或者形状的排列。比如,bitwise trie 中的键是一串位元,可以用于表示整数或者内存地址。
性质
根节点不包含字符,除根节点外每一个节点都只包含一个字符;
从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串;
每个节点的所有子节点包含的字符都不相同。
应用
替代其他数据结构
trie较二叉查找树有很多优点,trie可用于替代哈希表,优点如下:
trie数据查找与不完美哈希表(链表实现,完美哈希表为数组实现)在最差情况下更快:对于trie,最差情况为O(m),m为查找字符串的长度; 对于不完美哈希表,会有键冲突(不同键哈希相同),最差情况为O(N),N为全部字符产集合个数。典型情况下是O(m)用于哈希计算、O(1)用于数据查找。
trie中不同键没有冲突
trie的桶与哈希表用于存储键冲突的桶类似,仅在单个键与多个值关联时需要
当更多的键加入trie,无需提供哈希方法或改变哈希方法
tire通过键为条目提供了字母顺序
Trie也有一些缺点:
trie数据查找在某些情况下(尤其当数据直接从磁盘或随机访问时间远远高于主内存的辅助存储设备时)比哈希表慢
当键为某些类型时(例如浮点数)之类的键,前缀链很长且前缀不是特别有意义。然而bitwise trie能够处理标注IEEE单精度和双精度浮点数。
一些trie会比哈希表消耗更多空间:对于trie,每个字符串的每个字符都可能需要分配内存;对于大多数哈希表,为整个条目分配一块内存。
字典表示
典型应用是预测文本排序(常被搜索引擎系统用于文本词频统计)、字典自动完成、字符串近似匹配(拼写检查、断字)。
案例:
#1014 : Trie树
时间限制:10000ms
单点时限:1000ms
内存限制:256MB
描述
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。
这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?”
身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?”
小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”
小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...
小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”
小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”
小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”
小Ho摇摇头表示自己不清楚。
提示一:Trie树的建立
“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。
“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。
“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”
提示二:如何使用Trie树
提示三:在建立Trie树时同时进行统计!
“那么现在!赶紧去用代码实现吧!”小Hi如是说道
输入
输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。
在20%的数据中n, m<=10,词典的字母表大小<=2.
在60%的数据中n, m<=1000,词典的字母表大小<=5.
在100%的数据中n, m<=100000,词典的字母表大小<=26.
本题按通过的数据量排名哦~
输出
对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。
样例输入
5 babaab babbbaaaa abba aaaaabaa babaababb 5 babb baabaaa bab bb bbabbaab
样例输出
1 0 3 0 0
AC代码:
#include
#include
#include
#include
#include
#include
#include
#include
#include
using namespace std;
struct TNode {
int count;
TNode *next[26];
TNode() :count(0){
for (int i = 0; i < 26; i++)
next[i] = NULL;
}
};
class TTree {
public:
TTree() {
root = new TNode();
}
~TTree() {
destory(root);
}
void insert(const char *s);
int find(const char *s);
void destory(TNode *r);
private:
TNode *root;
};
void TTree::insert(const char *s) {
TNode *r = root;
while (*s) {
if (!r->next[*s - 'a'])
{
TNode *t = new TNode();
r->next[*s - 'a'] = t;
}
r->count++;
r = r->next[*s - 'a'];
s++;
}
r->count++;
}
int TTree::find(const char *s) {
TNode *r = root;
while (*s) {
if (!r->next[*s - 'a'])
return 0;
r = r->next[*s - 'a'];
s++;
}
return r->count;
}
void TTree::destory(TNode *r) {
for (int i = 0; i < 26; i++)
{
if (r->next[i] != NULL)
destory(r->next[i]);
}
delete r;
r = NULL;
}
int main()
{
string s;
int n;
int m;
TTree T;
cin >> n;
for (int i = 0; i < n; i++) {
cin >> s;
T.insert(s.c_str());
}
cin >> m;
for (int i = 0; i < m; i++)
{
cin >> s;
cout << T.find(s.c_str()) << endl;
}
return 0;
}