Trie树
特点:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
核心思想:空间换时间,利用字符串的公共前缀来降低查询时间的开销以达到提高效率。
例如:如给出字符串"abc",“ab”,“bd”,“dda”,根据该字符串序列构建一棵Trie树。则构建的树如下:
图片来自Androids_lost_Sheep
红色表示一个单词的结束。
Tire的三个基本性质:
1.根节点不包含字符,除根节点外每一个节点都只包含一个字符。
2.从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
3.每个节点的所有子节点包含的字符都不相同。
Trie树中有个二维数组son[N][26],表示当前结点的儿子,如果没有的话,可以等于++idx。Trie树本质上是一颗多叉树,对于字母而言最多有26个子结点。所以这个数组包含了两条信息。比如:son[1][0]=2表示1结点的一个值为a的子结点为结点2。如果son[1][0] = 0,则意味着没有值为a子结点。这里的son[N][26]相当于链表中的ne[N]。
核心思想
空间换时间,利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的
图片来自作者: 四夕
基本模板
int son[N][26], cnt[N], idx;
// 0号点既是根节点,又是空节点
// son[][]存储树中每个节点的子节点
// cnt[]存储以每个节点结尾的单词数量
// 插入一个字符串
void insert(char *str)
{
int p = 0;
for (int i = 0; str[i]; i ++ )
{
int u = str[i] - 'a';
if (!son[p][u]) son[p][u] = ++ idx;
p = son[p][u];
}
cnt[p] ++ ;
}
// 查询字符串出现的次数
int query(char *str)
{
int p = 0;
for (int i = 0; str[i]; i ++ )
{
int u = str[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
作者:yxc
链接:https://www.acwing.com/blog/content/404/
来源:AcWing
经典例题
1、AcWing 835. Trie字符串统计
维护一个字符串集合,支持两种操作:
“I x”向集合中插入一个字符串x;
“Q x”询问一个字符串在集合中出现了多少次。
共有N个操作,输入的字符串总长度不超过 105,字符串仅包含小写英文字母。
输入格式
第一行包含整数N,表示操作数。
接下来N行,每行包含一个操作指令,指令为”I x”或”Q x”中的一种。
输出格式
对于每个询问指令”Q x”,都要输出一个整数作为结果,表示x在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗104
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
**题解
1、插入过程
对于一个单词,从根开始,沿着单词的各个字母所对应的树中的节点分支向下走,直到单词遍历完,将最后的节点标记为红色,表示该单词已插入Trie树。
2、查询过程
同样的,从根开始按照单词的字母顺序向下遍历trie树,一旦发现某个节点标记不存在或者单词遍历完成而最后的节点未标记为红色,则表示该单词不存在,若最后的节点标记为红色,表示该单词存在。**
#include
using namespace std;
const int N = 100010;
int son[N][26];//son[N][26] 其中存放的是:子节点对应的idx。其中son数组的第一维是:父节点对应的idx,第第二维计数是:其直接子节点('a' - '0')的值为二维下标。
int cnt[N];// 以“abc”字符串为例,最后一个字符---‘c’对应的idx作为cnt数组的下标。数组的值是该idx对应的个数。
int idx;// 将该字符串分配的一个树结构中,以下标来记录每一个字符的位置。方便之后的插入和查找
char str[N];
void insert(char *str)
{
int p = 0;
for (int i = 0; str[i]; i ++ )//开始下标循环
{
int u = str[i] - 'a';//转化值
if (!son[p][u]) son[p][u] = ++ idx;// 如果没有就添加
p = son[p][u];//有就继续检索
}// 此时的p就是str中最后一个字符对应的trie树的位置idx。
cnt[p] ++ ;//单词最会一个下标值存储
}
int query(char *str)
{
int p = 0;
for (int i = 0; str[i]; i ++ )
{
int u = str[i] - 'a';
if (!son[p][u]) return 0;//没有就返回
p = son[p][u];// 有就继续检索
}
return cnt[p];//返回cnt的长度
}
int main()
{
int n;
scanf("%d", &n);
while (n -- )
{
char op[2];
scanf("%s%s", op, str);
if (*op == 'I') insert(str);
else printf("%d\n", query(str));
}
return 0;
}
2、AcWing 143. 最大异或对
在给定的N个整数A1,A2……AN中选出两个进行xor(异或)运算,得到的结果最大是多少?
输入格式
第一行输入一个整数N。
第二行输入N个整数A1~AN。
输出格式
输出一个整数表示答案。
数据范围
1≤N≤105,
0≤Ai<231
输入样例:
3
1 2 3
输出样例:
3
解题思路
通过将每位数的二进制构造成tire,从根节点开始,找出与特定值的二进制不同位数最多的进行异或运算最后找出异或后的最大值
#include
#include
using namespace std;
const int N = 100010, M = 3000000;//M代表一个数字串二进制可以到多长
int n;
int a[N], son[M][2], idx;// 在trie树中 二维数组son存的是节点的下标
// 第一维就是下标的值 第二维代表着儿子 在本题中 只有0或1 两个儿子
void insert(int x)
{
int p = 0; //根节点
for (int i = 30; i >= 0; i -- )
{
int &s = son[p][x >> i & 1];
//如果插入中发现没有该子节点,开出这条路
if (!s) s = ++ idx;
//指针指向下一层
p = s;
}
}
int search(int x)//直接返回最大异或对
{
int p = 0, res = 0;
for (int i = 30; i >= 0; i -- )//从最大位开始找
{
int s = x >> i & 1;//取X的第i位的二进制数是什么
if (son[p][!s])//如果trie数中的第i位数是否存在x的二进制数的第i位数取反的值;如果当前层有对应的不相同的数,//p指针就指到不同数的地址
{
res += 1 << i; //计算二进制不同位数的个数
p = son[p][!s];
}
else p = son[p][s];
}
return res;
}
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i ++ )
{
scanf("%d", &a[i]);
insert(a[i]);
}
int res = 0;
for (int i = 0; i < n; i ++ ) res = max(res, search(a[i]));//search(a[i])查找的是a[i]值的最大与或值
printf("%d\n", res);
return 0;
}
作者:yxc
链接:https://www.acwing.com/activity/content/code/content/45284/
来源:AcWing