数据结构——Trie树(C++版)

  1. Trie树用途
    高效的储存和查找字符串集合的数据结构
  2. 模板
int son[N][26], cnt[N], idx;
// 0号点既是根节点,又是空节点
// son[][]存储树中每个节点的子节点,每一行代表一个节点,列代表该节点的子节点的字母
// cnt[]存储以每个节点结尾的单词数量

// 插入一个字符串
void insert(char *str)
{
     
    int p = 0;
    for (int i = 0; str[i]; i ++ )
    {
     
        int u = str[i] - 'a';
        if (!son[p][u]) son[p][u] = ++ idx;
        p = son[p][u];
    }
    cnt[p] ++ ;
}

// 查询字符串出现的次数
int query(char *str)
{
     
    int p = 0;
    for (int i = 0; str[i]; i ++ )
    {
     
        int u = str[i] - 'a';
        if (!son[p][u]) return 0;
        p = son[p][u];
    }
    return cnt[p];
}
  1. 例题:Trie字符串统计
    维护一个字符串集合,支持两种操作:
    “I x”向集合中插入一个字符串x;
    “Q x”询问一个字符串在集合中出现了多少次。
    共有N个操作,输入的字符串总长度不超过105,字符串仅包含小写英文字母。
    输入格式
    第一行包含整数N,表示操作数。
    接下来N行,每行包含一个操作指令,指令为”I x”或”Q x”中的一种。
    输出格式
    对于每个询问指令”Q x”,都要输出一个整数作为结果,表示x在集合中出现的次数。
    每个结果占一行。
    数据范围
    1≤N≤2∗104
    输入样例:
    5
    I abc
    Q abc
    Q ab
    I ab
    Q ab
    输出样例:
    1
    0
    1
#include

using namespace std;

const int N = 100010;

int n, son[N][26], cont[N], idx; //son中存储每个字母的下一个字母所在行数(即他子节点所在的行数),cont中存储以某个号为结尾的单词出现的次数,idx表示当前使用的节点序号
char str[N];	//存储字符串

//函数功能:在树中插入一个字符串
void insert(char str[])
{
     
	int p = 0;	//当前访问字母所在行数(即父节点下标)
	for(int i = 0; str[i]; i++)
	{
     
		int u = str[i] - 'a';	//把字母映射为0~25的数字
		if(!son[p][u]) son[p][u] = ++idx;	//如果子节点不存在,新建一个节点
		p = son[p][u];		//使p指向该子节点
	}
	cont[p]++;	//累加以p结尾的单词出现的次数
}

int query(char str[])
{
     
	int p = 0;
	for(int i = 0; str[i]; i++)
	{
     
		int u = str[i] - 'a';
		if(!son[p][u]) return 0;	//如果p层对应的字母不存在,返回0
		p = son[p][u];
	}
	return cont[p];		//该单词存在,返回该单词出现的次数

}
				
int main()
{
     
	cin >> n;

	char op[2];
	while (n--)
	{
     
		scanf("%s%s", op, str);
		if(op[0] == 'I') insert(str);
		else printf("%d\n", query(str));
	}
	return 0;	
}		

[^1]此文章中的模板和代码均来自www.acwing.com

你可能感兴趣的:(字符串,数据结构)