Acwing 142.前缀统计

给定N个字符串S1,S2…SN,接下来进行M次询问,每次询问给定一个字符串T,求S1~SN

中有多少个字符串是T的前缀。

输入字符串的总长度不超过106

,仅包含小写字母。

输入格式

第一行输入两个整数N,M。

接下来N行每行输入一个字符串Si

接下来M行每行一个字符串T用以询问。

输出格式

对于每个询问,输出一个整数表示答案。

每个答案占一行。

输入样例:

3 2
ab
bc
abc
abc
efg

输出样例:

2
0

这里再次复习下字典树。

下面我们来讲一下对于给定的字符串集合{W1, W2, W3, … WN}如何创建对应的Trie树。其实上Trie树的创建是从只有根节点开始,通过依次将W1, W2, W3, … WN插入Trie中实现的。所以关键就是之前提到的Trie的插入操作。

具体来说,Trie一般支持两个操作:

1. Trie.insert(W):第一个操作是插入操作,就是将一个字符串W加入到集合中。

2. Trie.search(S):第二个操作是查询操作,就是查询一个字符串S是不是在集合中。

假设我们要插入字符串”in”。我们一开始位于根,也就是0号节点,我们用P=0表示。我们先看P是不是有一条标识着i的连向子节点的边。没有这条边,于是我们就新建一个节点,也就是1号节点,然后把1号节点设置为P也就是0号节点的子节点,并且将边标识为i。最后我们移动到1号节点,也就是令P=1。

Acwing 142.前缀统计_第1张图片

这样我们就把”in”的i字符插入到Trie中了。然后我们再插入字符n,也是先找P也就是1号节点有没有标记为n的边。还是没有,于是再新建一个节点2,设置为P也就是1号节点的子节点,并且把边标识为n。最后再移动到P=2。这样我们就把n也插入了。由于n是”in”的最后一个字符,所以我们还需要将P=2这个节点标记为终结点。

Acwing 142.前缀统计_第2张图片

现在我们再插入字符串”inn”。过程也是一样的,从P=0开始找标识为i的边,这次找到1号节点。于是我们就不用创建新节点了,直接移动到1号节点,也就是令P=1。再插入字符n,也是有2号节点存在,所以移动到2号节点,P=2。最后再插入字符n这时P没有标识为n的边了,所以新建3号节点作为2号节点的子节点,边标识为n,同时将3号节点标记为终结点:
 

Acwing 142.前缀统计_第3张图片

将后面的字符串int tea ten to都插入之后,就得到了我们一开始给出的Trie:

Acwing 142.前缀统计_第4张图片

这里用一个二维数组来表示trie,int son[maxn][26];
int idx;
其中maxn是trie中最大能存储的节点数目,26是字符集的大小,idx是当前trie中包含有多少个节点。son[i][j]的值是0表示trie树中i号节点,并没有一条连出去的边,满足边上的字符标识是字符集中第j个字符(从0开始);son[i][j]的值是正整数x表示trie树中i号节点,有一条连出去的边,满足边上的字符标识是字符集中第j个字符,并且这条边的终点是x号节点。
 

 

#include
#include
using namespace std;

const int maxn = 1e6+10;

char str[maxn];
int son[maxn][26],cnt[maxn],idx;

int n,m;
 

void insert()
{
	int p = 0;
	for(int i = 0;str[i];++i)
	{
                //是否存在该节点
		int &s = son[p][str[i]-'a'];
		if(!s) s = ++idx;
		p = s;
	}
	
	cnt[p]++;
}

int query()
{
	int p =0,res = 0;
	for(int i = 0;str[i];++i)
	{
		int &s = son[p][str[i]-'a'];
		if(!s) break;
		p = s;
		res += cnt[p];
	}
	return res;
}
int main()
{
    cin >> n >> m;
    while(n--)
    {
    	scanf("%s",str);
    	insert();
    }
    
    
    while(m--)
    {
    	scanf("%s",str);
    	printf("%d\n",query());
    }
}

参考文章:https://blog.csdn.net/weixin_39778570/article/details/81990417

 

 

你可能感兴趣的:(数据结构)