题意:给定两本字典,每本字典最多1000个单词,每个单词最多1000长度,每本字典的总长度最多10^5长度。
现在希望取第一本字典的单词的所有前缀(非空),和第二本字典单词的所有后缀(非空),组成一个新的单词。求出能组成的新单词总数。
分析: 统计第一本字典单词的所有不同前缀数s1,第二本单词不同后缀数s2,理想状态下总单词为s1 * s2, 但是前缀和后缀组合起来,可能会重复产生相同的单词。统计两次字典树中每个字符(除去首结点,因为不能有非空前后缀)出现的次数,cnt1[i] * cnt2[i] 表示因i字符,导致的重复计算。
#include <iostream> #include <algorithm> #include <cmath> #include<functional> #include <cstdio> #include <cstdlib> #include <cstring> #include <string> #include <vector> #include <set> #include <queue> #include <stack> #include <climits>//形如INT_MAX一类的 #define MAX 1005 #define INF 0x7FFFFFFF using namespace std; int n,m,cnt,root; char a[MAX][MAX],b[MAX][MAX]; char tmp[MAX]; long long cnt1[30], cnt2[30]; struct Trie { int next[27]; void init() { memset(next,0,sizeof(next)); } }tr[111111]; void init() { tr[0].init(); cnt = 0; root = 0; } void insert(char *key,int kind) { int p = root; for(int i=0; key[i]; i++) { int t = key[i] - 'a'; if(tr[p].next[t] == 0) { tr[p].next[t] = ++ cnt; tr[cnt].init(); if(i != 0) { if(kind == 1) cnt1[t] ++; else cnt2[t] ++; } } p = tr[p].next[t]; } } int main() { while(scanf("%d%d",&n,&m)) { if(n == 0 && m == 0) break; for(int i=0; i<n; i++) scanf("%s",a[i]); for(int i=0; i<m; i++) scanf("%s",b[i]); init(); memset(cnt1,0,sizeof(cnt1)); memset(cnt2,0,sizeof(cnt2)); for(int i=0; i<n; i++) { insert(a[i],1); } long long s1 = cnt; init(); for(int i=0; i<m; i++) { int len = strlen(b[i]); for(int j=0; j<len; j++) { tmp[j] = b[i][len-1-j]; } tmp[len] = '\0'; insert(tmp,2); } long long s2 = cnt; long long ans = s1 * s2; //cout << s1 << ' ' << s2 << endl; for(int i=0; i<26; i++) { ans -= cnt1[i] * cnt2[i]; } printf("%lld\n",ans); } return 0; }