题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5672
有一个 10\leq10≤长度\leq 1,000,000≤1,000,000 的字符串,仅由小写字母构成。求有多少个子串,包含有至少k(1 \leq k \leq 26)k(1≤k≤26)个不同的字母?
输入包含多组数据. 第一行有一个整数T (1\leq T\leq 10)T(1≤T≤10), 表示测试数据的组数. 对于每组数据: 第一行输入字符串SS。 第二行输入一个整数kk。
对于每组数据,输出符合要求的子串的个数。
2 abcabcabca 4 abcabcabcabc 3
0 55
尺取法,j~i,不同个数为kk,每当kk==k,就可以计算j开始的个数。
有一个明显的性质:如果子串(i,j)(i,j)包含了至少kk个不同的字符,那么子串(i,k),(j < k < length)(i,k),(j<k<length)也包含了至少kk个不同字符。
因此对于每一个左边界,只要找到最小的满足条件的右边界,就能在O(1)O(1)时间内统计完所有以这个左边界开始的符合条件的子串。
寻找这个右边界,是经典的追赶法(尺取法,双指针法)问题。维护两个指针(数组下标),轮流更新左右边界,同时累加答案即可。复杂度 O(length(S))O(length(S))。
代码:
#include<iostream> #include<cstring> #include<string> using namespace std; int vis[27]; int main() { int t,k; string a; cin.sync_with_stdio(false); cin>>t; while(t--){ cin>>a>>k; memset(vis,0,sizeof(vis)); int len=a.size(); long long sum=0; int kk=0; // 表示从j开始到i的不同字符个数; int j=0; for(int i=0;i<len;i++){ if(vis[a[i]-'a']==0) kk++; // 从i开始的不同字母的个数; vis[a[i]-'a']++; // a[i]出现的次数 while(kk==k){ // 不同字母的个数够k个之后, sum+=len-i; // 从i个开始,可以形成len-i个子串 vis[a[j]-'a']--; // j从0开始,往后移,a[j]出现次数-1, if(vis[a[j]-'a']==0) // 如果移完之后该字符出现的次数为0,那么kk--; kk--; j++; } } cout<<sum<<endl; } return 0; }