【字符串/尺取法】HDU5672String【BestCoder Round #81 (div.2)】

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5672

问题描述
有一个 10\leq10长度\leq 1,000,0001,000,000 的字符串,仅由小写字母构成。求有多少个子串,包含有至少k(1 \leq k \leq 26)k(1k26)个不同的字母?
输入描述
输入包含多组数据. 第一行有一个整数T (1\leq T\leq 10)T(1T10), 表示测试数据的组数. 对于每组数据:
第一行输入字符串SS。
第二行输入一个整数kk
输出描述
对于每组数据,输出符合要求的子串的个数。
输入样例
2
abcabcabca
4
abcabcabcabc
3
输出样例
0
55

尺取法,j~i,不同个数为kk,每当kk==k,就可以计算j开始的个数。

有一个明显的性质:如果子串(i,j)(i,j)包含了至少kk个不同的字符,那么子串(i,k),(j < k < length)(i,k),(j<k<length)也包含了至少kk个不同字符。

因此对于每一个左边界,只要找到最小的满足条件的右边界,就能在O(1)O(1)时间内统计完所有以这个左边界开始的符合条件的子串。

寻找这个右边界,是经典的追赶法(尺取法,双指针法)问题。维护两个指针(数组下标),轮流更新左右边界,同时累加答案即可。复杂度 O(length(S))O(length(S))


代码:

#include<iostream>
#include<cstring>
#include<string>
using namespace std;
int vis[27];
int main()
{
    int t,k;
    string a;
    cin.sync_with_stdio(false);
    cin>>t;
    while(t--){
        cin>>a>>k;
        memset(vis,0,sizeof(vis));
        int len=a.size();
        long long sum=0;
        int kk=0;       //  表示从j开始到i的不同字符个数;
        int j=0;
        for(int i=0;i<len;i++){
            if(vis[a[i]-'a']==0)
                kk++;           //  从i开始的不同字母的个数;
            vis[a[i]-'a']++;    //  a[i]出现的次数
            while(kk==k){       //  不同字母的个数够k个之后,
                sum+=len-i;     //  从i个开始,可以形成len-i个子串
                vis[a[j]-'a']--;        //  j从0开始,往后移,a[j]出现次数-1,
                if(vis[a[j]-'a']==0)    //  如果移完之后该字符出现的次数为0,那么kk--;
                    kk--;
                j++;
            }
        }
        cout<<sum<<endl;
    }
    return 0;
}


你可能感兴趣的:(【字符串/尺取法】HDU5672String【BestCoder Round #81 (div.2)】)