字符串博大精深,而且算法都比较难以理解(不像图论那么显然)
最近开始钻研大白字符串,顺便看各种blog和刷kuangbin专题
首先是trie树(字典树),这个是最基础的(据说也很重要)
trie树blog地址:http://blog.csdn.net/youngyangyang04/article/details/6840393
poj1056的代码
#include
KMP算法
然后开始刷KMP算法,这个算法比较难以理解,百度了个不错的blog,不过优化后有next的KMP还是感觉比较难写(所以我还是用大白上的KMP(MP)模板了)
反正O(m+n)复杂度应该都能过
blog地址:http://blog.csdn.net/joylnwang/article/details/6778316
hdu 1711:
题意:这么明显,就是从第几个位置开始匹配
题解:KMP模版,用的大白的
int a[MAX];
int b[10005];
int f[10005];
int n,m;
void getFail(){
f[0]=0;
f[1]=0;
for(int i=1;i
hdu 1686
题意:两个字符串,第一个在第二个中出现多少次
题解:KMP计算匹配次数,理解之后就很容易,每次匹配之后只要计数+1即可,然后匹配时会用失配函数自动从模式串底端往前移
char a[MAX];
char b[10005];
int f[10005];
int n,m;
void getFail(){
f[0]=0;
f[1]=0;
for(int i=1;i
hdu 2087
题意:一个字符串可以分成多少个第二个字符串
题解:这题和上题差不多,不过就是匹配的都不能重叠,就是每次匹配完成之后都必须把模式串的指针移动到开头
所以只要在上面的代码num++,下面加个j=0即可AC
hdu 3746
题意:给你一个字符串,让你在两端最少添加一些字符,使得整个字符串里有循环
题解:这是用KMP求最小循环节,比如aaa最小循环节是a,所以不需要添加,
abca,最小循环节是abc所以添加2
abcde最小循环节是abcde所以添加5
这里就要用到失配函数的作用了
这边有一些结论 http://www.cnblogs.com/wuyiqi/archive/2012/01/06/2314078.html
看完这个证明应该就理解了
len-f[len]就是最小循环节
char a[MAX];
char b[100005];
int f[100005];
int n,m;
void getFail(){
f[0]=0;
f[1]=0;
for(int i=1;i
hdu 1358
题意:对应每个i,从头开始长度为i的字符串能被最小循环节长度整除,把长度和需要几个最小循环节输出
题解:KMP嘛怒套一波(失配函数极为重要必须好好理解)
char a[MAX];
char b[MAX];
int f[MAX];
int n,m;
void getFail(){
f[0]=0;
f[1]=0;
for(int i=1;i
hust 1010
直接求的最小循环节的长度m-f[m]
poj 2406
题意:求最小循环节周期,如果没有最小循环节或者不能被最小循环节整除,那么就输出1
char a[MAX];
char b[MAX];
int f[MAX];
int n,m;
void getFail(){
f[0]=0;
f[1]=0;
for(int i=1;i0&&m%(m-f[m])==0) printf("%d\n",m/(m-f[m]));
else printf("1\n");
}
return 0;
}
poj 2752
题意:给你一个字符串,让你在这个字符串中寻找前缀等于后缀的所有字符串的长度
题解:getFail一发,然后f[m]的值就是最长的前缀等于后缀的字符串的长度,然后这样想,整个字符串的前缀等于后缀,就是f[m]中的第一个字符串的前缀和第二个字符串的后缀,所以只需要求第一个字符串中前后缀的长度就是f[f[m]]
char a[MAX];
char b[MAX];
int f[MAX];
int ans[MAX];
int n,m;
void getFail(){
f[0]=0;
f[1]=0;
for(int i=1;i
HDU 2594
题意:给你两个字符串,然后找第一个串的最长前缀是第二个串的后缀
题解:自然是KMP咯,但是我一开始太弱了,我直接枚举第一个串的前缀长度,然后TLE
后来发现,如果把两个串加到一起,然后求f[m],然后就是最长前缀,为啥呢,因为f[m]是第m位失配后转移过去的地方,然后0-f[m]这些字符都和最后的那些匹配,才能转移的,我太二了,这不就是妥妥的失配函数搞一下么,好久没做KMP了,有些遗忘失配函数的妙用
AC代码 : http://paste.ubuntu.net/12712552/
当然这题妥妥的还可以用哈希来一炮,我哈希一直不是太会写,这次来了一发复习了一下
AC代码 : http://paste.ubuntu.net/12712556/
HDU 3336
题意:给你个字符串,然后问你里面有多少个前缀,就是这个字符串的每个前缀,在字符串里出现的次数的总和
题解:KMP+dp
又要巧妙利用失配函数了,就是dp[i]是以i结尾的是前缀的字符串有多少个,然后用失配函数转移一下,就是dp[i]=dp[f[i]]+1,然后每个dp[i]加起来就行了
AC代码 : http://paste.ubuntu.net/12714547/
/********************************************************************************************************************************************************************************************/
AC自动机大法好
理解KMP之后还是很好理解AC自动机的 http://blog.csdn.net/niushuai666/article/details/7002823
就是trie树上的KMP
问年神要了一波模版,感觉自己萌萌哒
hdu 2222
题解:第一个AC自动机模版题
#include
hdu 2896
题解:就是问你出现过哪几个字符串
这里改一下就行了
void print(int j){
if(j){
vis[val[j]]=1;
flag=1;
print(last[j]);
}
}
hdu 3065
题解:计数
void print(int j){
if(j){
cnt[val[j]]++;
print(last[j]);
}
}
poj 2778
题意:给你一些字符串,然后给你个长度n,问你长度n的字符串里,不出现前面那些字符串的情况的总个数
题解:AC自动机+矩阵快速幂
这题一开始看见无从下手,后来看了题解之后原来是和矩阵扯上了关系
矩阵可以当成图,上面的元素a[i][j]就是从点i到j的路的条数
矩阵: http://www.matrix67.com/blog/archives/276
此题详细题解: http://blog.csdn.net/morgan_xww/article/details/7834801
此博客的图比较详细
就是先把这些字符串用AC自动机处理,有0-ac.sz-1 一共ac.sz个点,然后每个点之间的路,就是给的字符串的连接,还有就是失配函数也是两点之间的路径,还有如果当前字符是A,然后到达节点之后下面没有A的路,那么就是等于在这个点有自环(那个博客里的图十分清楚)
但是在AC自动机处理时,遇到字符串结尾,要用val标记,还有last标记,在构造矩阵时,如果val[v]或者last[v]不为0的话,意思就是这边出现了trie树中的字符串,那么就是不可取的,所以构造矩阵时,只有走到不是危险节点的这条边才能添加进矩阵
然后就是n次矩阵快速幂(我的模版有毒,不造为何一阶矩阵算出来一直是0,改了半天也没好,所以从此我就套用年神的矩阵模版了)
#include
/**************************************************************************************************************************************************************************************************/
字符串 dp
poj3691
题意:给你n个字符串,这是危险 字符串,然后给你一个字符串,让你最少修改多少次,使里面没有危险字符串出现,如果不能做到就-1
题解:危险字符串先构造AC自动机,建立危险节点,然后在给的字符串上做dp
二维dp[i][j],表示字符串的第i位匹配到AC自动机上的j状态时最少需要修改的次数
以前一直搞不清如何转移,发现题解里也都写的不清楚,在这里提一下,这个i匹配到j状态时,从trie树上root到j的字符都与字符串的后缀都匹配了,才能有dp[i][j]的状态,如果i-1和j状态前一个字符不匹配,那么就要+1,把i-1修改
说到这里应该很清楚了,字符串挺难,主要是理解和思考,我还刚刚起步,多看书多敲题
转移方程 dp[i][ch[j][k]] = min (dp[i][ch[j][k]] , dp[i-1][j] + s[i-1]!=k )
ch[j][k]是j节点下的字符k(A,T,C,G)所转移到的节点(通过失配函数)
如果s[i-1]不等于k,那么就要修改i-1
还有如果转移到的点是危险节点,那么就不做转移
最后只要遍历dp[len][i]找到最小值即可,这是字符串的len长度匹配到一个不是危险节点时候需要修改的次数
#include
hdu 2243
题意:给你n个字符串,问你长度小于等于m的字符串中必须出现这n个其中一个子串的字符串有多少情况
题解:前面做过一定不能出现,现在是反过来考虑,所以先考虑所有字符串,就是从26^1+26^2+......+26^m,这个用快速幂+递归求等比数列就好了
然后是计算长度小于等于m的字符串中不能出现上述字符串的个数,两个相减就是结果
由于是模1<<64,直接用unsigned long long即可,会自动模
难点就在于这个n个字符串组成的矩阵
首先是构造AC自动机,然后如果val[j],last[j]不为0的话就continue,为0的地方就在矩阵上++(可以到达)
然后就是求A^1+A^2+……+A^m这个矩阵的第一行的和
如果用快速幂+递归很有可能爆掉
矩阵是一种十分奇妙的东西,假如矩阵A是n行n列,年神教我开成n+1行n+1列,最后一行都是0,最后一列都是1(A[n+1][n+1]=1)
这样的话两个矩阵相乘,第一行的前n个,还是和n*n的两个A相乘一样,第一行的最后一个值,就是n+1个1和另外个A的第一行相乘,值是A的第一行的值+1
以此类推,第二次得到的最后一个值就是A^2+A的第一行的值+1,最后得到的就是A^m-1+……+1,然后只要把最后得到的矩阵的第一行相加即可
如此巧妙的技巧我必须以后多加练习,矩阵的优化是十分的奇妙
#include
/***********************************************************************************************************************************************************************************************/
manacher
manacher算法是计算最长回文子串的好方法,只要O(n)的复杂度即可搞定
算法blog ; http://blog.csdn.net/ggggiqnypgjg/article/details/6645824/
HDU 3068
模版题,贴个模版
AC代码: http://paste.ubuntu.net/12636200/
hdu 3294
这题先是要字符变换,然后就是求最长回文的区间位置
其实就是求出最长回文之后,计算左右区间,然后输出就好了,开头用了strncpy就是WA,不明白啊
AC代码 : http://paste.ubuntu.net/12636209/