2020.9.7
模式串 pattern = abcabcabg
,文本串 text = abcadabcabcffgkha
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
---|---|---|---|---|---|---|---|---|---|---|
字符 | a | b | c | a | b | c | a | b | g | ‘\0’ |
nextval | 0 | 0 | 0 | 1 | 2 | 3 | 4 | 5 | 0 | 0 |
next | -1 | 0 | 0 | 0 | 1 | 2 | 3 | 4 | 5 | 0 |
其中nextval[x]代表以x结尾的后缀串的末尾和前缀串最大相同的字符数。但是前缀串和后缀串不能相同。所以nextval[0] = 0
, 那为什么nextval[7]=5
呢?
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
---|---|---|---|---|---|---|---|---|---|---|
a | b | c | a | b | c | a | b | g | ‘\0’ | |
a | b | c | a | b | c | a |
我们看到,以s[7]结尾的后缀,和前缀串相同的字符最多有5个,所以nextval[7] = 5
next数组是怎么来的呢?我们观察可以得到:next数组就是nextval数组整体向右移动了一个单元,然后next[0] = -1
后面的过程依次类推。
如果Pj走到了Pattern的末尾,说明匹配成功了。如果Pi走到了末尾,还没匹配成功,那么说明匹配失败。
Pattern[0,1,2,3...t-1]
和Pattern[Pj-t...Pj-2,Pj-1]
这两个子串是相同的,所以Pattern[0,1,2,3...t-1]
和text[Pi-t...Pi-2,Pi-1]
也是相同的。Pj=next[x] = t
,直接从Pattern[t]和text[i]
开始比较。所以,我们可以写出KMP匹配的代码了:
int getFirstMathchPos(const string& text,const string& pattern,const vector<int>& next) {
int lent = text.length(), lenp = pattern.length();
int i = 0, j = 0; //初始化指针i,j均为0,从文本串头部和模式串的头部开始匹配
while(i<lent) { //如果文本串指针i到头了,说明匹配完了
if(j==-1||pattern[j]==text[i]) { //如果pattern[j]==text[i],说明相等,一起往前
++i; ++j; //如果j==-1了,就说明i也该++了
if(j==lenp) return i-lenp; //如果j走到了模式串尾,说明匹配到了,我们返回文本串
//最开始匹配到Pattern[0]的位置
}
else j = next[j];
}
return -1; //说明没匹配上,返回-1
}
那么next数组怎么求呢?next数组其实就是在 Pattern串的后缀上,匹配Pattern的前缀,所以写法差不多。
vector<int> getNext(string pattern) {
int lenp = pattern.length();
vector<int> next(lenp+2,0); //这里写lenP+1的话,重复匹配的时候会越界
int i = 0, j = -1;
next[0] = -1;
while(i<=lenp) {
if(j==-1||pattern[i]==pattern[j])
++i, ++j, next[i] = j; //记录next[i]=j
else
j = next[j];
}
return next;
}
int getCountOfMatchMax(const string& text,const string& pattern,const vector<int>& next) {
int lent = text.length(), lenp = pattern.length(), cnt = 0;
int i = 0, j = 0;
while(i<lent) {
if(j==-1||pattern[j]==text[i]) {
++i;++j;
if(j==lenp) ++cnt, j = next[j]; //可以重叠的实现就在这里,请自己体会
}
else
j = next[j];
}
return cnt;
}
int getCountOfMatchMin(const string& text,const string& pattern,const vector<int>& next) {
int lent = text.length(), lenp = pattern.length(), cnt = 0;
int i = 0, j = 0;
while(i<lent) {
if(j==-1||pattern[j]==text[i]) {
++i;++j;
if(j==lenp) ++cnt, j = 0;
}
else
j = next[j];
}
return cnt;
}
int getMaxPalindromePrefixLength(const string& s) { //求最长回文前缀的长度
string text = s;
reverse(text.begin(),text.end());
const string& pattern = s;
vector<int> next = getNext(pattern);
int i = 0, j = 0, len = s.length();
while(i<len) {
if(j==-1||text[i]==pattern[j])
++i, ++j;
else j = next[j];
}
return j;
}
知道了最长回文前缀的长度,就可以在字符串开头添加字符变成最短的回文串了
string Push_front_to_palindrome(const string& s) { //前面加字符变最短回文串
int len = s.length();
if(!len) return s;
string ans;
int Len = getMaxPalindromePrefixLength(s);
for(int i=len-1;i>=Len;--i)
ans += s[i];
ans += s;
return ans;
}
int getMaxPalindromeSuffixLength(const string& s) { //求最长回文后缀的长度
const string& text = s;
string pattern = s;
reverse(pattern.begin(),pattern.end());
vector<int> next = getNext(pattern);
int i = 0, j = 0, len = text.length();
while(i<len) {
if(j==-1||text[i]==pattern[j])
++i, ++j;
else j = next[j];
}
return j;
}
在字符串尾部追加字符称为回文串:
string Push_back_to_palindrome(const string& s) { //尾部追加字符串变最短回文串
int len = s.length();
if(!len) return s;
string ans = s;
int Len = getMaxPalindromeSuffixLength(s);
for(int i=len-Len-1;i>=0;--i)
ans += s[i];
return ans;
}
int getCountOfAllPrefixMatch(const string& s,const int mod=10007) { //HUD-3366求所有前缀匹配字符串的总次数
vector<int> next = getNext(s);
int len = s.length();
vector<int> sum(len+2,-1); //sum[i]记录长度为i的前缀被匹配的次数
sum[0] = 0;
for(int i=1;i<=len;++i) {
int k = next[i];
int ans = 1;
while(k>0) {
++ans;
k = next[k];
if(sum[k]!=-1) {
ans += sum[k];break;
}
}
sum[i] = ans;
}
int res = 0;
for(int i=1;i<=len;++i)
res = (res+sum[i])%mod;
return res;
}
#include
using namespace std;
namespace KMP{
vector<int> getNext(string pattern) {
int lenp = pattern.length();
vector<int> next(lenp+2,0); //这里写lenP+1,重复匹配的时候会越界
int i = 0, j = -1;
next[0] = -1;
while(i<=lenp) {
if(j==-1||pattern[i]==pattern[j])
++i, ++j, next[i] = j;
else
j = next[j];
}
return next;
}
int getFirstMathchPos(const string& text,const string& pattern,const vector<int>& next) {
int lent = text.length(), lenp = pattern.length();
int i = 0, j = 0;
while(i<lent) {
if(j==-1||pattern[j]==text[i]) {
++i; ++j;
if(j==lenp) return i-lenp;
}
}
return -1;
}
int getCountOfMatchMax(const string& text,const string& pattern,const vector<int>& next) {
int lent = text.length(), lenp = pattern.length(), cnt = 0;
int i = 0, j = 0;
while(i<lent) {
if(j==-1||pattern[j]==text[i]) {
++i;++j;
if(j==lenp) ++cnt, j = next[j];
}
else
j = next[j];
}
return cnt;
}
int getCountOfMatchMin(const string& text,const string& pattern,const vector<int>& next) {
int lent = text.length(), lenp = pattern.length(), cnt = 0;
int i = 0, j = 0;
while(i<lent) {
if(j==-1||pattern[j]==text[i]) {
++i;++j;
if(j==lenp) ++cnt, j = 0;
}
else
j = next[j];
}
return cnt;
}
int getMaxPalindromePrefixLength(const string& s) { //求最长回文前缀的长度
string text = s;
reverse(text.begin(),text.end());
const string& pattern = s;
vector<int> next = getNext(pattern);
int i = 0, j = 0, len = s.length();
while(i<len) {
if(j==-1||text[i]==pattern[j])
++i, ++j;
else j = next[j];
}
return j;
}
int getMaxPalindromeSuffixLength(const string& s) { //求最长回文后缀的长度
const string& text = s;
string pattern = s;
reverse(pattern.begin(),pattern.end());
vector<int> next = getNext(pattern);
int i = 0, j = 0, len = text.length();
while(i<len) {
if(j==-1||text[i]==pattern[j])
++i, ++j;
else j = next[j];
}
return j;
}
string Push_front_to_palindrome(const string& s) { //前面加字符变最短回文串
int len = s.length();
if(!len) return s;
string ans;
int Len = getMaxPalindromePrefixLength(s);
for(int i=len-1;i>=Len;--i)
ans += s[i];
ans += s;
return ans;
}
string Push_back_to_palindrome(const string& s) { //尾部追加字符串变最短回文串
int len = s.length();
if(!len) return s;
string ans = s;
int Len = getMaxPalindromeSuffixLength(s);
for(int i=len-Len-1;i>=0;--i)
ans += s[i];
return ans;
}
int getCountOfAllPrefixMatch(const string& s,const int mod=10007) { //HUD-3336求所有前缀匹配字符串的总次数
vector<int> next = getNext(s);
int len = s.length();
vector<int> sum(len+2,-1); //sum[i]记录长度为i的前缀被匹配的次数
sum[0] = 0;
for(int i=1;i<=len;++i) {
int k = next[i];
int ans = 1;
while(k>0) {
++ans;
k = next[k];
if(sum[k]!=-1) {
ans += sum[k];break;
}
}
sum[i] = ans;
}
int res = 0;
for(int i=1;i<=len;++i)
res = (res+sum[i])%mod;
return res;
}
};
int main(void) {
ios::sync_with_stdio(false);
// int T;
// string pattern,text;
// cin>>T;
// while(T--) {
// cin>>pattern>>text;
// vector next = KMP::getNext(pattern);
// cout<
// }
// string s;
// while(cin>>s) {
cout<
cout<
// cout<
// }
int T,n;
string s;
cin>>T;
while(T--) {
cin>>n>>s;
cout<<KMP::getCountOfAllPrefixMatch(s)<<"\n";
}
return 0;
}
2020.9.7
16:24