代码随想录算法训练营Day9|实现strStr、重复的子字符串

[KMP算法]

KMP算法是一种改进的字符串模式匹配算法。模式串与主字符串进行匹配时,失配发生后,不再单纯地将模式后移一位,而是根据当前字符串的特征数来决定模式移动的位数。避免从头匹配。

[next数组 || 前缀表]

next数组就是一个前缀表,很多KMP算法实现都是把前缀表统一减一(右移一位,初始位置为-1)之后作为next数组。

做字符串匹配时,如果使用暴力匹配,发现不匹配,此时就要从头匹配,但如果使用前缀表就不会从头匹配,而是从上次已经匹配的内容开始匹配。

【时间复杂度分析】

其中n为文本串长度,m为模式串长度,因为在匹配的过程中,根据前缀表不断调整匹配的位置,可以看出匹配的过程是O(n),之前还要单独生成next数组,时间复杂度是O(m)。所以整个KMP算法的时间复杂度为O(n+m)的。

暴力的解法显而易见是O(n*m),所以KMP在字符串匹配中极大地提高了搜索的效率。

【构造next数组】

使用一个函数getNext来构建next数组,函数参数为指向next的指针,和一个字符串。

void getNext(int *next, const string& s)

构造next数组其实就是计算模式串s,前缀表的过程。主要有如下三步:

1.初始化

2.处理前后不相同的情况

3.处理前后缀相同的情况

1.初始化:定义两个指针i和j, j指向前缀末尾位置,i 指向后缀末尾位置。

然后还要对next数组进行初始化赋值,如下:

int j = -1 ;//j赋值为-1,因为前缀表要统一减一的操作,j=-1是其中的一种实现
next[0] = j;//next[i]表示i(包括i)之前最长相等的前后缀长度(其实就是j),所以初始化next[0] = j.

2.处理前后缀不相同的情况

因为j初始化为-1,那么i就从1开始

for(int i = 1;i < s.size(); i++){

如果s[ i ]与s[ j + 1 ]不相同,也就是遇到前后缀末尾不相同的情况,就要向前回退。

回退方法:

next[ j ]就是记录着 j (包括 j ) 之前的子串的相同前后缀的长度。

那么是s [ i ]与是s[ j + 1]不相同,就要找 j+1 前一个元素在next数组值里的值 (就是next[ j ] )

所以,处理前后缀不相同的情况代码如下:

while(j >= 0 && s[i] != s[j + 1]){ //前后缀不相同了
     j = next[j]; //向前回退
}

 3.处理后缀相同的情况

如果s[ i ]与s[ j + 1]相同,那么就同时向后移动 i 和 j ,说明找到了相同的前后缀,同时还要将 j (前缀的长度)赋给 next[ i ],因为next [ i ]要记录相同前后缀的长度。

if(s[i] == s[j + 1]){ //找到相同的前后缀s[i]和s[j+1]
    j++;  
}
next[i] = j;//将j赋值给next[i],也就是用next[i]记录相同前后缀的长度。

最后整体构建next数组的函数代码如下:

void getNext(int * next,const string& s){
 int j = -1;
 next[0] = j;
 for(int i = 1;i < s.size(); i++){ //注意i从1开始
    while(j >= 0 && s[i] != s[j+1]){  //判断前后缀不同,执行回退操作,while语句和if一样,不满足条件时就不执行,所以当找到和后缀s[i]相等的前缀s[j+1]时才会进入下一个语句   
     j = next[j];//向前回退,此时因为前缀s[j+1]和后缀s[i]不相等,要退回去1比较s[j]和s[i]
  }
  if(s[i] == s[j+1]){  //判断前后缀相同
   j++; //向右移动
  }
  next[i] = j;//将j(前缀的长度)赋给next[i]
 }
}

【使用next数组来匹配】

文本串s里 找是否出现过模式串t.

定义两个下标 i和j 。 j 指向模式串起始位置, i 指向文本串起始位置。

那么j初始值依然为-1,因为next数组里记录的起始位置为-1.

i就从0开始,遍历文本串,代码如下:

for(int i = 0; i < s.size(); i++)

接下来就是s[ i ]与t[ j + 1 ]进行比较,之所以从t[ j + 1]开始,是因为j初始值是-1。

如果s[ i ]与t[ j + 1]不相同,j 就要从next数组里寻找下一个匹配的位置。

代码如下:

while( j >= 0 && s[i] != t[j+1]){
   j = next[j];
}

如果s[i]和t[j+1]相同,那么i和j同时向后j移动,代码如下:

if(s[i] == t[j+1]){
 j++;//i的增加在for循环里
}

判断在文本串s里出现了模式串t,如果j指向了模式串t的末尾,那么就说明模式串t完全匹配文本串s里的某个子串了。本题要在文本串中找出模式串出现的第一个位置(从0开始),所以返回当前在文本串匹配模式串的位置i减去模式串的长度,就是文本串字符串中出现模式串的第一个位置。

代码如下:

if(j == (t.size() - 1){
  return (i - t.size() + 1);
}

那么使用next数组,用模式串匹配文本串的整体代码如下:

int j = -1;//next数组里记录的起始位置为-1
for(int i = 0;i < s.size();i++)  //注意i就从0开始
{
    while(j >= 0 && s[i] != t[j + 1]){  //不匹配
        j = next[j];  //j寻找之前匹配的位置
    }
    if(s[i] == t[j + 1]){  //匹配,j和i同时向后移
        j++; //i的增加在for循环里
    }
    if(j == (t.size() - 1)){   //文本串s里出现了模式串t
        return(i - t.size() + 1);
    }
}

[前缀表不减1构建next数组]上面用到的是减一的next数组。

void getNext(int* next,const string& s){
    int j = 0;
    next[0] = 0; //从0开始
    for(int i = 1;i < s.size();i++){
        while(j > 0 && s[i] != s[j]){ //j要保证大于0,因为下面有取j-1作为数组下标的操作
            j=next[j - 1];  //注意这里,是要找前一位的对应的回退位置了
        }
        if(s[i] == s[j]){
            j++;
        }
        next[i] = j;
    }
}

用这样的next数组也可以用来做匹配,代码要有所改动。(逻辑一样,只是起点差1,使用时记得前后统一起来,一开始减了1,后面也要跟着)

实现:

class Solution{
    public:
           void getNext(int* next,const string& s){
            int j = 0;
            next[0] = 0;
            for(int i = 1;i < s.size();i++){
                while(j>0 && s[i]!=s[j]){
                    j  next[j-1];
                }
                if(s[i] == s[j]){
                    j++;
                }
                next[i] = j;
            }
           }
           int strStr(string haystack,string needle){
            if(needle.size() == 0){
                return 0;
            }
            int next[needle.size()];
            getNext(next,needle);
            int j = 0;
            for(int i = 0; i < haystack.size();i++){
                while(j > 0 && haystack[i] != needle[j]){
                    j = next[j - 1];
                }
                if(haystack[i] == needle[j]){
                    j++;
                }
                if(j == needle.size()){
                    return(i - needle.size() + 1);
                }
            }
            return -1;
           }

}

你可能感兴趣的:(数据结构)