【考研必备】c++串的基础操作和kmp算法实现

其实串这块还是很简单的,主要是kmp算法让人头大。考研书上基本都是c语言struct写的,个人感觉还是用类写比较清楚一些。

复习的思维导图

串的结构定义

定长顺序存储表示

给串尾加上'\0'作为串结束的标记。同时也设定length。这样做虽然多用一个单位的存储空间,但就是代码中用起来最方便的形式。

const int maxSize=99;
class Str{
    public:
        char str[maxSize+1];
        int length;
};

串的动态分配存储表示和重新赋值

#include 
using namespace std;
const int maxSize=99;
class Str{
    public:
        char *ch; 
        int length=0;
        Str(char *c){
            ch=c;
            while(*c){
                ++length;
                ++c;
            }
        }
    int reassign(char* c){
        if(ch){
            ch=NULL;
            length=0;
            int len=0;
            char *temp;
            temp=c;
            while(*temp){
                ++len;
                ++temp;
            }
            if(len==0){ // 新字符串为空串 
                ch=NULL;
            }else{
                ch=c;
                length=len;
            }
            return 1;
        }
        return 0;
    }
};
int main(){
    Str s("input");
    s.reassign("hello world!!");
    cout<

串比较

有两个串a,b,如果a的ASCII码小于b的ASCII码,则返回a小于b标记,如果a的ASCII码大于b的ASCII码,返回a大于b的标记,如果a等于b的ASCII码,则按照之前的规则继续比较两串中的下一对字符。经过上述步骤,在没有比较出a和b大小的情况下,先结束的串为较小串。两串同时结束,只要返回两串相等标记。

int strCompare(Str s1,Str s2){
    int i=0;
    while(i

串连接

如果a的ASCII码小于b的ASCII码,则返回a小于b标记,如果a的ASCII码大于b的ASCII码,返回a大于b的标记,如果a等于b的ASCII码,则按照之前的规则继续比较两串中的下一对字符。经过上述步骤,在没有比较出a和b大小的情况下,先结束的串为较小串。两串同时结束,只要返回两串相等标记。

int concat(Str &target,Str s1,Str s2){
    if(target.ch){
        target.ch=NULL;
    }
    target.ch=new char;
    int i=0;
    while(i

求子串

从给定串中某一位置开始到某一位置结束的串的操作称为求子串操作。

int Str::substring(Str &str,int pos,int len){
    if(str.ch){
        str.ch=NULL;
    }
    if(pos+len>length){
        cout<<"所求位置的字符串长度溢出"<=pos&&j

清空串

int Str::clearstring(){
    if(ch){
        ch=NULL;
    }
    length=0;
    return 1;
}

int main(){
    Str s1("hello");
    s1.readStr(); //hello
    s1.clearstring();
    s1.readStr(); // 
    cout<

串的模式匹配算法

1.简单模式匹配的算法

基本思想从主串的第一个位置起和模式串的第一个字符开始比较,如果相等,则继续逐一比较后续字符。否则从主串儿的第二个字符开始,在重新用上一步的方法与模式串中的字符作比较,以此类推,直到比较完成模式串中所有的字符,若匹配成功,则返回串在主串中的位置,若匹配不成功,则返回一个可区别于主串所有位置的标记,如0。

int Str::indexOf(Str target){
    if(length

2.kmp算法

kmp算法不好理解,总之重点是求出next数组,然后套用简单匹配模式算法,将j的下一跳置为next[j]就ok了。具体的算法看博客是不好理解的,推荐大家去看视频。我看的是b站一个印度小哥讲解的,汪都能听懂的KMP字符串匹配算法【双语字幕】,他的next数组与严蔚敏讲解的不同,不过很好理解,我是看书真的看不懂了,(我用19天勤的参考书,跑了遍程序发现是错的ORZ)。下面的算法是拿js实现的,按照小哥思路写的,和书上的next不一样,需要你右移一位,每位加1即为严的版本next。

求next数组

function getNextArr(str) {
  let j = 0, i = 1;
  const next = [0]
  let isSuccessiveEqual = true;
  while (i < str.length && j < str.length) {
    if (str[j] == str[i]) {
      next[i] = isSuccessiveEqual ? (next[i - 1] + 1) : next[j] + 1 
      i++
      j++
      isSuccessiveEqual = true
    } else {
      isSuccessiveEqual = false
      if (j == 0) {
        next[i] = 0
        i++
      } else {
        j = next[j - 1]
      }
    }
  }
  return next
}

getNextArr('abcaby') // [0, 0, 0, 1, 2, 0]
getNextArr('aabaabaaa') // [0, 1, 0, 1, 2, 3, 4, 5, 2]

kmp算法

function kmp(text, pattern) {
  const next = getNextArr(pattern)
  let i = 0, j = 0
  while (i < text.length && j < pattern.length) {
    if (text[i] == pattern[j]) {
      i++
      j++
      if (j == pattern.length) {
        return i - pattern.length
      }
    } else {
      j > 0 ? j = next[j - 1] : i++
    }
  }
  return -1
}

kmp('abxabcabcaby', 'abcaby') // 6
kmp('111str111', 'str11') // 3

关注订阅号获得更加及时的推送~

wechat:那屋水泡

你可能感兴趣的:(【考研必备】c++串的基础操作和kmp算法实现)