串+KMP

字符串

串的存储结构

1.定长顺序存储表示
用一组地址连续的存储单元

#define MAXLEN 255
typedef struct{
    char ch[MAXLEN];
    int length;
}SString;

2.堆分配存储表示
仍以一组地址连续的存储单元存放,但存储空间是在程序执行过程中动态分配的

typedef struct{
    char *ch;
    int length;
}HString;

C语言中存在一个称为堆的自由存储区,并用malloc()和free()函数来完成动态存储管理
上述两种方式通常为高级程序设计语言采用
3.块链存储表示
采用链表方式存储串值
在具体实现时每个结点即可以存放一个字符,也可以存放多个字符。每个结点称为块,整个链表称为块链结构。


串的基本操作

StrAssign(&T, chars) "赋值操作,把串T赋值为chars"
StrCopy(&T, S)
StrEmoty(S) "判空"
StrCompare(S,T)
StrLength(S)
SubString(&Sub, S, pos, len) "求子串,用Sub返回S的第pos个字符起长度为len的子串"
Concat(&T, S1, S2) "联接"
Index(S, T, pos) "定位子串T,第pos个字符之后第一次出现的位置"
Replace(&S, T, V) "替换子串"
StrInsert(&S, pos, len) "插入子串"
StrDelete(&S, pos, len)
ClearString(&S)
DestroryString(&S)

串的模式匹配

子串的定位操作,子串通常称为模式串

int Index(SString S, SString T, int pos)
{
    int i=pos, j=1;
    while(i<=S.length&&j<=T.length){
        if(S.ch[i]==T.ch[j]){
            ++i; ++j;
        }
        else{
            i=i-j+2; j=1;
        }
    }
    if(j>T.length) return i-T.length;
    else return 0;
}

最坏时间复杂度O(nm)

改进的模式匹配算法——KMP
利用比较过的信息,i指针不需要回溯,仅将子串向后滑动一个合适的位置,并从这个位置开始和主串进行比较,这个合适的位置仅与子串本身的结构有关,而与主串无关。
前缀,后缀,部分匹配值

前缀后缀部分匹配值.PNG

KMP过程.PNG

用上图中的next数组的话,匹配失败时去找它前一个元素的部分匹配值,这样有点不便,所以将next数组右移一位,第一位补-1,这样哪个元素匹配失败直接看它自己对应的值即可。
Move=(j-1)-next[j]
j=j-Move=j-((j-1)-next[j])=next[j]+1
有时为了使公式更加简洁,将next数组整体加1,这样j=next[j]

计算机求next数组的方法

void get_next(String T, int next[])
{
    int i=1, j=0;
    next[1]=0;
    while(i
求next.PNG
int Index_KMP(String S, String T, int next[], int pos)
{
    int i=pos, j=1;
    while(i<=S.length&&j<=T.length){
        if(j==0||S.ch[i]==T.ch[j]){
            ++i;++j;
        }
        else
            j=next[j];
    }
    if(j>T.length)
        return i-T.length;
    else
        return 0;
}

你可能感兴趣的:(串+KMP)