KMP算法 跳位理解

KMP算法最关键的点->跳位

怎么跳?这里要引入两个知识。

1:字符串前后缀:

 KMP算法 跳位理解

2:部分匹配表:

 KMP算法 跳位理解

"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。以"ABCDABD"为例,

- "A"的前缀和后缀都为空集,共有元素的长度为0;

- "AB"的前缀为[A],后缀为[B],共有元素的长度为0;

- "ABC"的前缀为[A, AB],后缀为[BC, C],共有元素的长度0;

- "ABCD"的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元素的长度为0;

- "ABCDA"的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA, DA, A],共有元素为"A",长度为1;

- "ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为[BCDAB, CDAB, DAB, AB, B],共有元素为"AB",长度为2;

- "ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。

////////////////////////////////////////////////////////////////////////


逐字比较逐字移位:

 KMP算法 跳位理解

KMP算法 跳位理解

KMP算法 跳位理解

KMP算法 跳位理解

KMP算法 跳位理解

在这一步的时候,如果还是逐字移位,不划算了。因为前面已经匹配了6位“ABCDAB”。那么应该移动6位?

No!KMP算法认为 移动位数 = 已匹配的字符数 - 对应的部分匹配值

最后一个匹配字符B对应的"部分匹配值"为2。

也就是 6-2=4 最后要跳过的位数为4。

KMP算法 跳位理解 

“对应的部分匹配值”实质的意义在于:快速的把匹配串的前缀跟已匹配的后缀对齐,加速进入下一次匹配。


你可能感兴趣的:(KMP算法 跳位理解)