从头到尾彻底理解KMP
作者:July
时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文。
1. 引言
本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP,思路混乱导致写也写得非常混乱,如此,留言也是“骂声”一片。所以一直想找机会重新写下KMP,但苦于一直以来对KMP的理解始终不够,故才迟迟没有修改本文。
然近期因在北京开了个算法班,专门讲解数据结构、面试、算法,才再次仔细回顾了这个KMP,在综合了一些网友的理解、以及跟我一起讲算法的两位讲师朋友曹博、邹博的理解之后,写了9张PPT,发在微博上。随后,一不做二不休,索性将PPT上的内容整理到了本文之中。
KMP本身不复杂,但网上大部分的文章(包括本文的2011年版本)把它讲混乱了。下面,咱们从暴力匹配算法讲起,一步步从字符串的前缀后缀引入next数组,接着利用next 数组进行匹配,最后介绍KMP的一种扩展算法,希望让大家对KMP有一个清晰的了解。
2. 暴力匹配算法
咱们先来看暴力匹配算法。假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置
- 如果当前字符匹配成功(即S[i] == P[j]),则i++,j++,继续匹配下一个字符;
- 如果失配(即S[i]! = P[j]),令i = i - (j - 1),j = 0,因为每次匹配失败时,j 都被置为0,所以i = i+1,相当于失配时模式串P相对于文本串S向右移动一位。
理清楚了暴力匹配算法的流程及内在的逻辑,咱们可以写出暴力匹配的代码,如下:
- int Violentmatch(char* s, char* p)
- {
- int sLen = strlen(s);
- int pLen = strlen(p);
- int ans = -1;
-
- int i = 0;
- int j = 0;
- while (i < sLen && j < pLen)
- {
- if (s[i] == p[j])
- {
-
- i++;
- j++;
- }
- else
- {
-
- i = i - j + 1;
- j = 0;
- }
- }
- if (j == pLen)
- {
-
- ans = i - j;
- }
- return ans;
- }
举个例子,如果给定文本串S“BBC ABCDAB ABCDABCDABDE”,和模式串T“ABCDABD”,现在要拿模式串P去跟文本串S匹配,整个过程如下所示:
1. S[0]为B,P[0]为A,不匹配,执行第②条指令:“如果失配(即S[i]! = P[j]),令i = i - (j - 1),j = 0”,S[1]跟P[0]匹配,相当于模式串要往右移动一位(i=1,j=0)
2. S[1]跟P[0]还是不匹配,继续执行第②条指令:“如果失配(即S[i]! = P[j]),令i = i - (j - 1),j = 0”,S[2]跟P[0]匹配(i=2,j=0),从而模式串不断的向右移动一位(不断的执行“令i = i - (j - 1),j = 0”,i从2变到4,j一直为0)
3
. 直到S[4]跟P[0]匹配成功(i=4,j=0),此时按照上面的暴力匹配算法的思路,转而执行第①条指令:“如果当前字符匹配成功(即S[i] == P[j]),则i++,j++”,可得S[i]为S[5],P[j]为P[1],即接下来S[5]跟P[1]匹配(i=5,j=1)
4
. S[5]跟P[1]匹配成功,继续执行第①条指令:“如果当前字符匹配成功(即S[i] == P[j]),则i++,j++”,得到S[6]跟P[2]匹配(i=6,j=2),如此进行下去
5. 直到S[10]为空格字符,P[6]为字符D(i=10,j=6),因为不匹配,重新执行第②条指令:“如果失配(即S[i]! = P[j]),令i = i - (j - 1),j = 0”,相当于S[5]跟P[0]匹配(i=5,j=0)
6
. 至此,我们可以看到,如果按照暴力匹配算法的思路,尽管之前文本串和模式串已经分别匹配到了S[9]、P[5],但因为S[10]跟P[6]不匹配,所以文本串回溯到S[5],模式串回溯到P[0],从而让S[5]跟P[0]匹配。
而S[5]肯定跟P[0]失配。为什么呢?因为在之前第4步匹配中,我们已经得知S[5] = P[1] = B,而P[0] = A,即P[0] != P[1],所以S[5]必定不等于P[0],所以回溯过去必然会导致失配。那有没有一种算法,让i 不往回退,只需要移动j 即可呢?
答案是肯定的。这种算法就是本文的主旨KMP算法,它利用之前已经部分匹配这个有效信息,保持i 不回溯,通过修改j 的位置,让模式串尽量地移动到有效的位置。
3. KMP算法
3.1 流程
咱们首先给出KMP算法的流程:
- 假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置
- 如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++,继续匹配下一个字符;
- 如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j],模式串P相对于文本串S向右移动了至少1位(换言之,当匹配失败时,模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值,即移动的实际位数为:j - next[j],且此值大于等于1)。
转换成代码表示,则是:
- int kmpSearch(char* s, char* p, int n)
- {
- int i = 0;
- int j = 0;
- int pLen = strlen(p);
- while (i < n)
- {
-
- if (j == -1 || s[i] == p[j])
- {
- i++;
- j++;
- }
- else
- {
-
-
- j = next[j];
- }
- }
- if (j == pLen)
- return i - j;
- else
- return -1;
- }
继续拿之前的例子来说,当S[10]跟P[6]匹配失败时,KMP不是简单的如朴素匹配那样把模式串右移一位,而是执行第②条指令:“如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]”,即j 从6变到2(后面我们将求得P[6],即字符D对应的next 值为2),所以相当于向右移动的位数为j - next[j]位(j - next[j] = 6-2 = 4位)。
向右移动4位后,S[10]跟P[2]继续匹配。为什么要向右移动4位呢,因为移动4位后,模式串中又有个“AB”可以继续跟S[8]S[9]匹配,相当于在模式串中找相同的前缀和后缀,然后根据前缀后缀求出next 数组,最后基于next 数组进行匹配(不关心next 数组怎么求来的,只想看匹配过程是咋样的,可直接跳到下文
3.2.4节)。
3.2 步骤
- ①寻找最长前缀、后缀
- 对于Pj = p0 p1 ...pj-1,寻找模式串Pj中长度最大且相等的前缀和后缀
- 即寻找满足条件的最大的k,使得p0 p1 ...pk-1 = pj-k pj-k+1...pj-1。也就是说,k是模式串中各个子串的前缀后缀的公共元素的长度,所以求最大的k,就是看某个子串的哪个前缀后缀的公共元素最多。
- 举个例子,如果给定的模式串为“abaabcaba”,那么它的各个子串的前缀后缀的公共元素的最大长度值如下表格所示:
- ②求next数组
- 根据第①步骤中求得的各个前缀后缀的公共元素的最大长度求得next 数组,相当于前者右移一位且初值赋为-1,如下表格所示:
- ③匹配失配,模式串向右移动的位数为:j - next[j]
- 注:j 是模式串中失配字符的位置,且 j 从0开始计数。
KMP的next 数组相当于告诉我们,模式串中的任意一个字符跟文本串中的某个字符匹配失配时,模式串下一步应该跳到哪个位置。如模式串中在j 处的字符跟文本串在i 处的字符匹配失配时,下一步用next [j] 处的字符继续跟文本串匹配。
接下来,分别具体阐述上述3个步骤。
3.2.1 寻找最长前缀后缀
如果给定的模式串是:“ABCDABD”,从左至右遍历整个模式串,其各个子串的前缀后缀分别如下表格所示:
也就是说,原字符串对应的各个前缀后缀的公共元素的最大长度表为(
下简称《最大长度表》):
因为模式串中首尾可能会有重复的字符,故可得出下述结论:
失配时,模式串向右移动的位数为:已匹配字符数 - 失配字符的上一位字符所对应的最大长度值 |
下面,咱们就结合之前的《最大长度表》和上述结论,进行字符串的匹配。如果给定文本串“BBC ABCDAB ABCDABCDABDE”,和模式串“ABCDABD”,现在要拿模式串去跟文本串匹配,如下图所示:
- 1. 因为模式串中的字符A跟文本串中的字符B、B、C、空格接连不匹配,所以模式串不断的右移,直到模式串中的字符A跟文本串的第5个字符A匹配成功:
- 2. 继续往后匹配,当模式串最后一个字符D跟文本串匹配时失配,显而易见,模式串需要向右移动。但向右移动多少位呢?因为此时已经匹配的字符数为6个(ABCDAB),然后根据《最大长度表》可得字符B对应的长度值为2,所以根据之前的结论,可知需要向右移动6 - 2 = 4 位。
- 3. 模式串向右移动4位后,发现C处再度失配,因为此时已经匹配了2个字符(AB),且上一个字符B对应的最大长度值为0,所以向右移动:2 - 0 =2 位。
- 5. 继续比较,发现D与C 失配,故向右移动的位数为:已匹配的字符数6减去上一位字符B对应的最大长度2,即向右移动6 - 2 = 4 位。
3.2.3 根据《最大长度表》求出next 数组
由上文,我们已经知道,字符串“ABCDABD”各个前缀后缀的最大公共元素长度分别为:
而且,根据这个表可以得出下述结论
- 失配时,模式串向右移动的位数为:已匹配字符数 - 失配字符的上一位字符所对应的最大长度值
上文利用这个表和结论进行匹配时,我们发现,当匹配到一个字符失配时,其实没必要考虑当前失配的字符,更何况我们每次失配时,都是看的失配字符的上一位字符对应的最大长度值。如此,便引出了next 数组。
给定字符串“ABCDABD”,可求得它的next 数组如下:
把next 数组跟之前求得的最大长度表对比后,不难发现,next 数组相当于“最大长度值” 整体向右移动一位,然后初始值赋为-1。意识到了这一点,你会惊呼原来next 数组的求解竟然如此简单!
换言之,对于给定的模式串:ABCDABD,它的最大长度表及next 数组分别如下:
根据最大长度表求出了next 数组后,从而有
失配时,模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值 |
而后,你会发现,无论是基于《最大长度表》的匹配,还是基于next 数组的匹配,两者得出来的向右移动的位数是一样的。
接下来,咱们来写代码求下next 数组。
基于之前的理解,可知计算next 数组的方法可以采用递推:
- 如果对于值k,已有p0 p1, ..., pk-1 = pj-k pj-k+1, ..., pj-1,相当于next[j] = k。
- 此意味着什么呢?究其本质,next[j] = k 代表 j 之前的模式串中,有长度为k 的相同前缀和后缀。有了这个next 数组,在KMP匹配中,当模式串后缀中j 处的字符失配时,模式串向右移动j - next[j] 位。
举个例子,如下图,根据模式串“ABCDABD”的next 数组可知失配位置的字符D对应的next 值为2,代表字符D前有长度为2的相同前缀和后缀(这个相同的前缀后缀即为“AB”),失配后,模式串需要向右移动j - next [j] = 6 - 2 =4位。
向右移动4位后,模式串中的字符C继续跟文本串匹配。
- 下面的问题是:已知next [j],如何求出next [j + 1]呢?
对于pattern的前j 个序列字符:
- 若pattern[k] == pattern[j],则next[j + 1 ] = next [j] + 1 = k + 1;
- 若pattern[k ] ≠ pattern[j],如果此时pattern[ next[k] ] == pattern[j ],则next[ j ] = next[k] + 1,否则重复此过程。 相当于在字符p[k+1]之前不存在前缀"p0 p1, …, pk-1 pk"跟后缀“pj-k pj-k+1, …, pj-1 pj"相等,那么是否可能存在另一个值t < k + 1,使得长度更小的前缀 “p0 p1, …, pt-1” 等于长度更小的后缀 “pj-t pj-t+1…pj-1” 呢?这个t 便是next[k],此相当于利用next 函数值进行P串后缀跟P串前缀的匹配。
一般的文章或教材可能就此一笔带过,但大部分的初学者可能还是不能很好的理解上述求解next 数组的原理,故接下来,我再举个例子说明下。
如下图所示,假定给定模式串ABCDABCE,且已知next [j] = k(相当于“p0 pk-1” = “pj-k pj-1” = AB,可以看出k为2),现要求next [j + 1]等于多少?因为pk = pj = C,所以next[j + 1] = next[j] + 1 = k + 1(可以看出next[j + 1] = 3)。代表字符E前的模式串中,有长度k+1 的相同前缀后缀。
但如果pk != pj 呢?说明“p0 pk-1 pk” ≠ “pj-k pj-1 pj”。换言之,当pk != pj后,字符E前有多大长度的相同前缀后缀呢?很明显,因为C不同于D,所以ABC 跟 ABD不相同,即字符E前的模式串没有长度为k+1的相同前缀后缀,也就不能再简单的令:next[j + 1] = next[j] + 1 。所以,咱们只能去寻找长度更短一点的相同前缀后缀。
咱们换个角度思考这个问题,类似KMP的匹配思路,当p0 p1, ..., pj 跟主串s0 s1, ..., si匹配时,如果模式串在j处失配,则模式串需要向右移动j - next[j]位,相当于j = next [j]。
现在前缀“p0 pk-1 pk” 去跟后缀 “pj-k pj-1 pj”匹配,发现在pk处匹配失败,那么前缀需要向右移动多少位呢?根据已经求得的前缀各个字符的next 值,可得前缀应该向右移动k - next[k]位,相当于k = next[k]。若移动之后,pk‘ = pj,则代表字符E前存在长度为next[k] + 1的相同前缀后缀,否则继续递归k‘ = next [k‘],直到next [k’] = 0。
举个例子如下:
模式串的后缀:AB
D
模式串的前缀:AB
C
前缀右移两位:
ABC
求next 数组的代码如下所示:
- void getNext(char* p,int next[])
- {
- int pLen = strlen(p);
- next[0] = -1;
- int k = -1;
- int j = 0;
- while (j < pLen - 1)
- {
-
- if (k == -1 || p[j] == p[k])
- {
- ++j;
- ++k;
- next[j] = k;
- }
- else
- {
- k = next[k];
- }
- }
- }
3.2.4 基于《next 数组》匹配
下面,我们来基于next 数组进行匹配。
还是给定
文本串“BBC ABCDAB ABCDABCDABDE”,和模式串“ABCDABD”,现在要拿模式串去跟文本串匹配,如下图所示:
在正式匹配之前,让我们来再次回顾下上文2.1节所述的KMP算法的匹配流程:
- “假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置
- 如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++,继续匹配下一个字符;
- 如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j],模式串P相对于文本串S向右移动了至少1位(换言之,当匹配失败时,模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值,即移动的实际位数为:j - next[j],且此值大于等于1)。”
- 1. 最开始匹配时
- P[0]跟S[0]匹配失败
- 所以执行“如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]”,所以j = -1,故转而执行“如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++”,得到i = 1,j = 0,即P[0]继续跟S[1]匹配。
- P[0]跟S[1]又失配,j再次等于-1,i、j继续自增,从而P[0]跟S[2]匹配。
- P[0]跟S[2]失配后,P[0]又跟S[3]匹配。
- P[0]跟S[3]再失配,直到P[0]跟S[4]匹配成功,开始执行此条指令的后半段:“如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++”。
- 2. P[1]跟S[5]匹配成功,P[2]跟S[6]也匹配成功, ...,直到当匹配到字符D时失配(即S[10] != P[6]),由于 j 从0开始计数,故数到失配的字符D时 j 为6,且字符D对应的next 值为2,所以向右移动的位数为:j - next[j] = 6 - 2 =4 位
- 3. 向右移动4位后,C再次失配,向右移动:j - next[j] = 2 - 0 = 2 位
- 4. 移动两位之后,A 跟空格不匹配,再次后移1 位
- 5. D处失配,向右移动 j - next[j] = 6 - 2 = 4 位
匹配过程一模一样。也从侧面佐证了,next 数组确实是只要将各个最大前缀后缀的公共元素的长度值右移一位,且把初值赋为-1 即可。
3.2.5 基于《最大长度表》与基于《next 数组》等价
其实,利用next 数组进行匹配失配时,模式串向右移动 j - next [ j ] 位,等价于已匹配字符数 - 失配字符的上一位字符所对应的最大长度值。为什么呢?
- j 从0开始计数,那么当数到失配字符时,j 的数值就是已匹配的字符数;
- 由于next 数组是由最大长度值表整体向右移动一位(且初值赋为-1)得到的,那么失配字符的上一位字符所对应的最大长度值,即为当前失配字符的next 值。
那为何本文不直接利用next 数组进行匹配呢?因为next 数组不好求,而一个字符串的前缀后缀的公共元素的最大长度值很容易求,例如若给定模式串“ababa”,要你求其next 数组,则乍一看,无从求起。而如果你求其前缀后缀公共元素的最大长度,则很容易得出是:0 0 1 2 3,如下表格所示:
然后这5个数字 全部整体右移一位,且初值赋为-1,即得到其next 数组:-1 0 0 1 2。
3.2.6 next 数组与有限状态自动机
next 负责把模式串向前移动,且当第j位不匹配的时候,用第next[j]位和主串匹配,就像打了张“表”。此外,next 也可以看作有限状态自动机的状态,在已经读了多少字符的情况下,失配后,前面读的若干个字符是有用的。
3.2.7 next 数组的优化
行文至此,咱们全面了解了暴力匹配的思路、KMP算法的原理、流程、流程之间的内在逻辑联系,以及next 数组的简单求解(《最大长度表》整体右移一位,然后初值赋为-1)和代码求解,最后基于《next 数组》的匹配,看似洋洋洒洒,清晰透彻,但以上忽略了一个小问题。
当同一个字符大量重复出现的时候,会发生什么现象呢?例如,当模式串和文本串如下所示时:
- 模式串:aaaaa
- 文本串:aaaabaaaabaaaab
KMP也将显得有心无力,跟暴力匹配一样了。
再比如,如果用之前的next 数组方法求模式串“abab”的next 数组,可得其next 数组为-1 0 0 1(0 0 1 2整体右移一位,初值赋为-1),当它跟下图中的文本串去匹配的时候,发现b跟c失配,于是模式串右移j - next[j] = 3 - 1 =2位。
右移2位后,b又跟c失配。事实上,因为在上一步的匹配中,已经得知p[3] = b,与s[3] = c失配,而右移两位之后,让p[ next[3] ] = p[1] = b 再跟s[3]匹配时,必然失配。问题出在哪呢?
问题出在不该出现p[j] = p[ next[j] ]。为什么呢?因为在p[j] != p[i] 的时候,下次匹配必然是p[ next [j]] 跟s[i]匹配,如果p[j] = p[ next[j] ],必然导致后一步匹配失败,所以不能允许p[j] = p[ next[j ]]。所以,咱们得修改下求next 数组的代码。
-
- void getNextval(char* p, int next[])
- {
- int pLen = strlen(p);
- next[0] = -1;
- int k = -1;
- int j = 0;
- while (j < pLen - 1)
- {
-
- if (k == -1 || p[j] == p[k])
- {
- ++j;
- ++k;
-
- if (p[j] != p[k])
- next[j] = k;
- else
-
- next[j] = next[k];
- }
- else
- {
- k = next[k];
- }
- }
- }
利用优化过后的next 数组求法,可知模式串“abab”的新next数组为:-1 0 -1 0(读者可以脑海里执行上述代码验证下,如不会计算,可看下文末的参考文献10)。继续拿之前的例子匹配。整个匹配过程如下:
1. S[3]与P[3]匹配失败。
2. S[3]保持不变,P的下一个匹配位置是P[next[3]],而next[3]=0,所以P[next[3]]=P[0]与S[3]匹配。
3. 由于上一步骤中P[0]与S[3]还是不匹配。此时i=3,j=nextval[0]=-1,由于满足条件j==-1,所以执行“++i, ++j”,即主串指针下移一个位置,P[0]与S[4]开始匹配。最后j==plen,跳出循环,输出结果i-plen=4(即字串第一次出现的位置),匹配成功,算法结束。
4. 扩展:BM算法
1977年,德克萨斯大学的Robert S. Boyer教授和J Strother Moore教授发明了一种新的字符串匹配算法:Boyer-Moore算法,该算法拥有在最坏情况下O(N)的时间复杂度,并且,在实践中,比KMP算法的实际效能高。
BM算法定义了两个规则:
- 坏字符规则:当文本串中的某个字符跟搜索词的某个字符不匹配时,我们称文本串中的这个失配字符为坏字符,此时搜索词需要向右移动,移动的位数 = 坏字符位置 - 坏字符在搜索词中的最右出现的位置。此外,如果"坏字符"不包含在搜索词之中,则最右出现位置为-1。
- 好后缀规则:当字符失配时,后移位数=好后缀的位置-好后缀在搜索词其余部分中最右出现位置,且如果好后缀在搜索词中没有再次出现,则为-1。
下面举例说明BM算法。例如,给定如下的字符串和搜索词,现要查找搜索词是否在字符串中存在,如果存在,返回搜索词在字符串中的位置。
1. 首先,"字符串"与"搜索词"头部对齐,从尾部开始比较。"S"与"E"不匹配。这时,"S"就被称为"坏字符"(bad character),即不匹配的字符,它出现在第6位。且"S"不包含在搜索词"EXAMPLE"之中(相当于最右出现位置是-1),这意味着可以把搜索词后移6-(-1)=7位,从而直接移到"S"的后一位。
2. 依然从尾部开始比较,发现"P"与"E"不匹配,所以"P"是"坏字符"。但是,"P"包含在搜索词"EXAMPLE"之中。因为“P”这个“坏字符”出现在搜索词的第6位(从0开始编号),且在搜索词中的最右出现位置为4,所以,将搜索词后移6-4=2位,两个"P"对齐。
3
. 依次比较,得到 “MPLE”匹配,称为"好后缀"(good suffix),即所有尾部匹配的字符串。注意,"MPLE"、"PLE"、"LE"、"E"都是好后缀。
4
. 发现“I”与“A”不匹配:“I”是坏字符。根据坏字符规则,此时搜索词应该后移2-(-1)=3位。问题是,有没有更优的移法?
5
. 更好的移动方法是:当字符失配时,后移位数=好后缀的位置-好后缀在搜索词其余部分中最右出现位置,且如果好后缀在搜索词中没有再次出现,则为-1。
所有的“好后缀”(MPLE、PLE、LE、E)之中,只有“E”在“EXAMPL”之中出现,所以后移6-0=6位。
可以看出,“坏字符规则”只能移3位,“好后缀规则”可以移6位。每次后移这两个规则之中的较大值。这两个规则的移动位数,只与搜索词有关,与原字符串无关。
6. 继续从尾部开始比较,“P”与“E”不匹配,因此“P”是“坏字符”。根据“坏字符规则”,后移 6 - 4 = 2位。因为是最后一位就失配,尚未获得好后缀。
由上可知,BM算法不仅效率高,而且构思巧妙,容易理解。完。
5. 参考文献
- 《算法导论》的第十二章:字符串匹配;
- 本文中模式串“ABCDABD”的例子来自于此文:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html;
- 本文最后一张有限状态自动机的手绘图来自于北京算法班周日班讲师曹博的PPT;
- 北京7月暑假班邹博半小时KMP视频:http://v.youku.com/v_show/id_XNzQzMjQ1OTYw.html;
- 北京7月暑假班邹博第二次课的PPT:http://yun.baidu.com/s/1mgFmw7u;
- 理解KMP 的9张PPT:http://weibo.com/1580904460/BeCCYrKz3#_rnd1405957424876;
- 详解KMP算法(多图):http://www.cnblogs.com/yjiyjige/p/3263858.html;
- 最后一部分的BM算法参考自此文:http://www.ruanyifeng.com/blog/2013/05/boyer-moore_string_search_algorithm.html;
- http://youlvconglin.blog.163.com/blog/static/5232042010530101020857;
- 《数据结构 第二版》,严蔚敏 & 吴伟民编著;
- 六之续、由KMP算法谈到BM算法:http://blog.csdn.net/v_JULY_v/article/details/6545192。
6. 后记
对之前混乱的文章给广大读者带来的困扰表示致歉,对重新写就后的本文即将给读者带来的清晰表示欣慰。有任何问题,欢迎随时批评指正,thanks。
July、二零一四年七月二十九日。
原文链接:http://blog.csdn.net/v_july_v/article/details/7041827