字符串搜索之KMP算法(伪代码)

  之前的Rabin-Karp算法虽然在一定程度上达到了优化,但是最坏情况下也是O(nm)的复杂度。

  接下来说说KMP算法,复杂度是线性的O(n+m)

 前缀表
• 我们可以预先计算大小为m的前缀表来存储p[q]的
   值 (0 <=q < m)

    P      p  a  p  p  a  r

    q  0  1  2  3  4  5  6

p[q]  0  0  0  1  1  2  0


Knuth-Morris-Pratt  算法
KMP-Search(T,P)
01 pi <- Compute-Prefix-Table(P) //预处理前缀表P
02 q <- 0                // number of characters matched
03 for i <- 0 to n-1 // scan the text from left to right
04   while q > 0 and P[q] <> T[i] do
05            q <- p[q]
06   if P[q] = T[i] then q <- q + 1
07   if q = m then return i – m + 1
08 return –1
 Compute-Prefix-Table 是P 上执行KMP 算法的本质.


KMP 的分析
• 最坏运行时间: O(n+m)
– 主算法: O(n)
– Compute-Prefix-Table: O(m)
• 空间: O(m)

你可能感兴趣的:(搜索,字符串处理)