KMP算法的核心就是 部分匹配表:
假设字符串str1为:“ABCDABC”
其部分匹配表就是str1子串的前缀和后缀的最长公共元素的长度,
字符串“hello”的前缀:h, he, hel,hell
字符串“hello”的后缀:ello, llo, lo, o
因此字符串str1为:“ABCDABC”的部分匹配表就是
A :A的前缀无,后缀无,公共元素长度为0;
AB:前缀A ;后缀B ,公共元素长度为0;
ABC:前缀A,AB ;后缀BC,C ,公共元素长度为0;
ABCD:前缀A,AB,ABC;后缀BCD,CD,D, 公共元素长度为0;
ABCDA:前缀A,AB,ABC,ABCD; 后缀BCDA,CDA,DA,A,公共元素长度为1;
ABCDAB:前缀A,AB,ABC,ABCD,ABCDA;后缀BCDAB,CDAB,DAB,AB,B,公共元素长度为2;
ABCDABC:前缀A,AB,ABC,ABCD,ABCDA,ABCDAB,后缀BCDABC,CDABC,DABC,ABC,BC,C,公共元素长度为3;
部分匹配表为:
A | B | C | D | A | B | C |
---|---|---|---|---|---|---|
0 | 0 | 0 | 0 | 1 | 2 | 3 |
通过部分匹配表,当字符串出现不匹配的情况时就就可以确定指针后移的位置。
public class KMP {
public static void main(String[] args) {
String s1 ="ABCDABD";
String s2 ="ABCDABCDAB ABCDABD";
System.out.println(kmp(s1,s2,getNext(s1)));
}
public static int kmp(String s1,String s2,int[] next){
for(int i =0, j=0;i<s2.length();i++){
while (j>0 && s2.charAt(i) != s1.charAt(j)){
j= next[j-1];
}
if(s2.charAt(i)==s1.charAt(j)){
j++;
}
if(j==s1.length()){
return i-j+1;
}
}
return -1;
}
public static int[] getNext(String dest){
int[] next = new int[dest.length()];
next[0] = 0;
for(int i=1,j=0;i<dest.length();i++){
while (j>0 && dest.charAt(i) != dest.charAt(j)){
j = next[j-1];
}
if(dest.charAt(i)==dest.charAt(j)){
j++;
}
next[i] = j ;
}
return next;
}
}