字符串匹配问题——KMP算法实现

字符串匹配问题

    • KMP算法实现字符串匹配

字符串匹配问题,就是给定一个字符串str1,要找到str2中第一个与str1匹配的索引位置。这种问题使用暴力求解很容易实现,但是每次遇到不匹配的值时,只后移1个位置进行下次匹配,这样就会造成许多重复的操作。使用KMP算法可以求出每次遇到不匹配值时,后移的位数,这样就可以加快匹配的速度。

KMP算法实现字符串匹配

KMP算法的核心就是 部分匹配表
假设字符串str1为:“ABCDABC”
其部分匹配表就是str1子串的前缀和后缀的最长公共元素的长度,
字符串“hello”的前缀:h, he, hel,hell
字符串“hello”的后缀:ello, llo, lo, o
因此字符串str1为:“ABCDABC”的部分匹配表就是
A :A的前缀无,后缀无,公共元素长度为0;
AB:前缀A ;后缀B ,公共元素长度为0;
ABC:前缀A,AB ;后缀BC,C ,公共元素长度为0;
ABCD:前缀A,AB,ABC;后缀BCD,CD,D, 公共元素长度为0;
ABCDA:前缀A,AB,ABC,ABCD; 后缀BCDA,CDA,DA,A,公共元素长度为1;
ABCDAB:前缀A,AB,ABC,ABCD,ABCDA;后缀BCDAB,CDAB,DAB,AB,B,公共元素长度为2;
ABCDABC:前缀A,AB,ABC,ABCD,ABCDA,ABCDAB,后缀BCDABC,CDABC,DABC,ABC,BC,C,公共元素长度为3;
部分匹配表为:

A B C D A B C
0 0 0 0 1 2 3

通过部分匹配表,当字符串出现不匹配的情况时就就可以确定指针后移的位置。

public class KMP {
    public static void main(String[] args) {
        String s1 ="ABCDABD";
        String s2 ="ABCDABCDAB ABCDABD";
        System.out.println(kmp(s1,s2,getNext(s1)));
    }
    public static int kmp(String s1,String s2,int[] next){
        for(int i =0, j=0;i<s2.length();i++){
            while (j>0 && s2.charAt(i) != s1.charAt(j)){
                j= next[j-1];
            }

            if(s2.charAt(i)==s1.charAt(j)){
                j++;
            }
            if(j==s1.length()){
                return i-j+1;
            }
        }
        return -1;

    }

    public static int[] getNext(String dest){
        int[] next = new int[dest.length()];
        next[0] = 0;

        for(int i=1,j=0;i<dest.length();i++){

            while (j>0 && dest.charAt(i) != dest.charAt(j)){
                j = next[j-1];
            }

            if(dest.charAt(i)==dest.charAt(j)){
                j++;
            }
            next[i] = j ;
        }
        return next;
    }
}

你可能感兴趣的:(数据结构学习)