BM算法


1,BM算法是Boyer-Moore算法的简称,由Boyer 和Moore提出. 

2,BM算法也是一种快速串匹配算法,BM算法与KMP算法的主要区别是匹配操作的方向不同。虽然BM算法仅把匹配操作的字符比较顺序改为从右向左,但匹配发生失败时,模式T右移的计算方法却发生了较大的变化. 

3,滑动距离函数: 
为方便讨论,BM算法的关键是,对给定的模式T="t0t1…tm"定义一个从字符到正整数的映射: 
dist :c->{1,2,…,m+1} 
函数dist称为滑动距离函数,它给出了正文中可能出现的任意字符在模式中的位置。函数dist定义如下: 
dist(c) = m-j  j为c在模式中的下标,以后面的为准 
dist(c) = m+1  若c不在模式中或c = tm 
例如,T="pattern",则dist(p)= 6 – 0 = 6, dist(a)= 6 – 1 =5, dist(t)= 6 – 3 =3,dist(e)= 2, dist(r)= 1, dist(n)= 6 + 1 = 7。 

4,BM算法的基本思想是:假设将主串中自位置i起往左的一个子串与模式进行从右到左的匹配过程中,若发现不匹配,则下次应从主串的i + dist(si)位置开始重新进行新一轮的匹配,其效果相当于把模式和主串向右滑过一段距离dist(si),即跳过dist(si)个字符而无需进行比较。 
一个具体的例子,如下图所示: 

BM算法 

5,实例代码: 

Cpp代码  收藏代码

  1. #include <iostream>  

  2. #include <cstring>  

  3. using namespace std;  

  4.   

  5. int Dist(char *t,char ch)  

  6. {  

  7.     int len = strlen(t);  

  8.     int i = len - 1;  

  9.     if(ch == t[i])  

  10.       return len;  

  11.     i--;  

  12.     while(i >= 0)  

  13.     {  

  14.       if(ch == t[i])  

  15.          return len - 1 - i;  

  16.       else  

  17.          i--;  

  18.     }  

  19.     return len;  

  20. }  

  21.   

  22. int BM(char *s,char *t)  

  23. {  

  24.     int n = strlen(s);  

  25.     int m = strlen(t);  

  26.     int i = m-1;  

  27.     int j = m-1;  

  28.     while(j>=0 && i<n)  

  29.     {  

  30.     if(s[i] == t[j])  

  31.     {  

  32.         i--;  

  33.         j--;  

  34.     }  

  35.     else  

  36.     {  

  37.         i += Dist(t,s[i]);  

  38.         j = m-1;  

  39.     }  

  40.     }  

  41.     if(j < 0)  

  42.     {  

  43.         return i+1;  

  44.     }  

  45.     return -1;  

  46. }  

  47.   

  48. int main()  

  49. {  

  50.     char p1[]="abcdfedcbf";  

  51.     char p2[]="cdfe";  

  52.     cout<<BM(p1,p2);  

  53.     return 0;  

  54. }  


你可能感兴趣的:(BM算法)