BM匹配算法

总结:

KMP算法并不是效率最高的算法,实际采用并不多。各种文本编辑器的”查找”功能(Ctrl+F),大多采用Boyer-Moore算法。

假定字符串为”HERE IS A SIMPLE EXAMPLE”,搜索词为”EXAMPLE”

E X A M P L E
0 1 2 3 4 5 6

坏字符规则

移动位置 = 坏字符位置 - 搜索词中的上一次出现位置
7 = EXAMPLE最后一个字符E(6) - EXAMPLE中未找到S(-1)

好字符规则

移动位置 = 好后缀字符位置(好后缀:匹配字符串中最后一个字符)- 搜索词中的上一次出现位置
5 = MPLE中E位置(6)-EXAMPL中的E(1)


文章详解(http://www.ruanyifeng.com/blog/2013/05/boyer-moore_string_search_algorithm.html)

主要理解:坏字符规则、好字符规则 移动位置

字符串:1 2 3 4 1 2 3 3 4 5 1 2 3
搜索词:7 5 3 4 5
下标: 0 1 2 3 4

1 2 3 4 1 2 3 3 4 5 1 2 3 
7 5 3 4 5

坏字符规则:

1和5不匹配,1和搜索词未匹配.
移动位置 = 坏字符位置 - 搜索词中的上一次出现位置(1上次出现位置,如果不存在则为-1)
5 = 4 - (-1)

1 2 3 4 1 2 3 3 4 5 1 2 3
          7 5 3 4 5

5、5匹配
4、4匹配
3、3匹配
3、5不匹配

如果按 坏字符规则:

处理移动位置:2 = 1 - (-1)

1 2 3 4 1 2 3 3 4 5 1 2 3
              7 5 3 4 5

但这里可以用 好字符规则:

移动位置 = 好后缀字符位置(好后缀:匹配字符串中最后一个字符)- 搜索词中的上一次出现位置(5上次出现位置,如果不存在则为-1)
处理移动位置:3 = 4 - 1

1 2 3 4 1 2 3 3 4 5 1 2 3
                7 5 3 4 5

你可能感兴趣的:(算法)