u013263923

BF 算法详解

1977年，Robert S.Boyer和J Strother Moore提出了另一种在O(n)时间复杂度内，完成字符串匹配的算法，其在绝大多数场合的性能表现，比KMP算法还要出色，下面我们就来详细了解一下这一出色的单模式匹配算法，在此之前推荐读者读一下我的另一篇文章《KMP算法详解》，对于透彻理解BM算法大有裨益。

在讲解Boyer-Moore算法之前，我们还是要提一提KMP算法的老例子，当模式串与目标串匹配至如下位置时：

1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26
b	a	b	c	b	a	b	c	a	b	c	a	a	b	c	a	b	c	a	b	c	a	c	a	b	c
					a	b	c	a	b	c	a	c	a	b

我们发现target[13]!=pattern[7]，此时根据KMP算法的next值，我们将target[13]与pattern[5]对齐，再依次执行匹配。这里target[13]='a'。如果target[13]='d'，因为'd'不是模式串pattern中的字符，所以无论将target[13]与pattern中任何一个字符对齐都会匹配失败，所以当我们在匹配过程中发现target[i]是不属于模式串的字符，则我们可以直接将target[i+1]，与pattern[1]对齐，再向后执行匹配。这样就获得了更大的跳转幅度，同时也能保证匹配的正确性。这便是BM算法相较于KMP算法的一个重要改进。

BM算法之所以能够在单模式匹配中有更加出色的表现，主要是其使用了两个跳转表，一个是坏字符表（论文中称为delta1），一个是好后缀表（论文中称为delta2），下面我们以BM算法对目标串的一次匹配操作，来讲解这两个表的具体跳转策略，这里模式串为"AT-THAT"，目标串为"WHICH-FINALLY-HALTS.--AT-THAT-POINT"。

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35
	W	H	I	C	H	-	F	I	N	A	L	L	Y	-	H	A	L	T	S	.	-	-	A	T	-	T	H	A	T	-	P	O	I	N	T
1	A	T	-	T	H	A	T
2								A	T	-	T	H	A	T
3												A	T	-	T	H	A	T
4																		A	T	-	T	H	A	T
5																							A	T	-	T	H	A	T

BM算法与KMP算法的最大的不同之处在于，当目标串与模式串在某个位置对齐之后，KMP算法是从对齐位置向后依次执行匹配（不一定是模式串的第一个元素）。而BM算法是从模式串的末尾位置（一定是模式串的最后一个元素）向前与目标串依次执行匹配。上面的例子，在4次模式串移动之后，就发现了匹配模式。

第一次，pattern[1]与target[1]对齐，从pattern[7]向前依次与target执行比较，但是第1次比较就发现，target[7]='F'，而'F'不是pattern串中的字符，所以target中包含target[7]的任何子串都不可能与pattern匹配，此时我们可以直接将pattern串滑动到target[7]之后，让pattern[1]与target[8]对齐，然后再由target[14]依次向前执行比较。

第二次，target[14]='-'，虽然'-'是模式串中的字符，但是如果要target串中包含target[14]的字串与pattern串匹配，则至少target[14]需与pattern中最后一个'-'对齐。而pattern中只有一个'-'pattern[3]，所以将target[14]，与pattern[3]对齐，然后再由target[18]向前依次执行比较。

第三次，虽然target[18]=pattern[7]='T'，但是target[17]='L'，'L'不是pattern中的字符，所以包含target[17]的任何字串都不可能与pattern匹配，所以pattern[1]直接与target[18]对齐再执行匹配。

第四次，target[23...24]=pattern[6...7]，target[22]!=pattern[5]，我们注意到，pattern[6...7]=pattern[1...2]所以pattern[1...2]也是模式串的一个自包含后缀（下文详述），所以我们可以令pattern[1]与target[23]对齐再向后执行匹配，此时我们就发现了满足条件的匹配串target[23...29]。

该示例使用到了BM算法中的所有跳转优化，大幅加速了模式串的向后滑动过程，实现了模式的快速匹配，其中第1，2，3次滑动使用的是算法中的坏字符移动规则，第4次滑动使用的是好后缀移动规则，那么什么是所谓的坏字符和好后缀规则呢。

所谓的坏字符移动规则，就是一个表，其以输入字符集的所有字符作为索引，每个输入字符c对应着一个值，表示如果目标串的当前位置字符c与模式串匹配失败，那么目标串当前位置应该可以向前滑动的步数。假设字符集为"ABCDEFGHIJKLMNOPQRSTUVWXYZ-"，那么他对应模式串"AT-THAT"的坏字符表为。

	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O	P	Q	R	S	T	U	V	W	X	Y	Z	-
delta1	1	7	7	7	7	7	7	2	7	7	7	7	7	7	7	7	7	7	7	0	7	7	7	7	7	7	4

坏字符表的定义为，对于输入字符集合中的字符c，如果c不在模式串中，则delta1[c]= patlen（模式串的长度），如果c在模式串中，则delta1[c]=j-i，其中，j是模式串最末元素的索引值，i是字符c在模式串中最右出现的位置（这里与Boyer-Morre两人的论文略有差别，主要是因为BM的论文中，字符串的索引从1开始，其最末元素的索引值，就等于模式串的长度，而在实际计算模式串中含有字符的坏字符滑动值时，使用到的是模式串最末元素的索引值，这个值与模式串的长度不一定相等）。下面就是用于生成坏字符表的代码，为了简单起见，这里没有使用字典结构，而是假设输入的字符只能是A-Z，然后将这26个字符映射到一个数组中。

[cpp]  view plain copy 
      
     
 inline void BuildBadC(const char* pattern, size_t pattern_length, unsigned int* badc, size_t alphabet_size)  
 {  
     unsigned int i;  
   
     for(i = 0; i < alphabet_size; ++i)  
     {  
         badc[i] = pattern_length;  
     }  
   
     for(i = 0; i < pattern_length; ++i)  
     {  
         badc[pattern[i] - 'A'] = pattern_length - 1 - i;  
     }  
 }  

所谓的好后缀移动规则，是BM算法的核心部分，下面详细说明。在KMP算法中，我们知道了所谓的前缀自包含问题，也就是模式串的前缀也可能是模式串的非前缀子串。在BM算法中，有一个与其非常相似的概念，叫后缀自包含。对于pattern[1...j]，存在长度为k的子串，满足pattern[m+1...m+k]=pattern[j-k+1...j]，其中k<j，0<m<j-k。以字符串"BCDBCDABCDABCD"为例，pattern[7...10]就是一个包含后缀，因为pattern[7...10]=pattern[11...14]。

我们定义数组pre[]，与pattern中的元素一一对应，对于pattern中的元素，pattern[i]，pre[i]是使得pattern[k+1...j-i]=pattern[i+1...j]，且pattern[k]!=pattern[i]的k的最大值，如果不存在这样的k，pre[i]=patlen。对于对于模式串的后缀k pattern[j-k+1...j]，满足条件的包含后缀可能不止一个，这里我们需要关注所有满足条件的pattern[m+1...m+k]中，满足pattern[m] != pattern[j-k]的m的最大值。对于上例的模式串，其后缀3 pattern[12...14]，其包含后缀有pattern[8...10]，pattern[4...6]，pattern[1...3]，在这3个包含后缀中，pattern[7]=pattern[11]，所以pattern[8...10]不是我们想要的包含后缀。pattern[0] != pattern[11]（这里面我们假设pattern[0]不等于任何可输入字符），pattern[3]!=pattern[11]，在这两个备选子串中，pattern[4...6]的m值(3)大于pattern[1...3]的m值(0)，所以pattern[4...6]就是我们需要的pre值。对于为什么要满足pattern[m]!=pattern[j-k]，请参考我的《KMP算法详解》一文中对于next[j]与f(j)不同之处的解释，以及本文后面算法正确性方面的说明。

现在我们发现了pattern[12...14]在模式串中的包含后缀pattern[4...6]，此时如果我们发现目标串target[n]与模式串pattern[11]比较失败，我们就直接可以将pattern[3]与target[n]对齐，然后再从target[n+11]处向前依次与模式串进行匹配。目标串当前位置的跳转距离goods[i]=j-pre[i]。

这里我们需要解释一下如此大幅跳转的正确性。还是以上述模式串为例，当target[n]与pattern[11]匹配失败时，我们需要找到一个适当的位置，令target[n+1...n+3]与pattern[k+1...k+3]相同，才有可能找到匹配结果，这里target[n+1...n+3]=pattern[12...14]。根据pre[i]的定义，只有当k=3时，才能保证pattern[12...14] = pattern[4...6]，对于任何k>3都有pattern[12...14] != pattern[k+1...k+3]，因为如果存在k>3使得pattern[12...14] = pattern[k+1...k+3]，那么pre[11]必然大于3。所以这一对齐方式不会漏过中间可能的匹配。

这里读者可能会有疑问，你说的实际是错的，对于k=7，有target[n+1...n+3]=pattern[8...10]，为什么不让target[n]与pattern[7]对齐，然后从target[n+7]位置开始依次向前比较呢？这个问题和KMP算法中next[j]和f(j)的不同之处一样。虽然有pattern[8...10]=pattern[12...14]，但是pattern[7]=pattern[11]。因为target[n] != target[11]，所以target[n]!=pattern[7]所以将target[n]与pattern[7]对齐所执行匹配尝试必然失败，所以target[n]可以直接跳过pattern[7]直接与pattern[3]对齐。

另一方面，如果target[n]与pattern[k]对齐，但是pattern[k+1...j]在模式串中不存在包含后缀，我们该如何决定模式串向后的滑动距离呢。此时target[n+1...n+j-k] = pattern[k+1...j]，因为pattern[k+1...j]不存在包含后缀，所以对于任何m(0<=m<k)，pattern[m+1...m+j-k]!=pattern[k+1...j]（m<k+1），所以将target[n]与pattern[m]对齐，相当于执行pattern[k+1...j]与pattern[m+1...m+j-k]的匹配，结果必然失败。

此时可以考虑pattern[1]与target[n+1]对齐。pattern[1]与target[n+1]对齐后，pattern[1...j-k]是模式的前缀j-k，target[n+1...n+j-k]相当于pattern[k+1...j]，因为pattern[k+1...j]不存在包含子串，所以此次匹配也会失败。继续移动pattern[1]，pattern[1]与target[n+2]对齐，此时target[n+2...n+j-k]相当于pattern[1...j-k-1]，与pattern[k+2...j]比较，此时两者是否相等依赖于我们之前计算pre表的结果，能够使这个匹配成立的是使pattern[1...m]=pattern[j-m+1...j]的m的最大值，将pattern[1]与target[n+j-k-m+1]对齐，如果这样的m不存在，则pattern[1]可以直接与target[n+j-k+1]对齐，再执行匹配。如下例，当在target[4]处发生匹配失败，根据之前的介绍，pattern[1]与2，3，4，5，6对齐也都会失败，这里j=9,k=4,m=3,n=4。

target

根据上面的介绍，我们就可以得出根据pre[i]计算goods[i]的方法，在计算pre值之前，我们先将所有pre[i]初始化为patlen，对于pattern[i]，如果不存在m，使得pattern[m+1...m+j-i]=pattern[i+1...j]（m<i），且pattern[m]!=pattern[i]，则我们不去修改pre[i]的值。计算完所有元素的pre值之后，对于pre[i]!=patlen的情况，goods[i] = j - pre[i]，否则，对于pattern[i]（j-i<c）的情况goods[i] = patlen+j-i，对于pattern[i](j-i>=c)，goods[i]=patlen+j-i-c，其中c是满足pattern[1...c]=pattern[j-c+1...j](c>0)的c的最大值，如果不存在这样的c，c=0。模式中最末元素的goods值固定为1。

	1	2	3	4	5	6	7	8	9	10	11	12	13	14
	B	C	D	B	C	D	A	B	C	D	A	B	C	D
pre[i]	14	14	14	14	14	14	14	14	14	14	3	14	14
goods[i]	24	23	22	21	20	19	18	17	16	15	11	13	12	1

很遗憾，在Boyer-Moore两人的论文中，并没有给出像KMP算法中计算next表那么犀利的算法，所以这里用穷举法给出了一个时间复杂度为O(n^2)的笨法。如果读者有更漂亮的求好后缀表的算法，请指教。

[cpp]  view plain copy 
      
     
 inline void BuildGoodS(const char* pattern, size_t pattern_length, unsigned int* goods)  
 {  
     unsigned int i, j, c;  
   
     for(i = 0; i < pattern_length - 1; ++i)  
     {  
         goods[i] = pattern_length;  
     }  
   
     //初始化pattern最末元素的好后缀值  
     goods[pattern_length - 1] = 1;  
   
     //此循环找出pattern中各元素的pre值，这里goods数组先当作pre数组使用  
     for(i = pattern_length -1, c = 0; i != 0; --i)  
     {  
         for(j = 0; j < i; ++j)  
         {  
             if(memcmp(pattern + i, pattern + j, (pattern_length - i) * sizeof(char)) == 0)  
             {  
                 if(j == 0)  
                 {  
                     c = pattern_length - i;  
                 }  
                 else  
                 {  
                     if(pattern[i - 1] != pattern[j - 1])  
                     {  
                         goods[i - 1] = j - 1;  
                     }  
                 }  
             }  
         }  
     }  
   
     //根据pattern中个元素的pre值，计算goods值  
     for(i = 0; i < pattern_length - 1; ++i)  
     {  
         if(goods[i] != pattern_length)  
         {  
             goods[i] = pattern_length - 1 - goods[i];  
         }  
         else  
         {  
             goods[i] = pattern_length - 1 - i + goods[i];  
   
             if(c != 0 && pattern_length - 1 - i >= c)  
             {  
                 goods[i] -= c;  
             }  
         }  
     }  
 }  

现在BM算法的两个基本工具坏字符，好后缀都已具备，我们如何在目标串target[1...n]中飞快的找到我们想要的模式pattern[1..j]呢。

首先，我们将pattern[1]与target[1]对齐，然后从target[j]向前依次执行匹配操作。如果在pattern[i]位置发现匹配失败，则在好前缀表里用i查找滑动距离goods[i]，在坏字符表中用target[i]做索引，查找滑动距离badc[target[i]]，假设前者返回的值为p，后者返回的值为q，这时我们取其中的较大者（假设为p），然后将pattern[j]与target[i+p]对齐，然后依次向前匹配，直到发现匹配，或者遍历整个target串没有找到目标模式为止。下面是BM算法的实现代码，该算法与之前KMP算法一样，都进行了扩展，可以找到目标串中的所有匹配模式，相比之下，BM扩展为找到目标序列中的所有匹配模式串要比KMP简单，不需要引入任何新的东西，只需要在发现匹配模式之后，仍然按照goods[0]移动目标串游标即可。

[cpp]  view plain copy 
      
     
 unsigned int BM(const char* text, size_t text_length, const char* pattern, size_t pattern_length, unsigned int* matches)  
 {  
     unsigned int i, j, m;  
   
     unsigned int badc[ALPHABET_SIZE];  
     unsigned int goods[pattern_length];  
   
     i = j = pattern_length - 1;  
     m = 0;  
       
     //构建好后缀和坏字符表  
     BuildBadC(pattern, pattern_length, badc, ALPHABET_SIZE);  
     BuildGoodS(pattern, pattern_length, goods);  
   
     while(j < text_length)  
     {  
         //发现目标传与模式传从后向前第1个不匹配的位置  
         while((i != 0) && (pattern[i] == text[j]))  
         {  
             --i;  
             --j;  
         }  
   
         //找到一个匹配的情况  
         if(i == 0 && pattern[i] == text[j])  
         {  
             matches[m++] = j;  
             j += goods[0];  
         }  
         else  
         {  
             //坏字符表用字典构建比较合适  
             j += goods[i] > badc[text[j]-'A'] ? goods[i] : badc[text[j]-'A'];  
         }  
   
         i = pattern_length - 1;  
     }  
   
     return m;  
 }  

后记：

对于进阶的单模式匹配算法而言，子串（前缀/后缀）的自包含，是至关重要的概念，是加速模式匹配效率的金钥匙，而将其发扬光大的无疑是KMP算法，BM算法使用后缀自包含，从后向前匹配模式串的灵感，也源于此，只有透彻理解KMP算法，才可能透彻理解BM算法。
坏字符表，可以用于加速任何的单模式匹配算法，而不仅限于BM算法，对于KMP算法，坏字符表同样可以起到大幅增加匹配速度的效果。对于大字符集的文字，我们需要改变坏字符表的使用思路，用字典来保存模式串中的字符的跳转步数，对于在字典中没有查到的字符，说明其不在模式串中，目标串当前字符直接滑动patlen个字符。

不科学上网使用Hugging Face的Transformers库 109702008 人工智能 #深度学习 #python 人工智能 AIGC
参考ProgramSynthesiswithCodeGen—ROCmBlogs(amd.com)HF-Mirror-Huggingface镜像站https://huggingface.co/docs/transformers/v4.40.1/zh/installation#%E7%A6%BB%E7%BA%BF%E6%A8%A1%E5%BC%8F准备aptshowrocm-libs-apipinst
【Python】数据结构,链表,算法详解 AIAdvocate python 数据结构链表排序算法广度优先深度优先
今日内容大纲介绍自定义代码-模拟链表删除节点查找节点算法入门-排序类的冒泡排序选择排序插入排序快速排序算法入门-查找类的二分查找-递归版二分查找-非递归版分线性结构-树介绍基本概述特点和分类自定义代码-模拟二叉树1.自定义代码-模拟链表完整版"""案例:自定义代码,模拟链表.背景: 顺序表在存储数据的时候,需要使用到连续的空间,如果空间不够,就会导致扩容失败,针对于这种情况,我们可以通过链表实现
matlab上下标如何输入,在Matlab中怎样输入特殊符号或者上标、下标李一舟DESIGN matlab上下标如何输入
Matlab的text/title/xlabel/ylabel对象支持简单的TeX排版语法，如希腊字母，上下标等例如text(0.5,0.5,'\alpha^\beta_2');Matlab图形中允许用TEX文件格式来显示字符。使用\bf，\it，\rm表示黑体，斜体，正体字符，特别注意大括号{}的用法。实例：在存在的图形上写一段有黑体、有斜体、有整体的句子。1、画图x=0:0.01:8;y=si
redis,codis,云redis shuff1e
redis的分布式解决方式--codis（转）https://www.cnblogs.com/softidea/p/5365640.htmlhttps://help.aliyun.com/document_detail/57797.html?spm=5176.173352.925244.2.bF70Gb
Paxos 算法详解（一）林木森^~^ 数据结构和算法算法分布式 java
前言提到分布式算法，就不得不提Paxos算法，在过去几十年里，它基本上是分布式共识的代名词，因为当前最常用的一批共识算法都是基于它改进的。比如，FastPaxos算法、CheapPaxos算法、Raft算法、ZAB协议等等。兰伯特提出的Paxos算法包含2个部分：一个是BasicPaxos算法，描述的是多节点之间如何就某个值（提案Value）达成共识；另一个是Multi-Paxos思想，描述的是执
ifconfig eth0网卡配置 lanhuazui10 linux命令
在嵌入式开发中，在设备运行的时候出现网络挂载问题时候，经常需要临时修改设备的ip地址，子网掩码，MAC地址，网关等，可以使用ifconfigeth0修改网卡的配置信息。ifconfig显示网络设备信息[root@localhost~]#ifconfigeth0Linkencap:EthernetHWaddr00:50:56:BF:26:20inetaddr:192.168.120.204Bcast
关于 slave_relay_log_info 表的一些测试轻松的鱼
说明整个测试是为了探索《一次诡异的复制报错》https://www.jianshu.com/p/753fb3751dfb中的疑问，以及以前没有细想的slave_relay_log_info表工作的细节。可能不易读，可以直接看《slave_relay_log_info表认知的一些展开》这篇文章：https://www.jianshu.com/p/6506bf3c883e在MySQL5.6.21上测试
机器学习案例-决策树实现鸢尾花分类 Ausgelebt 机器学习相关 python 分类
机器学习案例-决策树实现鸢尾花分类目录机器学习案例-决策树实现鸢尾花分类1.选题目的和意义2.主要研究内容2.1决策树算法分类（区别于树的结构和构造算法）2.2决策树算法详解2.3决策树的应用3.算法设计3.1数据分析3.1.1Iris数据集基本介绍3.1.2样本标签值分布3.1.3样本特征值分布3.1.4相关性热力图3.2建立决策树3.3模型调优3.3.1决策树深度（预剪枝）3.3.2选取部分特
关于白鳝存储过程技术话题 Shark曾_小凡仙国产 oracle java
http://mp.weixin.qq.com/s?__biz=MzA5MzQxNjk1NQ==&mid=2647853188&idx=1&sn=24be22393486f86b00963a6ad6c314ff&chksm=88799410bf0e1d0640ccca80d66afb4c40a7265a643153a5a37e0437d0cf303abd64939491af&scene=21#we
python a星算法_a*算法（Python）的实现,A weixin_39911567 python a星算法
前言关于A*算法的实现是很早之前的一次开发中的成果，并做了一些改进。当然，在这里就不记录改进部分了，因为其中还有一些争议。这里仅是对A*算法的理解和使用Python实现。参考链接之所以放在前面，是因为这些链接的参考价值特别高，如果希望获得更多的了解，可以通过以下链接进行学习。英文网站redblobgames(红色斑点游戏)中文网站csdn：A星算法详解(个人认为最详细,最通俗易懂的一个版本)|模块
最短路径算法——A*算法有一点点想CoCo你算法
A*算法是静态路网中求解最短路径最有效的直接搜索算法，也是解决许多搜索问题的有效算法，广泛应用于机器人路径搜索、游戏动画路径搜索等。它是图搜索算法的一种。A*算法是一种启发式的搜索算法，它是基于深度优先算法(DepthFirstSearch,DFS)和广度优先算法(BreadthFirstSearch,BFS)的一种融合算法，按照一定原则确定如何选取下一个结点。参考：A*寻路算法详解#A星#启发式
基于时序差分的无模型强化学习：Q-learning 算法详解晓shuo 算法强化学习
目录一、无模型强化学习中的时序差分方法与Q-learning1.1时序差分法1.2Q-learning算法状态-动作值函数（Q函数）Q-learning的更新公式Q-learning算法流程Q-learning的特点1.3总结一、无模型强化学习中的时序差分方法与Q-learning 动态规划算法依赖于已知的马尔可夫决策过程（MDP），在环境的状态转移概率和奖励函数完全明确的情况下，智能体无需与环
数据结构与算法Day25----字符串匹配（一）：借助哈希算法实现墨殇染泪
一、主串和模式串：假设在字符串A中查找字符串B，那字符串A就是主串，字符串B就是模式串。把主串的长度记作，模式串的长度记作。因为是在主串中查找模式串，所以。二、暴力匹配算法/朴素匹配算法/BF(BruteForce)算法：1、算法思想：在主串中，检查起始位置分别是0、1、2···且长度为的个子串，看有没有跟模式串匹配的。2、图示：3、时间复杂度：在极端情况下，每次都比对个字符，要比对次
【老生谈算法】matlab实现文字识别算法——文字识别算法阿里matlab建模师 matlab算法原理详解 matlab 算法计算机视觉
基于matlab的文字识别算法1、文档下载：本算法已经整理成文档如下，有需要的朋友可以点击进行下载说明文档（点击下载）本算法文档【老生谈算法】matlab实现文字识别算法.doc更多matlab算法原理及源码详解可点击下方文字直达：500例精选matlab算法原理及源码详解——老生谈算法2、算法详解：本课程设计主要运用ＭATLＡB的仿真平台设计进行文字识别算法的设计与仿真。也就是用于实现文字识别算
Java实现的加密与解密算法详解数据冰山
本文还有配套的精品资源，点击获取简介：加密与解密算法是信息技术中维护数据安全的核心技术，确保数据的隐私性和完整性。本文详细介绍了包括RSA、AES、3DES、Blowfish、RC4、IDEA、DSA和Diffie-Hellman等在内的多种加密和解密算法，并探讨了它们在Java中的实现。这些算法各有特点，适用于不同的安全需求和应用场景，从非对称加密到对称加密，再到数字签名和密钥交换协议，它们共同
数据结构串的模式匹配算法--BF暴力匹配 Fms_Sa 算法数据结构 c语言
BF（Brute-Force，暴力匹配）算法是一种简单的字符串匹配算法，其基本思想是将目标串S逐个字符与模式串P进行比对，直到找到匹配或遍历完S为止。下面是一个使用C语言实现的BF算法示例：#include#include//BF算法实现//参数：text是文本串，pattern是模式串//返回值：如果找到模式串，则返回模式串在文本串中的起始位置（从0开始计数）；如果未找到，则返回-1intBF(
K近邻(KNN)算法详解及Python实现天明豆豆
K近邻(KNN)算法详解及Python实现今天浏览网页看到一篇用Python实现K近邻(KNN)算法的详解教程，果断收藏下来，虽然是五年前的文章，可能有些语法已经不适合，但文章语法思路还是可以值得借鉴的，收藏之后以后慢慢研究。KNN依然是一种监督学习算法KNN（KNearestNeighbors,K近邻）算法是机器学习所有算法中理论最简单，最好理解的。KNN是一种基于实例的学习，通过计算新数据与训
哈希表算法详解真的没事鸭数据结构与算法散列表算法哈希算法
哈希表哈希表（Hashtable，也叫散列表），是根据关键码值(Keyvalue)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做哈希函数，存放记录的数组叫做哈希表。给定表M，存在函数f(key)，对任意给定的关键字值key，代入函数后若能得到包含该关键字的记录在表中的地址，则称表M为哈希（Hash）表，函数f(key)为哈希(H
使用springboot项目打成jar包后运行出现获取不到resources下的模板文件不喜欢吃猫的鱼 java 运维 java 后端 springboot
一、话不多说，直接上错误信息：cannotberesolvedtoabsolutefilepathbecauseitdoesnotresideinthefilesystem:jar:file:/opt/XXXX.jar!/BOOT-INF/classes!/template/%e4%bf%a1%e6%81%af%e6%8a%80%e6%9c%af%e5%ae%89%e5%85%a8%e4%ba%8
二分查找(算法详解+模板+例题) Alex_Fufu 算法
一.二分的定义二分法（Bisectionmethod）即一分为二的方法.设[a，b]为R的闭区间.逐次二分法就是造出如下的区间序列([an，bn])：a0=a，b0=b，且对任一自然数n，[an+1，bn+1]或者等于[an，cn]，或者等于[cn，bn]，其中cn表示[an，bn]的中点。二.基本思路1.将数组排序。2.一直将数组除以二，直到找到那个数为止。3.用一个数x存储左节点坐标和右节点坐
springboot 整合 redis布隆过滤器 wwwzhouzy java进阶-基础篇
一、什么是布隆过滤器布隆过滤器（英语：BloomFilter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。BloomFilter（BF）是一种空间效率很高的随机数据结构，它利用位数组很简洁地表示一个集合，并能判断一个元素是否属于这个集
安卓文件加密 (File-Based Encryption, FBE) 加密算法--AES-256-XTS achirandliu Android AES-256-XTS FBE加密算法
标签：File-BasedEncryption加密算法；AES-256-XTS；安卓文件加密(File-BasedEncryption,FBE)加密算法详解1.什么是文件加密（FBE）？文件加密（File-BasedEncryption,FBE）是Android在7.0（Nougat）及更高版本中引入的一种加密机制，它允许不同的文件使用不同的加密密钥进行加密。与全盘加密（Full-DiskEncr
Leetcode刷题(第17题)——电话号码的字母组合卖菜的小白面试算法 leetcode 算法递归算法
一、题目给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。二、示例示例一输入：digits="23"输出：["ad","ae","af","bd","be","bf","cd","ce","cf"]示例二输入：digits="
LeetCode刷题笔记（Java实现）-- 17.电话号码的字母组合挽风归
题目难度：Medium题目要求：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。示例：输入：digits=“23”输出：[“ad”,“ae”,“af”,“bd”,“be”,“bf”,“cd”,“ce”,“cf”]编码思路：（建议对照代码理解）1.创建最后输出的字符组合的集合combination
图形学论文笔记 Jozky86 图形学图形学笔记
文章目录PBD：XPBD：shapematchingPBD：【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD：基于XPBD的物理模拟一条龙：公式推导+代码+文字讲解（纯自制）【论文精读】XPBD基于位置的动力学XPBD论文解读(
贪心+基本数据结构——栈雨潇ヽ数据结构
今日学习情况：昨天跟bf吵架，导致今天看小说没欲望，听音乐触景伤情，加上一不干正事就会想起她来以至于一直，所以学习时间居然莫名边长了？？虽然不知道学习效率怎么样，但我赶脚还行，和平时没有什么区别的样子。今天有学习剩下的一点点贪心，贪心一般来说是最简单的算法了，但是这里题目我依然有很多不会！！还有数据结构里面栈的用法，但是栈怎么写我忘记了，大概是用一个数组和一个int类型的名为top的数值作为栈顶标
signature=30b50e0d58e98add61156f6b1bb713b3,bootstrap-tour TraceYang
#THISISANAUTOGENERATEDFILE.DONOTEDITTHISFILEDIRECTLY.#yarnlockfilev1abbrev@1:version"1.1.1"resolved"https://registry.yarnpkg.com/abbrev/-/abbrev-1.1.1.tgz#f8f2c887ad10bf67f634f005b6987fed3179aac8"acce
【数据结构】BF和KMP算法小南知更鸟数据结构算法数据结构 c++
BF算法#includeusingnamespacestd;//#include//字符串处理#defineMAXSIZE255//串的定长顺序存储结构typedefstruct{charch[MAXSIZE+1];intlength;}SString;//bf算法intIndexBF(SStringS,SStringT){//从主串和模式串的第一个开始比较，因为第一个字符下标是0，所以i=0，j
打开电脑电源高性能 Net蚂蚁代码常用电脑小知识 scipy 代码规范
1、打开PowerShell（管理员模式）：Win+X，选择2、输入以下命令：powercfg-duplicateschemee9a42b02-d5df-448d-aa00-03f14749eb61就会开启卓越性能3、高性能：powercfg-duplicatescheme8c5e7fda-e8bf-4a96-9a85-a6e23a8c635c4、平衡：powercfg-duplicatesche
海外旅游险 wendy_bao
假期出去玩没有旅游险怎么行呢？史带的这个境外游性价比很好，海外就医直付，而且某些高风险运动别的保险不能保，这个可以承保图片发自Apphttps://www.700du.cn/m/index.html?from=singlemessage&isappinstalled=0#/product/34b5d48cf1634359b23233bb5bf5ff68?isShowHead=1&isShowPri
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26
b	a	b	c	b	a	b	c	a	b	c	a	a	b	c	a	b	c	a	b	c	a	c	a	b	c
					a	b	c	a	b	c	a	c	a	b

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35
	W	H	I	C	H	-	F	I	N	A	L	L	Y	-	H	A	L	T	S	.	-	-	A	T	-	T	H	A	T	-	P	O	I	N	T
1	A	T	-	T	H	A	T
2								A	T	-	T	H	A	T
3												A	T	-	T	H	A	T
4																		A	T	-	T	H	A	T
5																							A	T	-	T	H	A	T

1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26
b	a	b	c	b	a	b	c	a	b	c	a	a	b	c	a	b	c	a	b	c	a	c	a	b	c
					a	b	c	a	b	c	a	c	a	b

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35
	W	H	I	C	H	-	F	I	N	A	L	L	Y	-	H	A	L	T	S	.	-	-	A	T	-	T	H	A	T	-	P	O	I	N	T
1	A	T	-	T	H	A	T
2								A	T	-	T	H	A	T
3												A	T	-	T	H	A	T
4																		A	T	-	T	H	A	T
5																							A	T	-	T	H	A	T

BF 算法详解

你可能感兴趣的:(BF 算法详解)

1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26
b	a	b	c	b	a	b	c	a	b	c	a	a	b	c	a	b	c	a	b	c	a	c	a	b	c
					a	b	c	a	b	c	a	c	a	b

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35
	W	H	I	C	H	-	F	I	N	A	L	L	Y	-	H	A	L	T	S	.	-	-	A	T	-	T	H	A	T	-	P	O	I	N	T
1	A	T	-	T	H	A	T
2								A	T	-	T	H	A	T
3												A	T	-	T	H	A	T
4																		A	T	-	T	H	A	T
5																							A	T	-	T	H	A	T