月桦剑士

详细解析字符串模式匹配KMP算法-c语言-基于暴力匹配算法的改良-从部分匹配值到移位数组-两种代码实现方式（约6000字，附图）

前言

KMP算法是什么？
作为一个学习计算机或者从事计算机工作的人来说，数据结构与算法几乎是我们必须要了解甚至精通的学科，而学数据结构与算法时总有几个难点，KMP算法就是其中一个，这里我按照我的思路给大家详细讲一下。
KMP算法是一个性能优秀的字符串模式匹配算法，这里就有一点铺垫的概念要解释一下了：

KMP算法主要用于在一个长字符串中搜索一个短字符串的位置，一般我们把这个要搜索的短字符串称为模式串，搜索的过程称为匹配，因此字符串的子串搜索就称为模式匹配。
Knuth-Morris-Pratt算法（简称KMP），主要以同时发现这个算法3个人的名字来命名，所以大家只要知道它叫KMP，并且用来做字符串的子串搜索就好了。

1.KMP算法的意义——暴力匹配算法的原理和弊端

1.1暴力匹配算法的原理

在一个字符串中搜索一个子串的位置，最简单的算法就是暴力匹配算法（Brute-Force，BF算法），暴力匹配算法的原理比较简单，就是循环把字符串和模式串进行逐一比较，不过暴力匹配算法的效率十分低下，所以就出现了效率更高的KMP算法，这里先给大家解释一下暴力匹配算法。
附注：暴力匹配算法有很多种实现方式，不过原理都是一样的，许多书本和网上的文章对于暴力匹配算法的解释是在同一个循环中用i和j分别代表长短两个字符串的匹配的位置，当字符失配时，i回退，j归零，这里讲的可能有点抽象，总之你们要知道暴力匹配算法有时候实现方式不同但是原理是一样的就好了，这里给出的是我认为的比较好理解的实现方式，不过这个如果你们懂了的话应该看别的实现方式也是看得懂的。
因为暴力匹配算法比较简单，这里我就直接上代码了，后面再解释：

#include 
//获取字符串长度函数
int length(char *s){
	int i=0;
	if(s!=NULL) while(s[i]) i++;
	return i;
} 
//暴力匹配算法 Brute-Force简称BF算法
int indexOf(char *lstr,char *str){
	int i,j,m,n;
	//1.获取两个字符串的长度
	m = length(lstr);
	n = length(str);
	if(lstr==NULL||str==NULL||m==0||n==0) return -1;//两个字符串都不能为NULL 
	//2.如果字符串短于模式串则不用进行搜索，直接return -1; 
	if(m>=n){
		for(i=0;i<=m-n;i++){//外循环从0到m-n 
			for(j=0;j

 
  暴力匹配算法的执行过程是这样的：
 假设在字符串”abdabc”中搜索子串”abc”，用m和n分别代表字符串的长度和子串的长度，这里的m=6，n=3；我们把外循环临时变量i的值从0循环到m-n，每一轮循环都把长字符串中编号为i到i+n-1的n个字符与短字符串中的n个字符进行比较。（内循环的逻辑比较简单就不解释了）。
 下面模拟一下循环过程： 
   
   当i=0时，把长字符串的0到2位和短字符串的0到2位进行比较，如果完全匹配的话就提前结束循环，并返回i的值。
  
   很显然，上面i=0时，字符串是不匹配的，所以循环继续，i自增，即i=1，再匹配
  
   上面i=1时字符串也是不匹配的，所以我们就这样把i一位一位的往后移，直到匹配的子串或者i已经走到了m-n就停止循环。
 …（省略i=2的情况）
 
 当匹配到子串时，函数则会返回此时i的值，如果没有匹配到子串，函数返回-1。 
   
  1.2暴力匹配算法的弊端 
  暴力匹配算法之所以效率低下，主要是因为循环过程中进行了很多不必要的匹配，例如：
 下面的一个例子，在一个字符串中搜索子串ABCDABD。当有一处外循环i的值能够与子串的前六个都匹配，但唯独在子串的最后一个位D不匹配，那么我们在外循环的下一次移位时，就没有必要再一位一位的移，而是可以利用已经匹配的字符串信息计算出移位数，例如下面这样，在最后一位D位失配之后我们可以直接把比较位置挪成这样：
 (下面这张图片来自另外一篇博客kornberg_fresnel KMP算法到底在干什么)
 
 上面的解释看不懂就算了，随便看看就好了，总是你们要知道，KMP算法就是在字符串的某一位失配时，根据失配的字符前的已匹配信息来计算出下一轮比较的开始位置，从而避免不必要的匹配，提高算法效率。（例如在短字符串的最后一位D失配时，那么说明前面的”ABCDAB”都是完全匹配了的，根据这个信息，计算出下一轮比较的位置），具体怎么做呢，下面我们就来看看。 
  2.KMP算法的原理 
  之前我们说过，KMP算法就在在字符串的某一位失配时，根据失配的字符前的已匹配信息计算出下一轮比较的位置。所以KMP算法的核心就在于对已匹配信息的分析利用和失配之后的移位操作。想要计算移位数首先我们得学习几个新概念。 
  2.1部分匹配表（Partial Match Table，又称PMT表） 
  部分匹配表即一个字符串中每一个位对应的部分匹配值的集合，例如下面是一个字符串对应的PMT表，大家先大概看一下： 
   
    
     
     字符(char) 
     a 
     b 
     c 
     d 
     a 
     b 
     c 
     
    
    
     
     下标(index) 
     0 
     1 
     2 
     3 
     4 
     5 
     6 
     
     
     部分匹配值(value) 
     0 
     0 
     0 
     0 
     1 
     2 
     3 
     
    
   
  那么这些部分匹配值是怎么来的呢？ 
  2.1.1部分匹配值的计算 
  概念：部分匹配值是一个字符串中前缀集合和后缀集合交集元素中最长的元素的长度。
 铺垫知识：字符串的前缀和后缀
 定义：把一个字符串分割成非空的两个部分，前面的就叫前缀，后面的就叫后缀。如：字符串”abc”，划分为非空的两个部分可以是前缀”a”和后缀”bc”，也可以是前缀”ab”和后缀”c”。那么前缀集合就是{“a”,”ab”}，后缀集合就是{”bc”,”c”}。
 上面这个例子中，字符串”abc”的前缀集合和后缀集合没有交集，所以字符串”abc”的部分匹配值就是0。
 所以，部分匹配表就是把字符串中的每一位和它前面的字符当成一个新的字符串然后计算出部分匹配值。
 例如上面的字符串”abcdabc”的第三个字符c的部分匹配值就是子串”abc”的部分匹配值，也就是0，所以得到字符串中下标为2的部分匹配值为0。
 同理，”abcdabc”中第5位a的部分匹配值就是子串”abcda”的部分匹配值，从而下标为4的部分匹配值就是1。 
  2.2KMP算法对部分匹配表的使用 
  KMP算法核心就是对部分匹配表的使用，之前我们说过，KMP算法就是在字符失配时根据已匹配的信息计算出下一轮比较的位置。那么这个已匹配的信息和下一轮比较的位置具体都是啥呢？我们就来看看。 
  2.2.1 已匹配的信息 
  例如一个长字符串(这里先不管它是啥)中搜索一个短字符串”ABCDABD”，当匹配过程在短字符串的第6位B处失配时，那么已匹配的信息就是前面的5个字符，也就是说”ABCDA”这五个字符是已经被匹配成功的。如图：
  
  2.2.2移位数的计算 
  KMP算法中，移位数的计算是和部分匹配表是相关的，字符失配是移位操作具体可以分为： 
   
   当在短字符串的第一位就失配时，让长字符串和下一位和短字符串的第一位开始下一轮匹配。 
   当已匹配信息不为空时，让长字符串失配的位置和短字符串已匹配信息的部分匹配值的对应位置开始下一轮匹配。
 如图1.1：
 
 图1.2 在发生图1.1的失配情况时，下一轮比较的开始情况如下：（即当失配时，前面没有已匹配的字符串信息时，外循环的处理和暴力匹配算法一致）
 
 图2.1，如果已匹配信息不为空
 
 图2.2 在发生图2.1的失配情况时，下一轮比较的开始情况如下：
 
 通过总结我们可以发现移位数next和部分匹配表PMT的关系如下：
 
 从上面这个表我们可以看出来，除了字符串下标为0的那一位之外，其他每一位的移位数就是前面字符组成的子串的部分匹配值。而下标为0的位的移位数必须是一个作为标志的数（即一个不可能是部分匹配值的数，如负数或者大于字符串长度的数，这里用-1代表部分匹配值不存在的，好处是-1自增之后就变成了0）
 讲解了这么多之后，那么KMP算法也可以说成是 对移位数next数组的求解 + 匹配过程中根据移位数组next来调整匹配位置 的一种算法。接下来就是代码实现啦 
   
  3.KMP算法的代码实现 
  KMP算法的代码实现主要分为两个部分，即： 
   
   把要搜索的短字符串通过部分匹配计算得出移位数组next，（移位数一般用int型数组存储，数组长度和字符串长度相同，名称习惯性命名为next，也有的人喜欢命名成F或者其他的，这就用next了） 
   把暴力匹配算法进行改良，根据next数组来确定失配后下一轮比较的开始位置。 
   
  3.1移位数next数组求解的简单代码实现 
  我们已经知道了，移位数组next的值就是字符位前的所有字符组成的子串的对应的部分匹配值，而部分匹配值就是前缀集合和后缀集合交集中最长元素的长度，那么具体要怎么算呢？有一个笨办法就是循环遍历这个字符串，每一轮都去计算字符位前所有字符的子串的前缀集合和后缀集合交集的最长元素，代码实现如下： 
  //这是一个笨办法，只是为了简单的实现这个算法逻辑，算法效率非常低
#include 
#include  
//铺垫函数 求字符串长度 
int length(char *s){
	int i=0;
	if(s!=NULL) while(s[i]) i++;
	return i;
}
//铺垫函数 求一个字符串的前缀和后缀交集元素的长度 
int nextNum(char *str,int start,int l){
	int len = length(str),i,j;
	if(l<=0||start<0||start>=len) return -1;//不存在时返回-1
	for(i=start+l-2;i>start;i--){
		for(j=start;j
 
  上面这个的算法逻辑是比较简单的，我把上面代码中的nextNum函数稍微讲解一下：
 nextNum函数是求解一个字符串前后缀最长交集元素的长度（部分匹配值）的函数。nextNum函数原型是int nextNum(char *str,int start,int l);
 即传入一个字符串str，把start到start+l（不含start+l）位上的字符当成一个新字符串来求解部分匹配值。算法的步骤是： 
   
   如果传入的start或者l不合理则返回-1。（用-1代表部分匹配值不存在是比较常见的作法） 
   进行循环比较，图示如下，例如传入一个字符串”abab”，循环的第一轮会把前缀”aba”和后缀”bab”进行比较，如果完全匹配则返回长度3，否则进行下一轮，把前缀”ab”和后缀”ab”进行比较，如果完全匹配则返回长度2，否则进行下一轮，把前缀”a”和后缀”b”进行比较。当前后缀没有交集元素时则返回0.
 （即外层循环的i是假设存在的最大部分匹配值，内层循环对长度为i的前后缀进行比较） 
   
  3.2移位数next数组求解的改良（提高效率） 
  前面我们已经了解了next数组求解的一个笨办法，但是写出来的代码效率非常低的，我们进行了很多重复的比较。例如在求一个字符串”abab”的next数组时,上面getNext函数的操作是： 
   
   先申请一块长度为4的int数组内存（字符串”abab”的长度为4） 
   将next[0]赋值为-1（-1是一个标志，标志着部分匹配值不存在） 
   求出子串”a”的部分匹配值存入next[1] 
   求出子串”ab”的部分匹配值存入next[2] 
   求出子串”aba”的部分匹配值存入next[3] 
   求出子串”abab”的部分匹配值存入next[4] 
   返回next数组
 在上面这些操作步骤中，3到6步骤是由循环衍生出来的，我们调用了nextNum这个函数分别计算了子串”a”、“ab”、“aba”的部分匹配值，然后存入next数组中。
 实际上，上面这些子串之间是存在联系的，例如”a”刚好是”ab”的最长前缀，而”ab”刚好是”aba”的最长前缀，”aba”刚好是”abab”的最长前缀。所以当我们已经计算出子串”aba”的部分匹配值时，那么在计算”abab”的部分匹配值时就可以利用它的最长前缀的部分匹配值来简化算法，如最长前缀”aba”的部分匹配值是1，那么这里只要把子串”abab”的第2位（字符串下标位1，即下标为最长前缀的next值）和最后一位进行比较即可，如果相同的话，则么子串”abab”的部分匹配值就是最长前缀”aba”的部分匹配值再加1，如果不相同的话，则进行回退，将子串”abab”第1位（下标为0）和最后一位进行比较，…。
 写出来的代码是这样子的： 
   
  #include 
#include  
//铺垫函数 求字符串长度 
int length(char *s){
	int i=0;
	if(s!=NULL) while(s[i]) i++;
	return i;
}
int *getNext(char * str){
	int len,*next;
	len = length(str);
	if(len<=0) return NULL;
	next = (int *)malloc(sizeof(int)*len);
	next[0] = -1;
	int i = 0, j = -1;
 
	while (i < len)
	{
		if (j == -1 || str[i] == str[j])
		{
			++i;
			++j;
			next[i] = j;
		}	
		else
			j = next[j];
	}
	return next;
} 
int main(){
	int *a,i;
	a = getNext("ababada");
	for(i=0;i<7;i++) printf("%d ",a[i]);
	return 0;
}
 
  上面这个东西逻辑还是比较复杂的，但是算法效率很高，大家尽量看一看。
 算法解析，以字符串str=”ababca”为例: 
   
   1.初始化，求的字符串长度len=7.创建一个int next[7]数组。用i表示字符串的下标，用j表示每一位下标的前面的字符串的部分匹配值。令next[0]=-1,因为第0位前没有字符，所以用-1表示部分匹配值不存在。(此时所求字符串下标为0，i的值未初始化，对应求子串“a”的移位数，而”a”没有前缀，前缀的部分匹配值不存在，给i赋值0,j赋值-1，从而得到next[0]=-1). 
   第1次循环，只要字符串存在第二位，那么它的部分匹配值一定为0，所以第一次循环执行时i=1; j=0; next[1]=0;(此时所求字符串下标为1,i的值为0,“ab”的最长前缀为”a”,”a”的部分匹配值为0，给i赋值为1,j赋值为0，从而得到next[1]=0). 
   3.第2次循环，所求字符串下标为2，i的值为1，对应子串”aba”，”aba”的最长前缀为”ab”，”ab”的最长前缀为”a”，”a”的部分匹配值为0，那就判断字符串的第i位和第j位是否相等，相等的话则”ab”的部分匹配值是”a”的部分匹配值加1，不相等的话则把j回退到next[j]进行比较。经过计算后，i的值最终变成2，j的值变成0，从而得到next[2]=0. 
   第3次循环，所求字符串下标为3，i的值为2，对应子串”abab”,”abab”的最长前缀为”aba”，”aba”的最长前缀为”ab”,”ab”的部分匹配值为0，判断第i位和第j位是否相等，相等则”aba”的部分匹配值是”ab”的部分匹配值加1，计算后，i的值变为3，j的值变为1，得到next[3]=1. 
   第4次循环，所求字符串下标为4，i的值为3，对应子串”ababc”,”ababc”的最长前缀为”abab”,”abab”的最长前缀为”aba”,”aba”的部分匹配值为1，判断第i位和第j位是否相等，相等则得出计算后i的值变为4，j的值变为2，得到next[4]=2(即算法中的next[i]=j). 
   第5次循环，所求字符串下标为5，i的值为4，对应字符串”ababca”,”ababca”的最长前缀为”ababc”,”ababc”的最长前缀为”abab”,”abab”的部分匹配值为2，先判断第i位和第j位是否相等，即判断str[4]是否等于str[2]，得到”c”!=”a”，于是j回退到next[j] (即j=next[2]=0)，再次判断str[i]是否等于str[j]，即str[4]是否等于str[0]，得到结果为不等，j回退到next[0]，即-1，最后直接让i++,j++,得到i=5,j=0,next[5]=0;计算结束,返回移位数组[-1,0,0,1,2,0]. 
   
  3.3KMP算法的完整代码实现 
  这里我就直接上代码啦，如果你们前面的都看懂了的话那么看这个应该也是没问题的。 
  #include 
#include  
//铺垫函数 求字符串长度 
int length(char *s){
	int i=0;
	if(s!=NULL) while(s[i]) i++;
	return i;
}
int *getNext(char * str){
	int len,*next;
	len = length(str);
	if(len<=0) return NULL;
	next = (int *)malloc(sizeof(int)*len);
	next[0] = -1;
	int i = 0, j = -1;
 
	while (i < len)
	{
		if (j == -1 || str[i] == str[j])
		{
			++i;
			++j;
			next[i] = j;
		}	
		else
			j = next[j];
	}
	return next;
} 
//KMP算法 
int indexOf(char *lstr,char *str){
	int i,j,m,n,*next;
	//1.获取两个字符串的长度
	m = length(lstr);
	n = length(str);
	if(lstr==NULL||str==NULL||m==0||n==0) return -1;//两个字符串都不能为NULL 
	//2.求next数组 
	next = getNext(str);
	//3.如果字符串短于模式串则不用进行搜索，直接return -1; 
	if(m>=n){
		i=0,j=0;
		while(i
 
  4.附注：暴力匹配算法和kmp算法的另外一种实现方式。 
  暴力匹配算法求解思路：只用一个循环来处理比较的过程，用变量i存储长字符串的下标，用变量j存储短字符串的下标，然后进行比较，当字符位匹配时则进行下一个位的匹配直到短字符串尾，当发生失配情况时，变量j归0，变量i回退j-1个位置。代码如下： 
  #include 
//获取字符串长度函数
int length(char *s){
	int i=0;
	if(s!=NULL) while(s[i]) i++;
	return i;
} 
//暴力匹配算法 Brute-Force简称BF算法
int indexOf(char *lstr,char *str){
	int i,j,m,n;
	//1.获取两个字符串的长度
	m = length(lstr);
	n = length(str);
	if(lstr==NULL||str==NULL||m==0||n==0) return -1;//两个字符串都不能为NULL 
	//2.如果字符串短于模式串则不用进行搜索，直接return -1; 
	if(m>=n){
		i=0,j=0;
		while(i
 
  KMP算法实现思路：KMP算法是基于暴力匹配算法的改良，所以这一版的kmp算法就是基于上面的暴力匹配算法做了一些改动，即当发生失配情况时，保持变量i不变，而j回退到next[j]的位置，代码如下： 
  #include 
#include  
//铺垫函数 求字符串长度 
int length(char *s){
	int i=0;
	if(s!=NULL) while(s[i]) i++;
	return i;
}
int *getNext(char * str){
	int len,*next;
	len = length(str);
	if(len<=0) return NULL;
	next = (int *)malloc(sizeof(int)*len);
	next[0] = -1;
	int i = 0, j = -1;
 
	while (i < len)
	{
		if (j == -1 || str[i] == str[j])
		{
			++i;
			++j;
			next[i] = j;
		}	
		else
			j = next[j];
	}
	return next;
} 
//KMP算法 
int indexOf(char *lstr,char *str){
	int i,j,m,n,*next;
	//1.获取两个字符串的长度
	m = length(lstr);
	n = length(str);
	if(lstr==NULL||str==NULL||m==0||n==0) return -1;//两个字符串都不能为NULL 
	//2.求next数组 
	next = getNext(str);
	//3.如果字符串短于模式串则不用进行搜索，直接return -1; 
	if(m>=n){
		for(i=0,j=0;i
 
  至此，关于KMP算法，我的所学所思已经讲解的差不多啦，今天就写到这里吧，本文作者郑伟斌，写于2019/4/11，转载注明出处。

字符(char)	a	b	c	d	a	b	c
下标(index)	0	1	2	3	4	5	6
部分匹配值(value)	0	0	0	0	1	2	3

数据结构与算法-09贪心算法&动态规划阿诚学java 数据结构与算法学习记录贪心算法动态规划 ios
贪心算法&动态规划1贪心算法介绍贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是全局最好或最优的算法。贪心算法通常用于解决优化问题，如最小化成本、最大化收益等。然而，贪心算法并不总是能够得到全局最优解，但它具有直观、高效、易于实现等优点，因此在许多实际问题中得到了广泛应用。基本思想贪心算法总是从问题的某一个初始解出发。
数据结构与算法----贪心王嘉俊925 算法算法数据结构 C++贪心算法
##贪心算法1.核心思想贪心算法通过每一步的局部最优选择，逐步推导出全局最优解。它的特点是不回溯，即一旦做出选择，就不再修改。2.适用条件贪心算法适用于满足以下两个条件的问题：贪心选择性质：每一步的局部最优选择能够导致全局最优解。最优子结构：问题的最优解包含子问题的最优解。3.贪心算法的证明方法贪心算法的正确性通常需要通过以下方法证明：归纳法：证明每一步的贪心选择都能导致全局最优。交换论证：假设存
零基础数据结构与算法——第五章：高级算法-贪心算法-基础&示例
5.2贪心算法（GreedyAlgorithm）5.2.1贪心算法的基本概念什么是贪心算法？贪心算法是一种在每一步选择中都采取当前状态下最好或最优的选择，从而希望导致结果是最好或最优的算法。生活例子：想象你在超市购物，手里有100元钱，想买尽可能多的零食。如果你采用贪心策略，你会怎么做？你可能会先选择最便宜的零食，然后是第二便宜的，以此类推，直到钱用完。这就是一种贪心策略——每次都选择当前看起来最
swift5分钟语法速记开发之家 iOS iOS
如果你依然在编程的世界里迷茫，不知道自己的未来规划，小编给大家推荐一个IOS高级交流群：458839238里面可以与大神一起交流并走出迷茫。小白可进群免费领取学习资料，看看前辈们是如何在编程的世界里傲然前行！群内提供数据结构与算法、底层进阶、swift、逆向、整合面试题等免费资料附上一份收集的各大厂面试题（附答案）!群文件直接获取各大厂面试题又把swift相关语法部分看了一遍，并整理了swift语
大学专业科普 | 计算智能、信息学与大数据鸭鸭鸭进京赶烤大数据
一、专业背景随着信息技术的飞速发展，数据的产生速度呈爆炸式增长，传统数据处理技术已经无法满足如此庞大的数据量和复杂的数据类型，大数据专业应运而生，旨在培养能够应对大数据挑战的专业人才。二、主要课程内容数学基础课程高等数学、概率论与数理统计、线性代数是大数据分析的核心数学基础，为数据处理、算法优化和模型构建提供必要的理论支持。计算机基础课程数据结构与算法、计算机网络、操作系统是大数据技术的重要支撑，
深入理解Mysql索引底层数据结构与算法桑翔
一.索引的本质索引是帮助MySQL高效获取数据的排好序的数据结构二.索引数据结构1.二叉树2.红黑树3.Hash表4.B-Tree1.叶节点具有相同的深度,叶节点的指针为空2.所有索引元素不重复3.节点中的数据索引从左到右递增排序B-Tree5.B+Tree1.非叶子节点不存储data,可以放更多的索引2.叶子节点包含所有索引字段3.叶子节点用指针连接,提高区间访问的性能(体现在做范围查询的时候)
Java数据结构与算法(爬楼梯动态规划) 盘门 java数据结构与算法实战 java 动态规划开发语言
前言爬楼梯就是一个斐波那契数列问题，采用动态规划是最合适不过的。实现原理初始化:dp[0]=1;dp[1]=2;转移方程：dp[i]=dp[i-1]+d[i-2];边界条件:无具体代码实现classSolution{publicintclimbStairs(intn){if(n==1){return1;}int[]dp=newint[n];dp[0]=1;dp[1]=2;for(inti=2;i<
【数据结构与算法-Day 4】从O(1)到O(n²)，全面掌握空间复杂度分析吴师兄大模型数据结构与算法数据结构与算法 python 时间复杂度大模型人工智能数据结构深度学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
数据结构与算法里散列表的算法优化技巧数据结构与算法学习散列表算法数据结构 ai
数据结构与算法里散列表的算法优化技巧关键词：散列表、哈希冲突、负载因子、开放寻址法、链地址法、动态扩容、哈希函数优化摘要：本文将深入探讨散列表的核心原理与优化技巧，通过图书馆管理员的比喻揭示哈希冲突的本质，结合Python代码演示动态扩容策略与哈希函数优化方法，最后通过实际案例展示如何将查询速度提升300%。文章包含5个可视化流程图和3个完整代码实现。背景介绍目的和范围本文面向已掌握基础数据结构知
数据结构与算法学习 (08)字符串匹配--BF算法/RK算法暱稱已被使用
BF算法也就是串的模式匹配算法，在主串中查找与模式T（副串）相匹配的子串，如果匹配成功，找到该子串在主串出现的第一个字符。模式匹配不一定是从主串第一个字符开始，可以在主串中指定起始位置。算法思想：将目标串S的第一个字符与模式串T的第一个字符进行匹配，若相等，则继续比较S的第二个字符和T的第二个字符；若不相等，则比较S的第二个字符和T的第一个字符，依次比较下去，直到得出最后的匹配结果。BF算法是一种
PTA数据结构与算法-第一章——褚论 ?Suki PTA习题算法数据结构 c++
文章目录第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题单选题程序填空题第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题(neuDS)数据的物理结构是指数据在计算机中的实际存储形式。T(neuDS)数据的物理结构是指数据在计算机中的实际
C++数据结构————二叉树 Гений.大天才 C++语言入门以及基础算法 c++数据结构开发语言
【前言】在数据结构与算法的世界里，二叉树（BinaryTree）始终占据着核心地位。它既是众多高级树形结构（B+树、红黑树、线段树、字典树……）的“基因”，又是面试、竞赛与工程实战中绕不开的考点。本文将用大约2万字的篇幅，从“零”开始，把C++二叉树的所有常见形态、常见算法、常见坑点与常见优化一次性讲透。全文配套可编译运行的C++17/20代码2000余行，所有示例均在GCC13/Clang17/
【数据结构与算法】力扣 88. 合并两个有序数组秀秀_heo 数据结构与算法 leetcode 算法职场和发展
题目描述88.合并两个有序数组给你两个按非递减顺序排列的整数数组nums1**和nums2，另有两个整数m和n，分别表示nums1和nums2中的元素数目。请你合并nums2**到nums1中，使合并后的数组同样按非递减顺序排列。注意：最终，合并后数组不应由函数返回，而是存储在数组nums1中。为了应对这种情况，nums1的初始长度为m+n，其中前m个元素表示应合并的元素，后n个元素为0，应忽略。
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
2025秋招优秀项目推荐微凉的衣柜人工智能深度学习算法 gpt
01.多个优异的数据结构与算法项目推荐良心推荐hello-algo包含多个通用的代码框架，一个框架完成多道题目，更详细请查阅labuladong02.大模型岗位面试总结：共24家，9个offer大模型岗位面试总结：共24家，9个offer03.视觉检测分割一切源码及在线DemoGrounded-Segment-Anything项目源码
数据结构课程设计秋悠然深度优先算法图论
项目名称：图的遍历课程设计主要目的：1.了解并掌握数据结构与算法的设计方法。2.通过应用数据结构的基本理论和方法来解决实际问题。3.初步掌握软件开发过程中的问题分析、系统设计、程序编码、调试、数据测试等基本方法和技能。4.学习编写课程设计报告，软件开发文档。课程设计任务要求：任务：实现图的深度遍历（递归和非递归两种方法）以及实现图的广度遍历（队列）要求：1.程序能够正确运行，实现图的深度遍历和广度
零基础数据结构与算法——第四章：基础算法-排序（总） qqxhb 零基础数据结构与算法算法小学生编程算法排序算法数据结构插入桶归并
排序上（冒泡/选择/插入）排序中（归并/堆排/快排）排序下（计数/基数/桶）4.1.10排序算法的比较性能比较下表总结了我们学习的排序算法的性能特点：排序算法平均时间复杂度最坏时间复杂度最好时间复杂度空间复杂度稳定性是否基于比较冒泡排序O(n²)O(n²)O(n)O(1)稳定是选择排序O(n²)O(n²)O(n²)O(1)不稳定是插入排序O(n²)O(n²)O(n)O(1)稳定是归并排序O(nlo
【算法专题】双指针算法之18. 四数之和（力扣） CILMY23 算法专题算法 leetcode 双指针算法 c++四数之和
欢迎来到CILMY23的博客本篇主题为：双指针算法之18.四数之和（力扣）个人主页：CILMY23-CSDN博客系列专栏：Python|C++|C语言|数据结构与算法|贪心算法|Linux|算法专题|代码训练营感谢观看，支持的可以给个一键三连，点赞收藏+评论。如果你觉得有帮助，还可以点点关注题目：18.四数之和-力扣（LeetCode）给你一个由n个整数组成的数组nums，和一个目标值target
揭秘 LeetCode 数据结构与算法的高效学习方法数据结构与算法学习 leetcode 学习方法算法 ai
揭秘LeetCode数据结构与算法的高效学习方法关键词：LeetCode、数据结构、算法、高效学习、解题技巧、知识体系、面试准备摘要：本文以“如何高效通过LeetCode学习数据结构与算法”为核心，结合新手常见痛点（如刷题没方向、刷完就忘、无法举一反三），通过生活化类比、具体案例拆解和可操作的学习方法，系统讲解从“入门到精通”的全流程。无论是求职准备的程序员，还是想提升编程能力的学习者，都能从中找
LeetCode 刷题：数据结构与算法的实战经验分享
LeetCode刷题：数据结构与算法的实战经验分享关键词：LeetCode、数据结构、算法、刷题经验、实战摘要：本文将围绕LeetCode刷题展开，深入探讨数据结构与算法在实际刷题过程中的应用。通过分享实战经验，帮助读者更好地理解和掌握数据结构与算法知识，提升解题能力。文章将从背景介绍入手，阐述刷题的目的和意义，接着详细解释核心概念，分析它们之间的关系，然后介绍核心算法原理和具体操作步骤，结合数学
数据结构与算法PTA 6-1【顺序表】（C语言）页面正在加载中数据结构与算法入门记录算法数据结构链表 c语言
题目：要求根据顺序表定义和已有操作，编码完成其他的10个操作。顺序表的定义和已有操作：#defineN10typedefintElemType;typedefstruct{ElemTypedata[N];intlast;}SeqList;SeqList*InitList();voidTraverseList(SeqList*list);需要你来编写的其他操作：//插入成功则返回0。如果pos非法则
【C语言】学习过程教训与经验杂谈：思想准备、知识回顾（五）
个人主页：艾莉丝努力练剑❄专栏传送门：《C语言》、《数据结构与算法》、C语言刷题12天IO强训、LeetCode代码强化刷题学习方向：C/C++方向⭐️人生格言：为天地立心，为生民立命，为往圣继绝学，为万世开太平前言：我们在学习过程中会碰到很多很多问题，本系列文章不会博主不会额外再创建一个新的专栏来收录，因为这一系列文章创作的初心主要是针对回顾知识点（遵循遗忘曲线并且根据自身的实际情况可以做出一些
python进阶之数据结构与算法--入门-二叉树小白piao 数据结构与算法python篇数据结构算法二叉树 python
二叉树概念：之前已经提及了关于树的概念，要想知道之前讲了什么请关注，前边文章里都有提及。这里不做赘述。二叉树是具有以下属性的有序树：1、每个节点最多有两个孩子节点2、每个孩子节点被命名为左子节点和右子节点3、对于每个节点的孩子节点，在顺序上，左子节点优先于右子节点4、若子树的根为内部节点v的左子节点或者右子节点，则该子树相应地被称为节点v的左子树或者右子树5、若每个节点都有零个或者两个节点，则这样
C语言数据结构与算法专栏目录 CodeAllen嵌入式嵌入式 C语言数据结构算法
后序会开一个《嵌入式数据结构专栏》主要为了学习嵌入式的同学，软件能力提升和大厂面试能力，感谢大家关注！直达专栏：https://blog.csdn.net/super828/category_11083370.html《C语言数据结构与算法》专栏已经更新完毕，共计72篇分享，后期会逐渐修改错误并添加内容0数据之间的关系有哪些？1如何度量一个算法的好坏？2常见的时间复杂度实例
零基础数据结构与算法—— 第三章：高级数据结构-总结 qqxhb 零基础数据结构与算法小学生编程算法数据结构算法树堆哈希表图
3.1树（上）3.1树（下）3.2堆（Heap）3.3哈希表（HashTable）3.4图（Graph）3.5高级树结构3.6本章小结在本章中，我们深入学习了几种重要的高级数据结构，这些数据结构在解决复杂问题时具有强大的能力。让我们回顾一下本章的主要内容：1.堆（Heap）堆是一种特殊的完全二叉树，具有堆序性质。我们学习了：最大堆和最小堆的概念和性质堆的基本操作（插入、删除堆顶、获取堆顶、构建堆）
数据结构与算法：贪心（二）
前言要加快速度啊！！一、最短无序连续子数组classSolution{public:intfindUnsortedSubarray(vector&nums){intn=nums.size();intMax=-1e9;intright=-1;//最右不符合的位置for(inti=0;inums[i])//遇到不符合递增规律的数{right=i;}Max=max(Max,nums[i]);}intMi
数据结构与算法：贪心算法的优化案例展示
数据结构与算法：贪心算法的优化案例展示关键词：贪心算法、局部最优、全局最优、活动选择问题、霍夫曼编码、硬币找零、算法优化摘要：贪心算法是计算机科学中最“接地气”的算法思想之一——它像极了我们日常生活中“走一步看一步，每次选当前最好”的决策方式。但这种“短视”的策略为何能在某些问题中得到全局最优解？它的优化边界在哪里？本文将通过5个经典案例，从生活场景到代码实现，一步步拆解贪心算法的核心逻辑与优化技
C++ 智能指针随意023 C++重构 c++开发语言
STL和智能指针关系1.STL是标准库的子集：专注于数据结构与算法。2.智能指针属于“通用工具库”：与std::thread、std::future等工具同属一类，不隶属于STL的核心组件。1.智能指针智能指针是一个类模板，通过RAII（资源获取即初始化）技术封装原始指针，自动管理对象生命周期。1.核心功能避免内存泄漏：无需手动调用delete。2.RAII（资源获取即初始化）RAII（Resou
数据结构与算法中外部排序的详细剖析数据结构与算法学习网络 ai
数据结构与算法中外部排序的详细剖析关键词：外部排序、归并排序、多路归并、置换选择排序、败者树、磁盘I/O优化、大数据处理摘要：本文将深入探讨外部排序技术，这是处理大规模数据时不可或缺的算法。我们将从基本概念出发，逐步解析多路归并、置换选择排序等核心技术，并通过实际代码示例展示如何实现高效的外部排序。文章还将分析外部排序在现代大数据处理中的应用场景和优化策略。背景介绍目的和范围本文旨在全面介绍外部排
数据结构与算法领域线性探测的性能分析数据结构与算法学习哈希算法散列表数据结构 ai
数据结构与算法领域线性探测的性能分析关键词：哈希表、线性探测、冲突解决、时间复杂度、负载因子、性能分析、散列函数摘要：本文深入探讨哈希表中线性探测冲突解决方法的性能特点。我们将从基本概念出发，通过生活化的比喻解释线性探测的工作原理，分析其在不同场景下的时间复杂度表现，并通过Python代码实现和实验数据展示其实际性能。文章还将讨论线性探测的优缺点、适用场景以及优化策略，帮助读者全面理解这一经典算法
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

详细解析字符串模式匹配KMP算法-c语言-基于暴力匹配算法的改良-从部分匹配值到移位数组-两种代码实现方式（约6000字，附图）

前言

1.KMP算法的意义——暴力匹配算法的原理和弊端

1.1暴力匹配算法的原理

1.2暴力匹配算法的弊端

2.KMP算法的原理

2.1部分匹配表（Partial Match Table，又称PMT表）

2.1.1部分匹配值的计算

2.2KMP算法对部分匹配表的使用

2.2.1 已匹配的信息

2.2.2移位数的计算

3.KMP算法的代码实现

3.1移位数next数组求解的简单代码实现

3.2移位数next数组求解的改良（提高效率）

3.3KMP算法的完整代码实现

4.附注：暴力匹配算法和kmp算法的另外一种实现方式。

你可能感兴趣的:(数据结构与算法)