iamstevenlu

KMP算法背后的细节与难点

本文是笔者在复习数据结构时的笔记，在初次接触KMP算法时觉得理解起来困难重重，在翻阅网上众多自称“通俗易懂地解释KMP算法”的文章后，发现大多文章都只是粗浅地停留在对比KMP和暴力匹配算法的不同，而没有深入地去探讨算法细节中关于next数组的计算和推导、next数组应如何用代码实现等问题。所以笔者在花费大量时间思考并最终理解后，希望通过这篇文章讲清和讲透KMP算法其中的细节。

在进入正题之前，让我们先说明几个概念：
主串：若我们称A = 'hello world’为主串
子串：则我们可以称B = 'hello’或C = ‘world’ 等为A的子串，即从A中取出来的部分字符串我们都可以称为子串
模式串：子串也可以称为模式串，但我们一般将要与主串进行比较匹配的字符串为模式串。

在本文所用到的字符串都是用字符数组来存储的，而且字符串第一个下标为1而不是0.

首先我们说一下什么是模式匹配。简单来说，模式匹配就是指判断一个模式串是否是一个主串的子串，即主串是否包含该模式串，如果是，返回该模式串在主串中的位置（即第一个字符的位置）。我们先看下面一个例子，已知一主串为 ‘helloworld’，模式串为 ‘owo’，由下图可知，模式串与主串匹配的结果再5这个位置，那么在模式匹配算法完成后会返回 5 作为结果，这应该没什么问题，重点是应该怎么去确定 ‘owo’ 在 ‘helloworld’ 中的位置。

第一种方法称为暴力匹配法。即我们将模式串的第一个字符分别依次与主串中的每一个字符匹配一次，直到出现模式串的每一个字符与主串的每一个字符完全匹配为止。

由上图我们可以看到，我们依次拿模式串与主串进行匹配，直到第五次才匹配成功，假设主串的长度为m，模式串的长度为n，那么暴力匹配算法的最坏时间复杂度为O(m*n)，这样的结果是不太理想的，因为在上图的匹配中，在第一次匹配的时候我们其实已经明确子串 ‘hel’ 中不存在 'owo’其中任一个字符，换言之，第二次和第三次匹配其实可以完全省去的。

我们再来看另外一个例子。模式串 ‘good’ 与主串 ‘googlegood’ 进行第一次匹配时，当匹配到主串第四个位置 ‘g’ 时发现 ‘g’ 和 ‘d’ 不相等并进行第二次匹配，于是主串的指针i从1走到4后重新回溯到2的位置。但是我们很清楚地看到，第二到第三次匹配其实都是没有必要进行的，因为我们在第一次匹配时已经有了一个短暂的记忆，即第二和第三个字符的首字母都是 ‘o’ 而不是 ‘g’ 。所以暴力匹配法的一个最大缺点就是主串指针i在每一次匹配失败后都会回溯，即便我们已经知道了回溯后匹配也不成功。而KMP算法完美地解决了这个缺点，所以接下来我们就开始介绍KMP算法的思想和细节。

KMP算法由D.E.Knuth，J.H.Morris和V.R.Pratt三人共同提出，所以取他们名字的首字符组成了KMP。在进行深入地探讨KMP算法的相关细节之前，我们再来说明几个概念。

前缀：前缀指除最后一个字符之外，字符串的全部头部子串
后缀：除第一个字符外字符串的全部尾部子串
部分匹配值（partial match）：字符串前缀和后缀相等的最长长度，也可简称为PM

定义完我们来举几个例子说明一下，以字符串 ‘ababa’ 来举例：

对于 ‘a’ ：它没有前缀也没有后缀，PM=0。
对于 ‘ab’ ：它的前缀有{a}，后缀有{b}，PM=0
对于 ‘aba’ ：它的前缀有{a,ab}，后缀有{a,ba}，PM=1，因为前后缀相等的长度最长的串’a’长度为1
对于 ‘abab’ ：它的前缀有{a,ab,aba}，后缀有{b,ab,bab}，PM=2，因为前后缀相等长度最长的串’ab’长度为2
对于’ababa’ ：它的前缀有{a,ab,aba,abab}，后缀有{a,ba,aba,baba}，PM=3，因为前后缀相等的长度最长的串’aba’长度为3.

综上分析，我们可以得出对于字符串’ababa’它的部分匹配值分别是：00123，那这个部分匹配值在我们进行模式匹配的时候可以起到一个什么作用呢？继续上例子：

在上面的例子中，在第一次 ‘good’ 和 ‘googlegood’ 进行第一次比较后，又进行了两次在我们看来毫无意义的比较，那我们是否可以直接让 ‘good’ 去和 ‘googlegood’ 中的第四个字符 ‘g’ 去比较呢？

这里注意一下，当我们人眼直接望去这两个字符串时，我们可以很清楚地发现 ‘good’ 这个子串在主串的末尾，从而前面的六次比较在我们看来都是无意义的。但是这并不是计算机所处理信息的方式，计算机一次只可以读取一个字符，在第一次匹配的时候，它只观测到了前三个字符还有知道第四个字符不是 ‘d’，所有计算机在处理问题的时候只能在已知的信息范围内处理问题。

好，回到我们的例子上来，前面讲到了第一次匹配，流程如下图：

在第一次匹配的过程中，主串指针i和模式串指针j分别移动，当移动到第四个位置时发现 ‘g’ 不等于 ‘d’ ，如果是在暴力匹配的情形下，此时i重新回到主串第二个位置，也就是 ‘o’ ，与模式串从第一个位置 ‘g’ 开始进行新一次的匹配。

前面也提过，导致暴力匹配算法时间开销大的原因就是主串指针的回溯，那如果我们可以让主串指针i不回溯，在匹配的整个过程中一直往前移动，我们就可以省下很多的时间。那么，以计算机的视角来看待这个问题：

已知前三个字符匹配成功，第四个字符与模式串字符不匹配，第四个字符后面的未知，而在经过比对的过程中，发现第二和第三个字符都不与模式串的第一个字符 ‘g’ 匹配，那么此时我是要继续按照i=2, i=3, i=4这样的顺序匹配下去呢，还是直接让模式串的首字符去和主串的第四个字符比对？答案肯定是后者，因为省去了无意义的匹配，但考虑更多的情况，我们要怎么让计算机知道它在不同的情形下应让模式串移动到哪个位置与主串比较呢？这时部分匹配值便派上了用场。

这里我们先上一个公式：模式串移动位数 = 已匹配字符数 - 部分匹配值，后面再来解释这个公式代表什么意思。模式串 ‘good’ 的部分匹配值为0000，这个留给读者动手做，非常简单，这里就不再细讲。已匹配到的字符共三个，所有模式串 ‘good’ 移动的位数应该是 3 - 0 = 3，此时应该让模式串的第一个字符与主串的第四个字符进行匹配。

好了，至此我们已经大概将KMP算法的流程给过了一遍，不知道大家有没有看懂：

求出模式串的部分匹配值
在模式串与主串匹配的过程中依据部分匹配值计算如果匹配失败下一次模式串应该移动多少位去和主串匹配
不断重复第二步直到匹配成功/失败

至此KMP算法的基本思想都已经讲完啦，但是KMP算法实现的技术难点才刚刚开始~ 我们前面讲过部分匹配值指的是一个串前缀后缀相等部分的最大长度是多少，但是当我们前面在使用部分匹配值时我们却是给了一串数字。比如前面我们说 ‘good’ 对应的PM为0000，'ababa’的PM为00123，那这串数又是代表什么呢？在KMP算法的实现中我们将其称为next数组，拿 ‘ababa’ 举例：

对应于模式串 ‘ababa’ 的next数组为：[0,0,1,2,3]。我们可以这样来理解这个数组，当我们的指针j停留在某一个位置时发现模式串字符与主串字符不等，我们去找到已匹配字符串的最后一位的PM值，利用公式模式串移动位数 = 已匹配字符数 + 部分匹配值来计算出模式串应该移动的位数等于多少。比如：

现在我们再重头来捋一下上面图中的整个过程：

第一次匹配：在i=5的位置主串与模式串匹配不上，这时候寻找已匹配子串共四个字符的最后一个字符也就是 ‘b’ 在next数组中的PM值为2，我们让模式串向右移动4-2=2个位置，并保持主串指针i不动。

第二次匹配：我们可以看到经过第一次按照PM值计算出来的位数移动后，我们直接将模式串的 ‘ab’ 与主串的 ‘ab’ 对齐，并从比较主串的第五位和模式串的第三位是否相等开始匹配。之所以能这样是因为前面在已经与主串匹配成功的部分模式串字符其实就是模式串的子串，我们只不过是在寻找已匹配成功的模式串的相等前后缀而已。（可能有点绕口，但也只能这样表达了，希望读者可以好好地琢磨理解，第一次看不一定可以看懂，慢慢思考动笔在纸上画图可以加深理解）。此时在i=5这个位置匹配失败，我们寻找已匹配子串的最后一个字符的PM值为0，计算模式串移动位数为2,并保持主串指针i不动

第三次匹配：此时我们来到了第三次匹配，注意！此时主串与模式串在模式串的第一个字符就匹配失败了，此时需要主串指针i和模式串同时向右移动一位。

第四次匹配：成功啦~

如果按照暴力匹配方式的话，我们需要六次才可以匹配成功，当然碰见更为复杂的串自然所需时间会更高。

希望通过这个例子，读者可以加深对KMP算法流程、部分匹配值（PM）、next数组以及模式串的移动有了一个更加直观和深刻的理解但真正的难点其实还没到，请大家务必再坚持一会儿~刚刚讲的整个流程其实有两点需要我们注意：

首先，模式串并不会真的移动，这里只是为了方便大家理解在逻辑上实现的移动，但是模式串所存储在内存中的物理结构是不会移动到任何地方的。

那这里又代表的是什么呢？其实这里代表的是指向模式串的指针j的移动，刚刚一直在将主串指针i而一直忽略了模式串指针j，不知道读者有没有发现~ 当我们在模式串的第一个字符便匹配失败时，我们会让主串指针i和模式串指针j共同向右移动一位。**当我们的主串和模式串有至少一个匹配字符时，若遇到匹配失败的字符，便让主串指针i仍指向该字符，而模式串指针j指向已匹配字符串最后一个字符的`PM+1’个位置。**我们再拿上面的例子说明一下：在第一次匹配中，已匹配字符串的最后一个字符 ‘b’ 的PM为2，所有此时模式串指针j应指向模式串的第（2+1=3）个字符，即 ‘a’ ，并开始与主串进行比较。那背后的原理其实也很简单，PM所指的是串中前缀和后缀相等的最大长度，而已匹配部分其实是模式串的子串，是模式串自身的一部分，如果我们可以保证模式串的部分前缀和其部分后缀是相等的话，那么我们只需从这部分相等前缀后一个字符开始比较即可，前面的都可以略过。（这段话建议读者结合图片理解并思考，其实是不难理解的。）

其次，假如我们在j=3的位置匹配失败了，但我们却需要去找next[2]的PM值再加一最后赋值给模式串指针j，这在实现上就会比较麻烦，所以我们首先将next数组的所有值往右移动一位，然后再加1，得到一个新的next数组，这个数组里的元素 next[j] 表示当我们在第j个位置匹配失败时，我们的指针j应该移动到模式串的next[j]个位置重新与主串指针i 进行比较，拿上面 ‘ababa’ 的next数组举例：

看到这里可能有读者会问，我们在原始的next数组中将所有的PM值向右移动一位时最右边的PM值就因溢出而被舍弃了，这样不会有什么问题吗？这里主要是因为，第j个位置的PM值是当j+1个位置匹配失败时才需要派上用场，而例子中的模式串总共就五个字符，所以不存在第6个字符匹配失败，自然j=5对应的PM也就没有存在的意义了。

至此，我们已经详细地说明了KMP算法流程、next数组在模式串"移动"过程中所起的作用、原理、以及如何生成一个我们想要的简洁明了方便代码实现的next数组，下面要讲的才是本文的重难点，估计也是全文最难理解的地方，即如何推导next数组的一般式。我们从本文一开始到现在，对于next数组都是手动计算，却从来没有思考过如何用计算机来实现这一过程，那下面的部分就会着重探讨如何推导next数组的一般式~

在上述的分析中其实我们已经看过了三种情况，分别是：

在主串指针i 与模式串指针j 所指向的字符匹配失败之前，主串模式串已经存在匹配成功的子串，而且这部分子串有相等的前后缀，比如第一次匹配，此时next[j] （在第一次匹配中是next[5]应该是2+1=3）应该为已匹配子串的部分匹配值+1。（忘记定义的读者可以回去看看部分匹配值的定义）

第二种情况便于第一种情况类似，只不过已匹配子串部分没有相等的前后缀，比如第二次匹配，这时我们不需要去计算什么PM值，只需要让next[j]=1便可。（在第二次匹配中是next[3]=1）

第三种情况便是模式串从第一个字符就与主串匹配失败了，这时我们让next[j]=0，之后再让i++, j++，以使主串指针i和模式串指针j同时往前进一位。比如第三次匹配：

这里之所以让next[j]=0，让j指向next[j]，之后再进行i++和j++只是为了实现起来方便而已。本质上第一次匹配就失败的话，模式串指针仍然是指向第一个字符的。

相信到这一步，读者对上面的next数组可能存在的三种情况都有所了解了，那么我们可以进一步来总结next数组存在的形式，先来探讨第一种情况：
$设主串为S_1S_2...S_n，模式串为P_1P_2...P_m，当主串指针i和模式串指针j所指字符匹配失败时，\\设存在\{k\}\in(1,j)使得'P_1P_2...P_{k-1}' = 'p_{j-k+1}P_{j-k+2}...P_{j-1}'\\则next[j]=max\{k\}$
上面的定义应该没啥问题吧，意思其实就是当主串与模式串在第j个字符匹配失败时，如果是第一种情况的话，已匹配字符串中可能存在若干对前后缀相等的子串，此时我们把前后缀相等的最长长度作为我们的PM值，并通过之前提到的PM+1计算得到的K作为我们的next[j]。

那下面两种情况就更好说了，如果是第三种情况，我们直接让next[j]=0；其他的就让next[j]=1，即模式串指针指向模式串第一个字符，总结来说有下面这个表达式：
$next[j]=\left\{ \begin{aligned} & 0 , & j=1 &\\ & max\{k\}, & 当\{k\}中元素不为0也不为空 \\ & 1， & 其他情况 \end{aligned} \right.$
由上面这个式子我们知道next数组其实是一个关于j的函数，它所代表的意思是当模式串的第j个字符与主串匹配失败时，我们应让模式串指针j移动到哪一个位置进行下一次比对。但是我们最终想做的不是仅仅得到这个表达式，而是找到一种可以推导next[j]的值的算法。接下来的部分，我们会试着来推导这样一种计算next[j]的算法。

当j=1的时候，next[1]=0，这我们在上面提过了，因为在第一次匹配就失败的情况下，我们需要让主串指针i向前移动一位，并且保持模式串指针仍指向第一个字符。

当j=2的时候，即模式串与主串在第二个字符就匹配失败了，那已匹配成功的只有一个字符，一个字符是没有前后缀自然就没有PM了，所以此时next[2]=1。

那么再然后呢？

我们来换一个思路，与其从j=1,2,3…… 一个一个求值，不如直接假设我们已知next[j]的值，现在的问题是求解next[j+1]为多少？

令next[j]=k，则k表示当模式串与主串在模式串的第j个字符匹配失败后应将k赋值给模式串指针j，即令j=k，然后再用j和主串指针i进行下一轮的匹配。由图可知，此时子串 $P_1 ……P_{k-1}$ 与 $P_{j-k+1}……P_{j-1}$ 是相等的，且长度都为k-1。

那当我们想求next[j+1]时候，我们面临两种情况：

如果此时 $P_J=P_K$ 的话，那我们直接让next[j+1]=next[j]+1就可以了，这是最理想的一种情况。

如果 $P_J\not=P_K$ 的话，那么我们需要做的就是在中 $P_1 ……P_{k}$ 寻找一个长度更短的前缀 $P_1 ……P_{k'}$ 去和 $P_{j-k+1}……P_j$ 的后缀匹配上，从而我们可以令 $n e x t [j + 1] = k^{'} + 1$ 。那寻找这样一个符合条件的前缀可以不停地让 $P_1 ……P_k$ 向右移动并观察是否存在一个 $P_1 ……P_k'$ 可以和 $P_{j-k'+1}……P_j$ 匹配上，但这样的一种操作方式仿佛又回到了暴力匹配的年代…

再仔细想一想，我们是否可以把找寻一个 $P_1 ……P_{k'}$ 和 $P_{j-k'+1}……P_j$ 匹配上的问题转换成一个模式匹配的问题？我们此时面临的问题就是 $P_k$ 与 $P_j$ 不相等，那么我们可以通过令 $k^{'} = n e x t [k]$ 来让 $P_1……P_{k'-1}$ 与 $P_{j-k'+1}……P_{j-1}$ 对齐，并比较 $P_{k'}$ 与 $P_{j}$ 是否相等，若相等，则我们让 $n e x t [j + 1] = k^{'} + 1$ 即可。(之所以可以这么做是因为 $P_1……P_{k'-1}$ 与 $P_1……P_{k-1}$ 相等，而 $P_1……P_{k-1}$ 与 $P_{j-k'+1}……P_{j-1}$ 相等。)

若 $P_{k'}$ 与 $P_{j}$ 仍不相等，则我们继续令 $k^{'} = n e x t [k^{'}] = n e x t [n e x t [k]]$ 并且继续判断 $P_{k'}$ 是否等于 $P_j$ 。那到了最后就一定会出现一个k’使得 $P_{k'}$ 等于 $P_j$ 吗，那也不一定…如果不存在这样一个k’时，我们会直接让 $n e x t [j + 1] = 1$ 。至今为止，我们就彻底地将next数组推导的过程给讲明白啦~ 下面给一段C++的代码实现，逻辑已经在上面讲得很清楚了，相信代码阅读起来没有什么特别大的障碍。

//本文定义字符串的方式是设定一个字符串结构，如下：
#define MAXLEN 255 //这个数可以是任意的
typedef struct{
     
    char ch[MAXLEN];
    int length; //串的实际长度
}SString;

//如何求模式串的next数组？
void get_next{
     SString T, int next[]}{
     
    int i=1, j=0;
    next[1]=0;
    while(i<T.length){
     
        if(j==0||T.ch[i]==T.ch[j]){
     
            i++;
            j++;
            next[i]=j;
        }
        else
            j=next[j];
    }
    
}

上面这段求next数组通式的代码在第一次看肯定会有很多疑问，所以我用上面的 $^{'} a b a b a^{'}$ 这个例子画了一张步骤图，大家可以对照着这张图来阅读这段代码，相信可以帮助你减少更多理解的时间。

//KMP算法如何实现？
int Index_KMP(SString S, SString T, int next[]){
     
    int i=1, j=1;
    while(i<=S.length&&j<=T.length){
     
        if(j==0||S.ch[i]==T.ch[j]){
     
            i++;
            j++;
        }
        else
            j=next[j];
    }
    if(j>T.length)
        return i-T.length;
    else
        return 0;
}

最后在结尾我们在提及一下如何改进KMP算法，已知若主串的 $S_i$ 与模式串的 $P_j$ 匹配失败后，接下来理应是 $S_i$ 与 $P_{next[j]}$ 进行比对，那如果此时出现一个情况就是 $P_{next[j]}=P_j$ ，那么这样的比对是没有意义的，所以要解决这个问题，我们只需要再next数组的推导中加一次判断即可，即若 $P_{next[j]}=P_j$ ，则继续让 $j = n e x t [j]$ ，直到 $P_{next[j]}\not=P_j$ 为止。

//我们将改进完的next数组称为nextval[]
void get_nextval(SString T, int nextval[]){
     
    int i=1, j=0;
    nextval[1]=0;
    while(i<T.length){
     
        if(j==0||T.ch[i]==T.ch[j]){
     
            i++;
            j++;
            if(T.ch[i]!=T.ch[j])
                nextval[i]=j;
            else
                nextval[i]=nextval[j];
        }
        else
            j=nextval[j];
    }
}

至此本文已接近尾声，KMP算法对初学者而言难度还是比较大的，主要是难在理解上，所以还需要反复地琢磨和理解，才可以真正弄懂这个算法的思想和实现方式。有什么问题欢迎评论区或者私信交流哦！

完~

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
排序路小白同学
1.冒泡排序冒泡算法是一种基础的排序算法，这种算法会重复的比较数组中相邻的两个元素。如果一个元素比另一个元素大（小），那么就交换这两个元素的位置。重复这一比较直至最后一个元素。这一比较会重复n-1趟，每一趟比较n-j次，j是已经排序好的元素个数。每一趟比较都能找出未排序元素中最大或者最小的那个数字。这就如同水泡从水底逐个飘到水面一样。冒泡排序是一种时间复杂度较高，效率较低的排序方法。其空间复杂度是
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

KMP算法背后的细节与难点

你可能感兴趣的:(数据结构与算法,算法)