Enjoying_Science

字符串专题算法

字符串：KMP Eentend-Kmp 自动机 trie图 trie树后缀树后缀数组

2009-09-25 00:00:40| 分类：算法与acm|举报|字号订阅

涉及到字符串的问题，无外乎这样一些算法和数据结构：自动机 KMP算法 Extend-KMP 后缀树后缀数组 trie树 trie图及其应用。当然这些都是比较高级的数据结构和算法，而这里面最常用和最熟悉的大概是kmp，即使如此还是有相当一部分人也不理解kmp，更别说其他的了。当然一般的字符串问题中，我们只要用简单的暴力算法就可以解决了，然后如果暴力效率太低，就用个hash。当然hash也是一个面试中经常被用到的方法。这样看来，这样的一些算法和数据结构实际上很少会被问到，不过如果使用它们一般可以得到很好的线性复杂度的算法。

老实说，我也一直觉得字符串问题挺复杂的，出来一个如果用暴力，hash搞不定，就很难再想其他的方法，当然有些可以用动态规划。不过为了解决这个老大难问题，还是仔细对这些算法和数据结构研读了一番。做个笔记，免得忘了还得重新思考老长时间。如果碰到字符串问题，也一般不会超过这些方法的范围了。先看一张图吧，主要说明下这些算法数据结构之间的关系。图中黄色部分主要写明了这些算法和数据结构的一些关键点。

图中可以看到这样一些关系：extend-kmp 是kmp的扩展；ac自动机是kmp的多串形式；它是一个有限自动机；而trie图实际上是一个确定性有限自动机；ac自动机，trie图，后缀树实际上都是一种trie；后缀数组和后缀树都是与字符串的后缀集合有关的数据结构；trie图中的后缀指针和后缀树中的后缀链接这两个概念及其一致。

下面我们来分别说明这些算法和数据结构，并对其涉及的关键问题进行分析和解释。

kmp

首先这个匹配算法，主要思想就是要充分利用上一次的匹配结果，找到匹配失败时，模式串可以向前移动的最大距离。这个最大距离，必须要保证不会错过可能的匹配位置，因此这个最大距离实际上就是模式串当前匹配位置的next数组值。也就是max{Aj 是 Pi 的后缀 j < i}，pi表示字符串A[1...i],Aj表示A[1...j]。模式串的next数组计算则是一个自匹配的过程。也是利用已有值next[1...i-1]计算next[i]的过程。我们可以看到，如果A[i] = A[next[i-1]+1] 那么next[i] = next[i-1]，否则，就可以将模式串继续前移了。
整个过程是这样的：
void next_comp(char * str){
   int next[N+1];
   int k = 0;
   next[1] = 0;
   //循环不变性，每次循环的开始，k = next[i-1]
   for(int i = 2 ; i <= N ; i++){
      //如果当前位置不匹配，或者还推进到字符串开始，则继续推进
      while(A[k+1] != A[i] && k != 0){
           k = next[k];
      }
      if(A[k+1] == A[i]) k++;
      next[i] = k;
   }
}
复杂度分析：从上面的过程可以看出，内部循环再不断的执行k = next[k]，而这个值必然是在缩小，也就是是没执行一次k至少减少1；另一方面k的初值是0，而最多++ N次，而k始终保持非负，很明显减少的不可能大于增加的那些，所以整个过程的复杂度是O(N)。

上面是next数组的计算过程，而整个kmp的匹配过程与此类似。

extend-kmp

为什么叫做扩展-kmp呢，首先我们看它计算的内容，它是要求出字符串B的后缀与字符串A的最长公共前缀。extend[i]表示B[i...B_len] 与A的最长公共前缀长度，也就是要计算这个数组。

观察这个数组可以知道，kmp可以判断A是否是B的一个子串，并且找到第一个匹配位置？而对于extend[]数组来说，则可以利用它直接解决匹配问题，只要看extend[]数组元素是否有一个等于len_A即可。显然这个数组保存了更多更丰富的信息，即B的每个位置与A的匹配长度。

计算这个数组extend也采用了于kmp类似的过程。首先也是需要计算字符串A与自身后缀的最长公共前缀长度。我们设为next[]数组。当然这里next数组的含义与kmp里的有所过程。但它的计算，也是利用了已经计算出来的next[1...i-1]来找到next[i]的大小，整体的思路是一样的。

具体是这样的：观察下图可以发现

首先在1...i-1,要找到一个k，使得它满足k+next[k]-1最大，也就是说，让k加上next[k]长度尽量长。

实际上下面的证明过程中就是利用了每次计算后k+next[k]始终只增不减，而它很明显有个上界，来证明整个计算过程复杂度是线性的。如下图所示，假设我们已经找到这样的k，然后看怎么计算next[i]的值。设len = k+next[k]-1(图中我们用Ak代表next[k]),分情况讨论：

如果len < i 也就是说，len的长度还未覆盖到Ai,这样我们只要从头开始比较A[i...n]与A的最长公共前缀即可，这种情况下很明显的，每比较一次，必然就会让i+next[i]-1增加一.
如果len >= i,就是我们在图中表达的情形，这时我们可以看到i这个位置现在等于i-k+1这个位置的元素，这样又分两种情况
如果 L = next[i-k+1] >= len-i+1,也就是说L处在第二条虚线的位置，这样我们可以看到next[i]的大小，至少是len-i+1,然后我们再从此处开始比较后面的还能否匹配，显然如果多比较一次，也会让i+A[i]-1多增加1.
如果 L < len-i+1 也就是说L处在第一条虚线位置，我们知道A与Ak在这个位置匹配，但Ak与Ai-k+1在这个位置不匹配，显然A与与Ai-k+1在这个位置也不会匹配，故next[i]的值就是L。

这样next[i]的值就被计算出来了，从上面的过程中我们可以看到，next[i]要么可以直接由k这个位置计算出来，要么需要在逐个比较，但是如果需要比较，则每次比较会让k+next[k]-1的最大值加1.而整个过程中这个值只增不减，而且它有一个很明显的上界k+next[k]-1 < 2*len_A,可见比较的次数要被限制到这个数值之内，因此总的复杂度将是O(N)的。

trie树

首先trie树实际上就是一些字符串组成的一个字符查找树，边由代表组成字符串的字符代表，这样我们就可以在O(len(str))时间里判断某个字符串是否属于该集合。trie树的节点内分支可以用链表也可以用数组实现，各有优劣。

简单的trie树每条边由一个字符代表，但是为了节省空间，可以让边代表一段字符，这就是trie的压缩表示。通过压缩表示可以使得trie的空间复杂度与单词节点数目成正比。

AC自动机

ac自动机，可以看成是kmp在多字符串情况下扩展形式，可以用来处理多模式串匹配。只要为这些模式串建立一个trie树，然后再为每个节点建立一个失败指针，也就是类似与kmp的next函数，让我们知道如果匹配失败，可以再从哪个位置重新开始匹配。ac实际上两个人的名字的首字母，Aho-Corasick。

应该还记得，在kmp构造next数组时，我们是从前往后构造，即先构造1...i-1，然后再利用它们计算next[i],这里也是类似。不过这个先后，是通过bfs的顺序来体现的。AC自动机的失败指针具有同样的功能，也就是说当我们的模式串在Tire上进行匹配时，如果与当前节点的关键字不能继续匹配的时候，就应该去当前节点的失败指针所指向的节点继续进行匹配。而从根到这个失败指针指向的节点组成的字符串，实际上就是跟当前节点的后缀的匹配最长的字符串。

过程如下：

--------------引用：AC(Aho-Corasick)自动机算法http://hi.baidu.com/luyade1987/blog/item/5ba280828dcb9eb96d811972.html

如同KMP中模式串得自我匹配一样.从根节点开始,对于每个结点:设该结点上得字符为k,沿着其父亲结点得失败指针走,直到到达根节点或者当前失败指针结点也存在字符为k得儿子结点,
那么前一种情况当然是把失败指针设为根节点,而后一种情况则设为当前失败指针结点得字符为k得儿子结点.

我们也可以动手操作一下，如果我们的ac自动机只包含一个模式串，这个过程实际上就是kmp的计算过程。

接下来要做的就是进行文本匹配:
首先，Trie-(模式串集合)中有一个指针p1指向root,而文本串中有一个指针p2指向串头。下面的操作和KMP很类似：如果设k为p2指向的字母 ,而在Trie中p1指向的节点存在字符为k的儿子，那么p2++,p1

则改为指向那个字符为k的儿子,否则p1顺着当前节点的失败指针向上找，直到p1存在一个字符为k的儿子,或者p1指向根结点。如果p1路过一个标记为模式串终点的结点，那么以这个点为终点的的模式
串就已经匹配过了.或者如果p1所在的点可以顺着失败指针走到一个模式串的终结结点，那么以那个结点结尾的模式串也已经匹配过了。
在下面的链接中可以找到相关的资料:
www.cs.uku.fi/~kilpelai/BSA05/lectures/slides04.pdf

主要是根据模式串构造三个函数goto fail和output.

q := 0; // initial state (root)
for i := 1 to m do
while g(q, T[i]) = 0 do
q := f(q); // follow a fail
q := g(q, T[i]); // follow a goto
if out(q) != 0; then print i, out(q);
endfor;
-----------------------------------------引用结束-------------------------------------------------------------------------------------------
以ababa为例，我们可以得到它的kmp next数组值为 0 0 1 2 3,ac自动机和trie图如下：

trie图

trie图实际上一个确定性自动机，比ac增加了确定性这个属性，对于ac自动机来说，当碰到一个不匹配的节点后可能要进行好几次回溯才能进行下一次匹配。但是对于trie图来说，可以每一步进行一次匹配，每碰到一个输入字符都有一个确定的状态节点。

从上面的图中我们也可以看到trie图的后缀节点跟ac自动机的后缀指针基本一致，区别在于trie图的根添加了了所有字符集的边。另外trie图还会为每个节点补上所有字符集中的字符的边，而这个补边的过程实际上也是一个求节点的后缀节点的过程，不过这些节点都是虚的，我们不把它们加到图中，而是找到它们的等价节点即它们的后缀节点，从而让这些边指向后缀节点就可以了。(比如上图中的黑节点c，它实际上并未出现在我们的初始tire里，但我们可以把它作为一个虚节点处理，把指向它的边指向它的后缀节点)

trie图主要利用两个概念实现这种目的。一个是后缀节点，也就是每个节点的路径字符串去掉第一个字符后的字符串对应的节点。计算这个节点的方法，是通过它父亲节点的后缀节点，很明显它父亲的后缀节点与它的后缀节点的区别就是还少一个尾字符，设为c。所以节点的父节点的指针的c孩子就是该节点的后缀节点。但是因为有时候它父亲不一定有c孩子，所以还得找一个与父亲的c孩子等价的节点。于是就碰到一个寻找等价节点的问题。

而trie图还有一个补边的操作，不存在的那个字符对应的边指向的节点实际上可以看成一个虚节点，我们要找一个现有的并且与它等价的节点，将这个边指向它。这样也实际上是要寻找等价节点。

我们看怎么找到一个节点的等价节点，我们所谓的等价是指它们的危险性一致。那我们再看一个节点是危险节点的充要条件是：它的路径字符串本身就是一个危险单词，或者它的路径字符串的后缀对应的节点是一个危险节点。因此我们可以看到，如果这个节点对应的路径字符串本身不是一个危险单词，那它就与它的后缀节点是等价的。所以我们补边的时候，实际指向的是节点的后缀节点就可以了。

trie图实际上对trie树进行了改进，添加了额外的信息。使得可以利用它方便的解决多模式串的匹配问题。跟kmp的思想一样，trie图也是希望利用现在已经匹配的信息，对未来的匹配提出指导。提出了一些新的概念。定义trie树上，从根到某个节点的路径上所有边上的字符连起来形成的字符串称为这个节点的路径字符串。如果某个节点的路径字符串以一个危险字符串结尾，那么这个节点就是危险节点：也就是说如果到达这个点代表是匹配的状态；否则就是安全节点。那么如何判断某个节点是否危险呢？

根节点显然是安全节点。一个节点是危险节点的充要条件是：它的路径字符串本身就是一个危险单词，或者它的路径字符串的后缀(这里特指一个字符串去掉第一个字符后剩余的部分)对应的节点(一个字符串对应的节点，是指从trie图中的根节点开始，依次沿某个字符指定的边到达的节点)是一个危险节点。

那么如何求每一个节点的后缀节点呢？这里就可以里利用以前的计算信息，得到了。具体来说就是利用父亲节点的后缀节点，我们只要记住当前节点的最后一个字符设为C，那么父亲节点的后缀节点的C分支节点就是要求的后缀节点了。首先我们限定，根节点的后缀节点是根本身，第一层节点的后缀节点是根节点。这样我们可以逐层求出所有节点的后缀节点。但是这个过程中，可能出现一个问题：父亲节点的后缀节点可能没有c分支。这时候该怎么办呢？

如下图所示如果设当前节点的父亲节点的后缀节点为w，我们假设w具有c孩子为，我们可以看到对于w的整个c子树来说，因为根本不存在通向它们的边c，它们也就不可能是不良字符串，这样这些节点的危险性也就等价与它们的后缀节点的危险性了，而它们的后缀节点，实际上就是w的后缀节点的c孩子，如此回溯下去，最后就能找到。

--------------------引用：http://huangwei.host7.meyu.net/?paged=7

其实Trie图所起到的作用就是建立一个确定性有限自动机DFA，图中的每点都是一个状态，状态之间的转换用有向边来表示。Trie图是在Tire的基础上补边过来的，其实他应该算是AC自动机的衍生，AC自动机只保存其后缀节点，在使用时再利用后缀节点进行跳转，并一直迭代到找到相应的状态转移为止，这个应该算是KMP的思想。这篇文章可以参考。

而Trie图直接将AC自动机在状态转移计算后的值保存在当前节点，使得不必再对后缀节点进行迭代。所以Trie图的每个节点都会有|∑|个状态转移（∑指字符集）。构造具体方法可见WC2006《Trie图的构建、活用与改进》。我简单叙述下流程：
（1）构建Trie，并保证根节点一定有|∑|个儿子。
（2）层次遍历Trie，计算后缀节点，节点标记，没有|∑|个儿子的对其进行补边。
后缀节点的计算：
（1）根结点的后缀节点是它本身。
（2）处于Trie树第二层的节点的后缀结点也是根结点。
（3）其余节点的后缀节点，是其父节点的后缀节点中有相应状态转移的节点（这里类似AC自动机的迭代过程）。
节点标记：
（1）本身就有标记。
（2）其后缀节点有标记。
补边：
用其后缀节点相应的状态转移来填补当前节点的空白。
最后Trie图中任意一个节点均有相应的状态转移，我们就用这个状态转移做动态规划。
设dp[i][j]表示第i个状态产生j个字符时，与DNA序列最小的改变值。
假设Tire图中根节点是0，则初始化dp[0][0]=1。
其后，对图进行BFS遍历，可知处于第j层时，就说明以产生了j长度的字符串。
dp[0][0] = 1;for i = 1 to m do for 图中每条边(s1,ch,s2) do dp[s2][i] = min{dp[s1][i-1] + (txt[i-1] != ch)}; for 图中每个结点x do ans = min{dp[x][m]};

-----------------------------------------------引用结束-----------------------------------------------------------------------------------

后缀树

后缀树，实际上就是字符串的所有后缀组成的字符串集合构成的trie树。如果采用不压缩方式的trie存储，这样整个内部节点和外部节点的总和就可能达到O(n^2).所以不能利用这种存储方式，因为如果采用它那么构建的复杂度下界就是O(n^2)，不会再低了。所以必须使用压缩方式，才有可能降到O(n)。

构建之前，我们首先给字符串加上一个未在字符串中出现过的单词，比如"$",为什么这样做呢？是为了避免后缀节点出现在内部，如果我们加上"$"，很明显就不会有后缀出现在内部了，可以用反证法证明：假设出现了一个这样的后缀是内部节点，那么意味着这条字符串路径上会有两个"$",但这是不可能的，因为我们的"$"只在结尾出现，之前没有出现过。

构建过程中，我们看如果采用普通的构建过程是怎样的？普通的构建，假设字符串为A[1....N],我们从以A[1]开头的后缀开始插入trie树，插入的时候，逐步比对，直到找到不匹配的分支，在这个节点将原来的节点分裂，并加入这个新的节点。可以这个过程关键是寻找，之前sufix[1]...sufix[i-1]这些已经插入的字符串与sufix[i]的最长公共前缀。之后插入的时间O(1)就可以完成，因此主要的时间花在这个最长公共前缀(称为head[i])的寻找上。Headi是W(i,n)和W(j,n)的最长公共前缀，其中j是小于i的任意正整数，Taili使得Headi + Taili = W(i,n)。

那我们看到现在关键是这个最长公共前缀head[i]的计算了。我们再次考虑如何利用head[1]...head[i-1]来计算head[i],为加快寻找hi的速度我们需要使用辅助结构——后缀链接。

后缀链接的定义（McCreight Arithmetic）：
令Head[i-1] = az，其中a是字符串W的第i-1位字符。由于z在范围i内出现过至少两次(因为az也是A[i-1...N]与之前某后缀的最长公共前缀，也就是说另外的那个后缀也是一az开头的一个串，这样就意味着它的后继者，就比然是以z为前缀的，这样A[i...N]与它的公共前缀就是z。{实际上这个性质在我们计算后缀数组的lcp时也会利用到})，所以一定有|Head[i]| >= |z|，z是Head[i]的前缀。所谓hi-1的后缀链接（Suffix Link）实际是由hi-1指向z对应节点d的指针Link h[i-1]。当然，z有可能是空串，此时Link hi-1由hi-1指向根节点Root。

和前面 ac自动机的失败指针 trie树的后缀指针比较，我们可以发现这里的z它刚好就是head[i-1]去掉第一个字符后的那个后缀，所谓的后缀链接，实际上是指向head[i]自身的后缀的链接，这个定义也就跟我们trie树里的后缀指针所指向的那个位置一致了。这样这个head[i]的后缀链接怎样建立就很清楚了。

创建方法：
1）根节点Root的后缀链接指向它自身
2）任何一个非叶节点的后缀链接都在该节点出现以后被立即创建

算法主框架如下：
For i = 1 -> n do
    步骤1、函数Find从Link hi-1开始向下搜索找到节点hi
    步骤2、增添叶子节点Leafi
    步骤3、函数Down创建hi的后缀链接Link hi
End for

后缀树性能分析：
接着刚才文本框内的伪代码来谈论。对于给定的i，步骤2的复杂度为O(1)，但由于无法确定Link hi-1到hi之间的节点个数，所以不能保证步骤1总是线性的。局部估算失败，不妨从整体入手。有一点是肯定的，那就是i + |Headi|总随着i的递增而递增。因此，W中的每个字符只会被Find函数遍历1次，总体复杂度是O(n)的。

这个分析就与extend-kmp的复杂度分析很类似了。

后缀数组

后缀数组实际上就是对字符串的后缀按照字典序进行排序，然后把排好序后的顺序放到一个数组sa[]里保存，数组元素代表了后缀在原串里的起始索引。通过这个我们可以很容易得到另一个数组rank[],rank[i]代表了原来的后缀A[i...N]在sa数组里的排名。

这个数据结构，主要涉及两个方面的内容，一个是如何快速的对这些后缀排序，有很多方法，这里只说明倍增算法，这个方法比较好理解，思路也比较巧妙。

还有就是后缀数组求出来后，如果要发挥比较强的作用，还需要求出各个后缀的最长公共前缀lcs。所以lcs的计算也是一个重点。

首先看排序，如果我们采用普通的排序算法，那么需要nlogn次比较，但是每次比较需要O(n),这样总的复杂度将是O(n*nlogn).

倍增算法是这样的,主要是第i次排序，比较时的大小时利用了第i-1次的排序结果，这样可以让比较在O(1)时间里完成：
我们首先对所有从原字符串各个位置开始的长度为1的字符进行排序，然后再对从这些位置开始的长度为2的排序，之后是长度为2^i的排序，直到2^i >= N.可以看到这中间，总共需要log N次排序。然后我们看第i次排序，比较大小时怎样利用了第i-1次的排序结果。

比如在第i次排序时，我们需要比较A[j]和A[k]开始的长度为2^i的串，那么我们可以将它们分成两块：
A[j]开始的长度为2^i的串 = A[j]开始的2^(i-1)长 + A[j+2^(i-1)]开始的2^(i-1)长
A[k]开始的长度为2^i的串 = A[k]开始的2^(i-1)长 + A[k+2^(i-1)]开始的2^(i-1)长
要比较A[j]开始的长度为2^i的串和 A[k]开始的长度为2^i的串，我们只要先比较第一部分，如相等再比较第2部分，而这两部分大小因为之前已经排好序了，我们完全可以给它们一个rank值，只比较它们的rank值就可以得到大小关系，这样比较就可以在O(1)时间内完成了。另外如果我们的排序算法是O(n)的，这样整个算法的复杂度就是O(nlogn)的了。

再看lcs的计算，如果要计算任意两个后缀的lcs[i][j]，我们有一个结论：

设 i<j LCP(i,j)=min{LCP(k-1,k)|i+1 =< k <= j} LCP Theorem 这里的i，j指而是sa[i] sa[j]

如果要证明上面那个结论，首先要证明这个：对任意的 1=<i<j<k<=n, LCP(i,k)=min{LCP(i,j),LCP(j,k)}，这里不再证明。

上面那个结论实际上说：如果要找i j的最长公共前缀长度，只需要找到i j之间相邻后缀的最小lcs长度即可。这样我们只需要求出sa数组中相邻后缀的lcs长度，就转化成了一个rmq问题，即区间内的最小值问题。这个可以O(1)解决。这样问题就变成：如何在O(n)时间里，计算sa数组中相邻后缀的lcs长度。

这个问题如果要O(n)，又利用了下面这样一个结论：定义一个一维数组 height，令height[i]=LCP(i-1,i) 1<i<=n 并设 height[1]=0。如何尽量高效的算出height数组呢？

为了描述方便，设h[i]=height[Rank[i]]，即height[i]=h[SA[i]]，而h数组满足一个性质：

对于 i>1 且 Rank[i]>1 一定有 h[i] >= h[i-1]-1.

为什么会有这个结论呢？实际上就与上面后缀树的后缀链接那部分提到的想呼应了。h[i]=height[Rank[i]],实际上就是我们的原来的后缀A[i...N]与某个串的最长公共前缀，而h[i-1]就是A[i-1...N]与某个串的最长公共前缀。而我们可以看到如果把A[i-1...N]去掉第一个字符后，就变成了A[i...N]，我们假设A[i-1...N]相邻的那个后缀串是XYYYYYY，在这里它们的lcs长度是h[i]。后缀串XYYYYYY，去掉x之后就是YYYYYYY,这样如果没有比它更接近A[i...N]的,那么h[i]=h[i-1]-1,如果A[i...N]的邻居不是它，那么h[i]只可能比h[i-1]-1大不可能比它小。

这样利用这个结论，我们在O(n)时间内就可以把h[i]计算出来了。因为h[i]最大不超过N，而它每次最多减少不超过1.

计算出来之后，再根据height[i]=h[SA[i]]，就可以计算出height数组，这样就求出了sa中相邻后缀的lcs长度。

总结：
实际上我们可以看到上面的算法思想，都有一个共同点：利用已经得到的计算结果得到下一次计算的结果，尽量利用现有信息，减少计算量。
转载请注明作者：phylips@bmy 出处：http://duanple.blog.163.com/blog/static/709717672009825004092/

你可能感兴趣的:(数据结构,算法,字符串,ACM)

数据结构之链表完全解析：从原理到实战应用
一、链表的核心概念1.链表的定义链表（LinkedList）是一种通过指针连接节点的线性数据结构。每个节点包含两部分：数据域：存储具体数据（如整数、字符串等）。指针域：存储指向其他节点的地址（单链表仅含next，双向链表包含prev和next）。链表的逻辑结构是连续的，但物理存储是离散的，节点之间通过指针动态连接，无需预先分配连续内存空间。2.链表的优势与劣势优势：动态扩展：无需预分配内存，适合数
【Qt】QString字符串编码格式与数据转换漫步企鹅 qt QString char
QString提供了多种静态方法用于将不同编码格式的原始数据转换为QString对象。以下是常用方法的全面对比：1.fromLatin1(constchar*str,intsize=-1)功能：将Latin-1（ISO8859-1）编码的C字符串转换为QString。输入类型：单字节字符集（每个字节直接映射到Unicode的前256个码点）。适用场景：ASCII或ISO8859-1编码的文本，如西
PNG图像压缩优化工具丁金金_chihiro_修行 libpng PNG图像压缩优化工具
PNG图像压缩优化工具标题：PNG图像三重压缩优化系统介绍大纲1.工具概述基于libimagequant和libpng的高效PNG压缩工具提供三种不同级别的压缩算法支持保留透明度和色彩质量优化2.核心功能基础压缩(compress_png)：标准量化处理中等压缩率和处理速度适合大多数常规用途优化压缩(compress_png_optimized)：增强的量化参数设置更低的抖动级别更高的压缩级别(9
代码随想录算法训练营第34天 | 第九章动态规划 part07 tt555555555555 C++学习算法动态规划
文章目录第九章动态规划Part07198.打家劫舍213.打家劫舍II337.打家劫舍III第九章动态规划Part07今天是打家劫舍的一天，这个系列题目不算难，大家可以一口气拿下。198.打家劫舍视频讲解：https://www.bilibili.com/video/BV1Te411N7SX题解链接：https://programmercarl.com/0198.%E6%89%93%E5%AE%B
代码随想录算法训练营第四十三天|动态规划part10 xindafu 动态规划算法
300.最长递增子序列题目链接：代码随想录文章讲解：代码随想录错误解答：dp[i]表示前i个元素的最长递增子序列的长度classSolution{public:intlengthOfLIS(vector&nums){vectordp(nums.size(),0);dp[0]=1;intlastnum=nums[0];for(inti=1;ilastnum){lastnum=nums[i];dp[i
代码随想录算法训练营第四十四天|动态规划part11
1143.最长公共子序列题目链接：1143.最长公共子序列-力扣（LeetCode）文章讲解:代码随想录思路：其实就是求两个字符串的最长公共子序列的长度与公共子数组的区别是可以不连续，顺序对就可以状态转移方程不一样定义dp[i][j]表示text1的0到i-1与text2的0到j-1的最长公共子序列的长度text1[i-1]==text2[j-1]dp[i][j]=dp[i-1][j-1]+1否则
代码随想录算法训练营第四十五天|动态规划part12 xindafu 算法动态规划
115.不同的子序列题目链接：115.不同的子序列-力扣（LeetCode）文章讲解：代码随想录定义dp[i][j]表示s0-i-1与t0-j-1不同的子序列的个数以s=batgtgt=bag为例子s【4】！=t【3】所以dp[5][4]=dp[4][4]也就是不考虑s[4]继续往后s[5]==t[3]也就是s[5]跟t【3】配对上了batgt与bag配对的个数加上batgt与ba配对的个数dp[
代码随想录算法训练营第二十九天|贪心算法part3 xindafu 贪心算法算法
134.加油站题目链接：134.加油站-力扣（LeetCode）文章讲解：代码随想录classSolution{public:intcanCompleteCircuit(vector&gas,vector&cost){vectordiff;for(inti=0;i=0){startindex=i;}sum+=diff[i];if(sum&ratings){intsize=ratings.size(
代码随想录算法训练营第三十七天|动态规划part4
1049.最后一块石头的重量II题目链接：1049.最后一块石头的重量II-力扣（LeetCode）文章讲解：代码随想录思路：理解为把石头分成两堆使得两堆的差值尽可能小求这个最小值1理解为往背包里装物品每个物品的重量为石头的重量价值也为石头的价值dp[i][j]表示从0-i块石头往容量为j的包里装的最大价值状态转移：dp[i][j]=max(dp[i-1][j],dp[i-1][j-cost[i]
代码随想录算法训练营第二十八天|贪心算法part2 xindafu 贪心算法算法
122.买卖股票的最佳时机II题目链接：122.买卖股票的最佳时机II-力扣（LeetCode）文章讲解：代码随想录思路：这道题的思路很巧妙最终利润是可以分解的假如第0天买入，第3天卖出，那么利润为：prices[3]-prices[0]。相当于(prices[3]-prices[2])+(prices[2]-prices[1])+(prices[1]-prices[0])。此时就是把利润分解为每
spring boot + caffeine使用月光一族吖 spring boot spring java
一、Caffeine缓存背景Caffeine是一个高性能、可扩展的Java缓存库，由Google的BenManes开发。Caffeine基于ConcurrentHashMap设计，采用了近似LRU（LeastRecentlyUsed，最近最少使用）算法，以实现高速缓存淘汰策略。Caffeine广泛应用于各类Java项目中，作为一种提高数据读取性能的优秀解决方案。二、Caffeine缓存优点与缺点优
代码随想录算法训练营第四十六天 | 动态规划 part13 sagen aller 算法动态规划
647.回文子串classSolution{public:intcountSubstrings(strings){vector>dp(s.size(),vector(s.size(),false));intresult=0;for(inti=s.size()-1;i>=0;i--){for(intj=i;j=j-1){dp[i][j]=true;result++;}elseif(dp[i+1][j
PID算法的一点改进思路
在PID算法里面有三个系数Kp,Ki,Kd;其中Kp是比例常数，Ki是积分常数，Kd是微分常数。Kp比例常数可以控制被控制量变化速度，越大控制越快但是越容易引发系统震荡，越小控制又比较慢；Ki比例常数是控制稳态误差（系统稳态的时候控制量不一定等于设置量）；Kd比例常数可预测控制量变化趋势。图是蛋糕达人的。从积分的数学理解上可以知道系统稳态的时候红色部分面积与蓝色部分面积应该相等，但是系统从一开始并
代码随想录算法训练营第四十六天|动态规划part13 xindafu 算法动态规划
647.回文子串题目链接：647.回文子串-力扣（LeetCode）文章讲解：代码随想录思路：以dp【i】表示以s【i】结尾的回文子串的个数，发现递推公式推导不出来此路·不通以dp【i】【j】表示s【i】到s【j】的回文子串的个数，递推公式也推不出正确dp【i】【j】表示s【i】到s【j】是否为回文串确定递归顺序：dp【i】【j】依赖于dp【i+1】【j-1】因此i从后往前遍历，j从前往后遍历则最
编程范式思想
编程范式发展历程现代软件架构设计经历了从面向过程到面向对象，再到领域驱动设计的演进过程：POP(面向过程)→OOP(面向对象)→DDD(领域驱动设计)↓↓↓函数为中心对象为中心业务领域为中心1.POP-Procedure-OrientedProgramming（面向过程编程）核心思想：以过程和函数为中心组织代码特点：全局数据共享、自顶向下设计、线性执行流程适用场景：简单算法、数学计算、系统工具程序
mysql索引的底层原理是什么？如何回答？周勇政 mysql 数据库 java
MySQL索引的底层原理是数据库面试中的高频问题，以下是通俗易懂的回答框架：1.索引的本质（用类比解释）类比：数据库索引就像书的目录，它不会改变书的内容，但可以让你快速定位到具体章节，而不需要逐页翻书。关键点：索引是一种数据结构（如B+树），存储了表中某些列的值和对应的行地址索引本身会占用存储空间，但能显著提升查询速度类比书架分类法：按书名首字母排序比乱序查找更快2.B+树结构（重点解释）类比：多
Softhub软件下载站实战开发（十）：实现图片视频上传下载接口叹一曲当时只道是寻常 softHub golang go 音视频
文章目录Softhub软件下载站实战开发（十）：实现图片视频上传下载接口️系统架构图核心功能设计️1.文件上传流程2.关键技术实现2.1雪花算法2.2文件校验机制✅2.3文件去重机制2.4视频封面提取️2.5文件存储策略2.6视频上传示例3.文件查看实现⬇️Softhub软件下载站实战开发（十）：实现图片视频上传下载接口️在上一篇文章中，我们实现了软件配置面板，实现了ai配置信息的存储，为后续富文
Java 多行字符串小莫分享 JAVA java
1.概览现在Java15已经发布，我们可以使用新的原生功能称为文本块（TextBlocks）。2.文本块我们可以使用文本块通过用"""（三个双引号）声明字符串：publicStringtextBlocks(){ return""" Getbusyliving or getbusydying. --StephenKing""";}这无疑是
路径规划算法---A* 算法详解：最优路径规划的启发式之王 HR Zhou 路径规划算法算法路径规划 A算法图搜索算法
A*（A-Star）算法是最常用、最实用的路径规划算法之一。它结合了Dijkstra算法的最短路径保证与启发式搜索的高效性，是自动驾驶、机器人、游戏AI等领域的“黄金标准”。一、A*是什么？A*是一种启发式图搜索算法，用于在图中寻找从起点到目标的最短路径。它兼顾两件事：已经走过的真实代价（走了多远）到目标的预计距离（还有多远）并通过一个公式综合评估下一步该往哪走。二、核心思想公式f(n)=g(n)
C 安全函数 AI老李 C语言 c语言安全网络
关键要点研究表明，C安全函数是C11标准引入的函数，旨在提高代码安全性，特别是在防止缓冲区溢出方面。证据显示，这些函数通过增加缓冲区大小检查和返回错误码，提供比传统函数更安全的操作。它似乎很可能在字符串和内存操作中广泛应用，如strcpy_s和memcpy_s。什么是C安全函数？C安全函数是C11标准（AnnexK）引入的一组函数，旨在增强C语言程序的安全性，特别是在处理字符串和内存操作时防止缓冲
【加解密与C】HASH系列(三）SM3 阿捏利加解密与C 哈希算法 c语言算法 SM3
SM3算法简介SM3是中国国家密码管理局发布的密码杂凑算法标准，属于商用密码体系中的哈希算法。其输出为256位（32字节）固定长度的哈希值，安全性对标国际通用的SHA-256，但设计更注重抗碰撞性和效率，适用于数字签名、消息认证等场景。SM3算法特点输出长度：256位。分组处理：输入消息按512位分组处理。填充规则：采用Merkle-Damgård结构，填充方式与SHA-256类似（附加比特"1"
【加解密与C】对称加密(三)3DES 阿捏利加解密与C 算法 3DES c语言
3DES概述3DES（TripleDataEncryptionStandard）是DES算法的加强版本，通过三次DES加密提升安全性。由于DES的56位密钥易受暴力破解，3DES采用两或三个不同的密钥进行多次加密，有效增加密钥长度至112或168位，兼顾兼容性和安全性。加密模式3DES支持多种加密模式，常见以下两种：EDE模式（Encrypt-Decrypt-Encrypt）使用三个不同密钥（K1
深度解析AI搜索营销：以杭州玖叁鹿为例网络营销测评新浪微博微信开闭原则百度音视频
深度解析AI搜索营销：以杭州玖叁鹿为例在数字化时代，AI搜索营销已成为企业获取流量、提升品牌知名度与实现商业增长的关键驱动力。搜索引擎算法的不断进化，使得传统营销手段逐渐式微，而AI技术的融入为搜索营销带来了革命性的变革。本文将深入探讨AI搜索营销的核心原理、关键技术，并结合杭州玖叁鹿数字传媒的实战案例，为企业提供可落地的策略与方法，助力其在竞争激烈的市场中脱颖而出。AI搜索营销的核心原理AI搜索
Deepoc光电研发垂直大模型的技术实现突破与核心模块 Deepoch 无人机人工智能科技 ai
一、模型架构与算法创新领域专用混合架构设计多模态Transformer扩展：在标准Transformer架构基础上，引入光子器件特性感知模块（如非线性光学参数编码器），支持光路拓扑结构与电磁场分布的联合建模，解决传统电芯片架构无法模拟光子干涉效应的难题。量子-光电混合计算层：通过量子线路模拟光子量子态演化，结合经典计算层优化参数搜索空间，实现NP难问题（如光子芯片布线优化）的指数级加速。物理约束的
机器学习算法_支持向量机
一、支持向量机支持向量机只能做二分类任务SVM全称支持向量机，即寻找到一个超平面使样本分成两类，且间隔最大硬间隔：如果样本线性可分，在所有样本分类都正确的情况下，寻找最大间隔；如果出现异常值或样本线性不可分，此时硬间隔无法实现软间隔：允许部分样本，在最大间隔之内，甚至在错误的一边，寻找最大间隔；目标是尽可能保持间隔宽阔和限制间隔违例之间寻找良好的平衡惩罚系数：通过惩罚系数来控制这个平衡，C值越小，
警惕 Rust 字符串的性能陷阱：`chars().nth()` 的深坑与高效之道蜗牛沐雨 rust 开发语言后端
在Rust中处理字符串时，我们经常会用到&str类型及其提供的方法。当你需要按字符遍历或访问字符串时，chars()方法是你的得力助手。然而，一个看似无害的代码片段——self.source.chars().nth(self.index).unwrap()——却可能在你毫无察觉的情况下，让你的程序性能急剧下降，尤其是在处理长字符串时。这听起来有些令人惊讶，nth方法听起来应该很快，对吧？它确实很快
3、无重复字符的最长子串椎名ひる #滑动窗口 leetcode leetcode 算法
题目：解答：划窗。创建哈希表来存储字母出现个数。两个指针left、right来表示窗口前后边界。遍历右指针，每次将右指针的字符对应的哈希表value++。然后判断该key的value是否大于1，如果大于1意味着有重复字符了，将左指针右移弹出一个字符，该字符的value--，重复这个步骤直到right指向的字符的value为1，即是该right边界的最大可能字符串。然后更新ans，ans=max(a
力扣 hot100 Day24
240.搜索二维矩阵II编写一个高效的算法来搜索mxn矩阵matrix中的一个目标值target。该矩阵具有以下特性：每行的元素从左到右升序排列。每列的元素从上到下升序排列。//看提示写的classSolution{public:boolsearchMatrix(vector>&matrix,inttarget){intm=matrix.size(),n=matrix[0].size();intr
深度探索：机器学习中的条件生成对抗网络（Conditional GAN, CGAN）算法原理及其应用
目录1.引言与背景2.CGAN定理3.算法原理4.算法实现5.优缺点分析优点：缺点：6.案例应用7.对比与其他算法8.结论与展望1.引言与背景生成对抗网络（GenerativeAdversarialNetworks,GANs）作为一种深度学习框架，在无监督学习领域展现出强大的能力，特别在图像、音频、文本等复杂数据的生成任务中取得了显著成果。然而，原始GAN模型在生成过程中缺乏对生成样本特定属性的直
机器视觉OpenCV：OpenCV图像基本操作数字化与智能化机器学习之机器视觉 opencv 人工智能计算机视觉
一、图像读写操作（一）读取图像方法：cv2.imread(filename,flags=None)参数说明：filename(字符串)：-必须参数。-指定要读取的图像文件的路径。可以是相对路径或绝对路径。-支持多种图像格式，如.jpg,.png,.bmp,.tiff,.jpeg等。flags(整数)：-可选参数。-指定读取图像的方式。不同的标志位会影响图像的加载方式。-常见的标志位包括：-cv2.
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

字符串专题算法

字符串：KMP Eentend-Kmp 自动机 trie图 trie树 后缀树 后缀数组

你可能感兴趣的:(数据结构,算法,字符串,ACM)

字符串：KMP Eentend-Kmp 自动机 trie图 trie树后缀树后缀数组