Umikaze_

后缀自动机SAM详解

用一个DFA来识别一个串(比如aabab)的所有后缀，要怎么做呢

最简单的办法，把所有后缀看作要保存的单词，画一棵 trie树，像这样：

点很多很麻烦复杂度也很高

我们给这个DFA按我们的需求合并化简一下，把树升级为DAG，变成下面这样

这个就是我们想要的后缀自动机了

那它怎么构建，有什么特性呢，下面我们就来说一下

1.不论对化简前的 trie树，还是化简后得到的SAM，都具备这样一个结论：

从源点出发到达任意终止结点经过的路径所形成的串一定是原串的一个后缀串

从源点出发到达任意结点经过的路径所形成的的串一定是原串的一个子串，且对不同路径，子串必互不相同

这个DAG可以确定出原串的所有不同子串

2.SAM中，结点所代表的状态本质是一个endpos集，这个endpos集还对应着一个子串集，这个子串集是具有相同endpos的一个等价类

endpos代表子串在原串终止位置的集合，比如aabab中，子串集{a}的endpos集为{1,2,4}

继续以上图为例，aabab

结点1子串集为{ε}，endpos集为{1,2,3,4,5}

结点2子串集为{a}，endpos集为{1,2,4}

结点3子串集为{aa}，endpos集为{2}

结点4子串集为{aab、ab、b}，endpos集为{3}

结点5子串集为{aaba、aba、ba}，endpos集为{4}

结点6子串集为{aabab、abab、bab}，endpos集为{5}

3.结点这个等价类的endpos集和子串集的性质：

①对于一个原子串，在左侧增加字符增长后，endpos要么变少要么不变

比如 ba 和 a，ba 能匹配上的，a也能一定匹配上，ba能匹配的位置只会比 a 少或相等，不会更多

但比如 ba 和 b，这个就没法比较了，ba 和 b 不是后缀包含关系，ba 不是通过 b 在左侧增加若干字符得到的

②有后缀包含关系的串（s2是s1的真子后缀），其endpos集也必然有包含关系

比如 ba 和 a，ba 能终止的位置，一定是在 a 的 endpos 里选的

我们可以把这个包含关系，按包含传递顺序用父子关系连接，这样不断向父亲遍历，就能找到一个子串的所有子后缀串

比如我们要找子串aaba的所有子后缀串，

首先拿到它所在的结点5 endpos{4}，这个等价类中，有串集 aaba、aba、ba

然后找这个等价类的父类2 endpos{1,2,4}，找到串集 a

然后找到等价类2的父类1 endpos{1,2,3,4,5}，找到串集 ε

至此，所有 aaba 这个子串的后缀子串都被找到

需要注意的是，父类串集中最长的串，是当前类中不满足当前类的endpos的一个最长公共真子后缀，结论③将就这一点进行具体阐释

③每个等价类串集中的串，具有长度连续的特点，且记一个串集中最长的串长为len，最短为minlen，有 len( i ) = minlen( fa( i ) ) + 1

以结点5和结点2为例，结点5表示的最长串尾 aaba，取其最大真后缀串，aba，那么其endpos集含有的元素数可能变多，也可能不变

如果变多，那ba的话也一定比 aaba 多，所以说，随着减少左侧字符不断递减长度，直到endpos元素变多才会不属于aaba所在的等价类

也就是说，这个等价类里的字符串长度是减少左侧字符依次递减的，直到endpos变了，才开一个新类

比如这里结点5就是，串集 aaba、aba、ba不断减少左侧字符递减，直到到 a，endpos变了，a开了一个新类作为5的父类

然后很显然，结点5的直接父类是 aaba 的不满足 endpos(aaba) 的最长真子后缀所在的类

当然 aaba 所有不满足 endpos(aaba) 的真子后缀所在的类都是 aaba 所在类的祖先类，但是未必是直接父类，要明确，怎样才是直接父类

④由一个endpos集得到几个子endpos集的过程实际上是一个不完全划分

盖覆：比如 {1,2,4} 分为 {1,2} 和 {1,4}

划分：比如 {1,2,4} 分为 {1,2} 和 {4} ，划分是一种特殊的盖覆

这里所说的不完全划分是笔者的说法，指的是

不完全划分：比如 {1,2,4} 分为 {2} 和 {4} 丢掉了1这样是可以的，不需要实现盖覆，但是注意一定不存在覆盖

显然，endpos集不完全划分的过程构建的父子关系是一棵多叉树，笔者称其为 endpos 树

实际上关于一个endpos集是否被划分还是不完全划分，这个是可以快速确定的，而且是很重要的，笔者会在最后讲述这个结论

继续以 aabab 为例我们画一下它的 endpos 树，感受一下

⑤SAM的建立就是建立一个DFA和一个endpos树，其建立过程是在线的（按字符串遍历序不断添入字符），其本质是状态转移

比如建立 aababa ，当加入aabab后，当前的结果就是aabab的SAM，只要添入a，就会变成aababa的SAM

下面就来讲SAM的建立过程：

先来看个例子，我们手动推一推

蓝箭头是endpos树，指向父类的箭头

红字记录的是当前结点中串集中最长串的长度len

上图中的信息画到了下面表格中来辅助我们推导

状态	父类	len	串集
1	0	0	ε
2	1	1	a
3	2	2	aa
4	1	3	aab、ab、b
5	2	4	aaba、aba、ba

先来看这样一种情况

case1

比方说现在我们只有前3个结点吧，要把4加进去，要怎么做呢

现在呢，已经构建的串，即原串为aa，很显然任意阶段的最长串，就是原串，我们每次都要记录一下含有最长串这个结点，因为需要用，这里就用pre=3来记录一下

我们现在来了个字符b，新串aab，想知道aab有哪些后缀串，非常简单容易想到的一个做法就是原串 aa 的所有后缀串，后面增添一个 b，就是 aab 的后缀串了

那怎么找 aab 的所有后缀串呢，实际上前置结论已经讲过这个了，利用的就是endpos树

aa所在类3的后缀串有aa，然后继续找它的endpos不同的真子后缀，即不断找父类，到父类2，找到a，然后到父类1，找到ε，然后到达父类0，意味着要收手了，然后这些就是aa的所有后缀串

然后这些串后面加上 b ，就是 aab ab b 了，那我们就把结点0、1、2引出边b指向结点4

把4的父类置为1，为什么呢，很显然只有1是4的最长不符endpos(4)的真子后缀

当然这样说父类怎么置的那就成了我们用眼睛看出来的，那我们继续看下一种情况，弄清这个父类到底怎么确定的

case2

已经建好了原串aab的SAM，现在加入字符a

结点4和结点1，有着 aab 所有后缀串 aab ab b ε

那好，我们给结点1和4分别引一条边a指向结点5，对吗？显然错的啊，1通过a到5表示的是后缀串a对吧，a已经有了不是吗？你看1到2不就是吗？

想起来我们最一开始讲的 trie 按需化简为 DAG 了吗，1到5是多余的，那怎么回事，很简单呀，就是你看到的那样，前面已经出现过了这样的子后缀

因为 1 已经有一个 a 边引到 2 了，可能看到这里你有些懵逼，不是说好的原串所有后缀都加新的字符吗

确实是这样，但这不代表所有相关结点都这样做，那怎么判断呢

抛开这道题，我们随便举个例子去说说吧

比如一个结点 p 串是 ababa，父结点 pp 串是 baba，父的父 ppp 串是 aba、ba，父的父的父 pppp 串是 a，父的父的父的父 ppppp 串是 ε

其中 ppp 结点通过b指向一个结点 x，p和pp结点没有引出的 b 边

然后现在新加入一个 b，首先 p 要引出一个 b 边到新节点y，得到 ababab，然后找p的父亲pp，引一个b边到y得到babab，然后找到 ppp

发现 ppp 已经有引一个b边到 x 了，且abab是x中的一个最长串集，abab、bab已经有了，那就不用再让 ppp 引b到y了，问题来了，还需要继续判断 pppp 和 ppppp 吗

ab 和 b是否已经都有了呢

思考这样一个问题，结点 x 的串集是什么，根据我们前面假设的条件，一定有 abab 和 bab 吧，ab 和 b 有没有呢，不知道，但是x没有的话，结点x的祖先类也一定有

那就好办了，那就是说 abab bab ab b 都有了

那于是只有 p 和 pp 要引 b 到 y

那 y 的串集就是 ababab 和 babab 了，那 y 的父类是谁，显然是结点 x 了，这个就没什么说明的意义，很显然了

case1的时候我们就说，父类怎么确定，其实现在还没太说清楚，但是情况大致搞明白了，对于case1中找父类的循环我们也做了调整，终止位置明确了

根据上面这些例子，我们可以得出这样的暂时结论

对于已经构建的SAM，含有最长串的结点记作p，新加入一个字符c，我们记新构建的结点为np

从 p 开始，如果 p 没有引出的 c 边，那么就从 p 引出 c 边到np，记 p.ch[c] = np，然后令 p = fa( p )，继续循环判断

直到 q = p.ch[c] 存在，那就不用引了，之后的父类也不用判了，按前面说的令 fa( np ) = q 就ok了，结束

当然也有可能所有结点都没有 ch[c] ，这时候一直跑父类就跑到 0 了，当然这时候其实 q 就是 1，fa( np ) = 1（这里现在是同一用q，但之后写法还要做调整，其实还有其他情况）

那好了，fa ( np ) = q 真的对吗

用上面我们随便举的那个例子去看，挺对的，但注意我们有个很重要的假设前提，结点 x 的最长串是 abab，不妨设想，没有这条假设，或许ppp通过其他某一路径到x，

x中的串集还可能有 abacb 之类更长的串，而我们知道，我们是要原串后加一个b，ababa及其所有真子后缀是要加 b 的，且都存在于结点 p 及其祖先类结点

而显然结点ppp通过一个字符 c 到达的其他结点一定不是这些类，也就是 abac 一定不是原串 ababa 的后缀，再加上b，abacb 就一定不是我们新串 ababab 的后缀

那就很明显了，结点 x 的最长串一定得是通过结点 ppp 得到的，那我们的变量 len 记录结点中最长串的长度，这个变量就派上用场了

前面的结论就改作 len( q ) == len ( p ) + 1 时才允许 fa( np ) = q，然后结束

那 len( q ) != len ( p + 1 ) 的话要怎么办呢，我们来看下面这样一个例子

为方便看，还是先放两个表格，一个是只建到5的，即上一个我们看过的那个表，一个是现在这个图对应的表

状态	父类	len	串集
1	0	0	ε
2	1	1	a
3	2	2	aa
4	0	3	aab、ab、b
5	2	4	aaba、aba、b

状态	父类	len	串集
1	0	0	ε
2	1	1	a
3	2	2	aa
4	7	3	aab
5	2	4	aaba、aba、ba
6	7	5	aabab、abab、bab
7	1	2	ab、b

case3

p=pre=5，nq=6，p.ch['b']为空，令p.ch['b']=nq

然后找 p = fa( p ) = 2，发现 q = p.ch['b'] = 4，跳出找父类的循环

然后 len(2) + 1 != len( 4 )，不能让 fa( np ) = q = 4，于是要怎么办

2 的串集是 a，以 2 为汇点，表示的后缀串是 a、ε，我们希望得到 ab、b

但是 2 通过 b 通向的 4表示的是 aab、ab、b，多了个 aab，原因是 2 还有一条路径，通过 a 通过 b 然后到达 4

那怎么办，那就把结点 4 分裂，分出一个表示 ab 和 b 的结点，自己保留对 aab 的表示

分裂出一个结点记作 nq=7

我们的目标是什么，串 a 及其所有子串要通过 b 到达 nq 对吧，

从结点 2 开始，不断找父类 p = fa( p ) ，只要 p.ch['b'] 存在，直到 p.ch['b'] 不存在为止就停下，那就应当指向结点 nq=7

模板里循环条件一般写的是 p.ch['b'] == q，但其实你想一想，这时候 p.ch['b'] 如果存在则一定指向的是 q

构建过程怎样的，为什么是这样的，我想看到这里客官一定已经能够自行理解了，就不在赘述了

分裂出的这个结点 nq=7，要注意，它是原来结点 q=4 功能的一部分，后面可以接 'a' 到 5 的，换言之我们要把 q 的 ch 数组复制给 nq.ch

然后我们就可以令 fa ( np ) = nq 也就是 fa( 6 ) = fa ( 7 )

然后需要注意的是还要令 fa(q) = nq 也就是 fa( 4 ) = fa( 7 )，因为拆分出的这部分是 4 中短的部分，你可以看作 0 到 4 中间加了个中继节点 7，并且是由于7有额外功能才加的

然后这时候要注意 pre和num的更新，pre=6 而不是 7，总结点数 num=7 而不是 6

于是这个SAM构建算法描述为下面这样：

每个结点需要记录的变量：fa、len、ch[k] k是数组长度，是字母表大小(比如串里只有小写字母那就26，字符c对应下标 c-'a')

pre记录原串中最长后缀串(就是原串)所在的结点编号，初始为pre=1，num记录总结点数，初始为num=1

按字符串遍历序，不断add(c)，这里 c 已经对应于ch的下标大小了，比如小写字母减去'a'后的int

add(c)算法描述

①待添加字符 c，令 p=pre，np=pre=++num，对结点 a[p]，如果 a[p].ch[c] 不存在，则令 a[p].ch[c]=np，然后令 p = a[p].fa，继续循环重复上述判断，直到 a[p].ch[c] 存在跳出循环

②如果跳出时 p=0，则令 a[np].fa=1，结束

否则令 q = a[p].ch[c]

③如果 len(q) == len(p)+1，则令 a[np].fa = q，结束

④否则分裂结点 q，令 nq=++num，令 a[nq]=a[q](本质是为了赋ch)，然后对结点 a[p]，如果 a[p].ch[c]==q，则令 a[p].ch[c]==nq，然后令 p=a[p].fa，继续循环重复上述判断，直到 a[p].ch[c]==q 不成立跳出循环，最后令 a[np].fa=nq，结束

还需要一提的是时间空间问题

首先时间复杂度 O(nlogk)，n是字符串长度，k是字母表大小，一般来讲logk基本就是常数，可以复杂度看作 O(n)，但建议记前者

空间上，结点数量是需要考虑的

回忆前面讲的endpos树，SAM这个DFA本质还是一棵endpos树，而这个树是对endpos集不断做不完全划分得到的

而区间划分结点最多的情况就是线段树，最多2n-1个结点，即<2n

我们这里开 maxn<<1 就够了，但要注意别糊涂了，线段树因为其他原因开的是 maxn<<2

下面是模板代码

#pragma GCC optimize("Ofast")
#include 
#define maxn 1000005
using namespace std;
struct node{
	int ch[26];
	int len,fa;
}a[maxn];
int pre=1,num=1;
void add(int c){
	int p=pre,np=pre=++num;
	a[np].len=a[p].len+1;
	for(;p&&!a[p].ch[c];p=a[p].fa) a[p].ch[c]=np;
	if(!p) a[np].fa=1;
	else{
		int q=a[p].ch[c];
		if(a[q].len==a[p].len+1) a[np].fa=q;
		else{
			int nq=++num;
			a[nq]=a[q];
			a[nq].len=a[p].len+1;
			a[q].fa=a[np].fa=nq;
			for(;p&&a[p].ch[c]==q;p=a[p].fa) a[p].ch[c]=nq;
		}
	}
}
char s[maxn];
int main(){
	scanf("%s",s);
	int len=strlen(s);
	for(int i=0;i

 
  到这里SAM的解析就已经结束了 
  下面讲一讲最常见的应用 
  1、判断子串 
  直接在SAM上从源点出发跑，在跑到null之前，输入串就被识别完了，那就是原串的一个子串了 
  2、不同子串个数 
  本质是统计源点出发到达任意点一共有多少条路径，DAG上DP，dp(i)为从结点 i 出发的路径数(也就是从 i 出发的子串数) 
  dp( fa( i ) ) += dp( i ) + 1，然后 dp( 1 ) 就是我们要的答案 
  还有一种方法也很棒，SAM上所有串都是不重复的嘛，每个结点所表示的串集加在一起就是答案了嘛 
  那串集大小是多少呢，这个也很重要，len( i ) - len( fa( i ) )就是结点 i 的串集大小，因为长度连续嘛 
  比如结点 i 表示的是 abcde bcde，那结点 fa(i) 最长的一定是 cde 
  3、所有子串中字典序第 i 大的串（重要） 
  如果是所有不同子串中字典序第 i 大的，那就相当简单了，用2中统计好的个数DFS一点点判就好 
  但现在可以重复计算了，那就得变一变 
  其实也很简单，就是个带权DAG，路径带上了遍数 
  不妨设想，a到b走了4遍，a过b到c走了2遍，a过b到d走了3遍，那也就是说b到c走了2遍，b到d走了3遍，从b出发走了5遍 
  其记录方式还是原来的 dp 累加，只不过加的不是 1 了 
  不过要注意的是，答案是 4+5=9，而不是4*5=20 
  因为 a过b到c 走了2遍，你看作b到c走了2遍，那就是a过b到c看作a到b走了1遍，然后b到c走了两遍 
  实际上也确实是这样，那个4和 2、3是没关系啊，终点都不一样，不是经过遍数 
  那 a 到 b 经过的遍数肯定是 9 啊，其实你这么一想，这个答案倒也是 a 到 b经过的遍数 
  为什么我们前提是这个，a过b到c走了2遍，a过b到d走了3遍，因为SAM的endpos就是这样，a到 i 这个路径走过多少遍，就是endpos的元素数 
  那问题就只剩 cnt(endpos(i)) 怎么统计了 
  这时候就有一个很重要的结论了 
  重要结论： 
  当一个结点是分裂来的结点时，其endpos集被划分为其各个子集 
  当一个结点不是分裂来的结点时，若其有子集，则其endpos集必然被不完全划分为其各个子集，且丢掉的元素必然有且只有一个 
  所以在这里，每个不是分裂来的结点，且不是初始结点的结点，其cnt值可直接初始为1，cnt(fa(i))+=cnt(i) 
  为什么会有这样一个结论呢 
  不妨设想建立过程，某个结点p，什么时候才有的儿子，才被作为父亲指向，是作为儿子的真子后缀再次成为后缀串的一员的时候 
  那一个儿子都没有的时候呢，显然结点p的串集中的子串只出现过一次，endpos集的大小必然为1 
  而刚增加一个儿子，儿子的endpos集大小也必然为1，而父亲也会拥有儿子这个endpos位置，父亲endpos集增加的都是来源于儿子的，而父亲自己的依然是自己的 
  这使我们掌握了endpos树的一个特性 
  实际上通过这个我们也了解到了endpos树的叶子结点的endpos集大小就是1 
  然后说分裂来的结点，与分裂前的结点相比，是把原来结点串集拎出一部分短串来，endpos集都是一样的，没有自我，没有独属于自我的endpos位置，这是很明显的，不再赘述了 
  4.多个串的最长公共子串（重要） 
  先说两个串的，O(n)解决，非常的简单，给你串s和t，先用s建一个sam，然后 t 从头开始匹配 
  打个比方，比如 t 是 abcbdac，匹配了结点x的 abcb，匹配的len=4，然后找不到 d 了，于是在 endpos 树上跳向父亲，缩减长度到真子后缀，就类似于尺取一样 
  那跳回后怎么看len呢，一定是sam记录的 a[p].len，因为很显然啊，就算你匹配结点x匹配的是串集中最短的，那也比结点p中的要长，毕竟p中的都是x中的真子后缀 
  比如跳回去的结点是 cb、b，那最长的 cb 一定是能匹配的，然后接着做看有没有d就行，重复操作就好，特别的是可能会跳回到结点0，这时候就应该跳到1来重新进行匹配，并且len也要清0 
  多个串怎么办呢 
  思路不难，类似的思想O(n^2)解决，对s1建立SAM，然后对s2...st，每个都在SAM上跑一轮 
  用一个 mx 数组记录当前轮中（也就是每轮清零），si在SAM上跑完，每个结点能匹配的最大子串长度 
  这里有个细节要注意，跑的时候 结点 p 可能匹配了长度2，单是最长a[p].len=4，而子类q可能匹配成了 
  那你最后回去 mx(p) 记录的应该是 4 ，而不是 2，这里最后要O(n)判一次 
  但要注意的是，结点编号序其实有点乱，我们这样跑肯定要先子后父式的更新 
  其实怎么说，上面那个情况看起来可能就算父子顺序不太对也没大问题，但是啊，举个例子 
  匹配了 abb，比如有个父亲 bb，bb的父亲 b，那跑SAM的时候 bb 肯定是 0 啊，但是最后 bb 和 b 都要变成 len，你顺序错了，b 不知道 bb 不是0，b 的更新就不对了 
  然后讲这个顺序怎么调依据 len 的特点，len更小则一定不是len大的儿子，只能是父亲，或者是不相干的，len相等，一定不相干，那就好办了，按len排点就行了 
  在我的理念中，这里开个新的结构体数组 O(nlogn) 快排一下就好，没必要整些麻烦事挑战自己 
  网上代码基本都是巧妙的O(n)调整了顺序存到一个新的数组里，看着类似基数排序 
  讲真，没必要挑战自己，总的复杂度O(n^2) 
  不过有一份代码贼蠢，每轮处理他都排序一次，受不了，太蠢了，那可不嘛，你每次都排那可不O(n^2)嘛，看着排序挺聪明的，但是代码很蠢 
  然后mx说完了 
  然后用一个mn[ i ] 数组更新记录每个结点 i 所有轮中匹配的 mx[ i ] 中的最短长度，很好理解，就是得每个串都能匹配的上嘛 
  最后跑一遍 mn 找出 max mn 就行了，还是很好理解的，不是很难，但是很重要，要会，尤其前面那里的求 mx 时的特判尤其重要一定要特别注意 
  就说这么多了，本篇博文到这里就结束了，希望看官能够从这篇博文里有所收获

读取一个字符串，字符串可能含有空格，将字符串逆转,原字符串与逆转字符串进行比较@C语言热心市民小汪代码练习 C语言算法学习 c语言开发语言
读取一个字符串，字符串可能含有空格，将字符串逆转原来的字符串与逆转后字符串比较相同，输出0，原字符串小于逆转后字符串输出-1，大于逆转后字符串输出1。例如输入hello，逆转后的字符串为olleh，因为hello小于olleh，所以输出-1SampleInput1helloSampleOutput1-1#include#includeintmain(){charstr[20];charreStr[
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
Problem F: C语言习题 a!+b!+c! 菜瓜技术联盟 c语言基础 Problem F:C语言习题 a!b!c!C语言习题 a!b!c!求a!b!c!的值 b
ProblemF:C语言习题a!+b!+c!TimeLimit:1SecMemoryLimit:128MBDescription求a!+b!+c!的值，用一个函数fac(n)求n!。a,b,c的值由主函数输入，最终得到的值在主函数中输出。Inputa,b,c的值Outputa!+b!+c!的值SampleInput123SampleOutput9HINT主函数已给定如下，提交时不需要包含下述主函数
如何安全删除MySQL字段？从原理到实战的保姆级指南！小丁学Java 产品资质管理系统安全 mysql 数据库
从MyISAM到InnoDB：解锁MySQL在线删除字段的终极指南真实案例：一次失败的DDL操作引发的思考场景复现：某业务表invite_codes需要删除invitor字段，执行以下命令时触发报错：ALTERTABLEinvite_codesDROPCOLUMNinvitor,ALGORITHM=INPLACE;--报错信息：ALGORITHM=INPLACEisnotsupportedfort
为什么会有虚拟内存 fpcc C++架构设计 linux c++软件工程
一、虚拟内存虚拟内存（virtualmemory），“Virtualmemoryisamemorymanagementtechniqueusedbyoperatingsystemstogivetheappearanceofalarge,continuousblockofmemorytoapplications,evenifthephysicalmemory(RAM)islimited.Itallo
PCL基础：pcl::SACSegmentation＜PointXYZRGBN＞函数全面说明，一遍文章精通平面分割算法多宝Kim #PCL点云库使用笔记 c++算法 windows visual studio
创作不易，如果本篇文章能够给你提供帮助，请点赞鼓励+收藏备查+关注获取最新技术动态，支持作者输出高质量干货！（一般在周末更新技术干货）`pcl::SACSegmentation`是PointCloudLibrary(PCL)中用于进行随机抽样一致性（RandomSampleConsensus，RANSAC）平面分割的类模板，模板参数`PointXYZRGBN`表示点云中点的类型，该类型包含三维坐标
Eagle_Wood-滤波方式学习笔记 OverflowSummer 嵌入式泛用知识学习笔记人工智能算法嵌入式硬件笔记学习
//1.移动平均滤波器（信号处理）#defineWINDOW_SIZE5floatmoving_average(float*buffer,floatnew_sample){ staticfloatsum=0; staticintindex=0; staticfloatsamples[WINDOW_SIZE]={0}; sum-=samples[index]; samples[ind
Pytorch中的torch.utils.data.Dataset 类小白的高手之路深度学习（DL）Pytorch实战深度学习 python pytorch
1、使用方法fromtorch.utils.dataimportDataset2、torch.utils.data.Dataset类的定义classDataset(Generic[_T_co]):r"""Anabstractclassrepresentinga:class:`Dataset`.Alldatasetsthatrepresentamapfromkeystodatasamplesshou
Java-校验值区间值的连续性江节胜-胜行全栈AI java 状态模式开发语言
最新版本更新https://code.jiangjiesheng.cn/article/363?from=csdnc＜30，30≤c＜60，60≤c＜100，100≤c有值时，必须收尾相等。BigDecimalendCheckValue=null;for(BssCompareMethodParameterConfigAddVOconfigRow:actualSampleCompareList){e
清晰架构之typescript实践：构建可扩展服务的利器吕曦耘George
清晰架构之typescript实践：构建可扩展服务的利器react-with-clean-architectureCleanarchitecturebasedreactprojectsamplecode.项目地址:https://gitcode.com/gh_mirrors/re/react-with-clean-architecture在软件开发的浩瀚宇宙中，找到一个既能维持代码的清晰度又能确保
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
MySQL 进阶学习文档你曾经是少年数据库
一、存储引擎1.1核心架构四层架构：连接层→服务层→引擎层→存储层插件式存储引擎：不同引擎独立管理数据存储，可动态选择1.2主流引擎对比特性InnoDB（默认）MyISAMMemory事务支持✅支持❌不支持❌不支持锁粒度行锁表锁表锁外键支持✅支持❌不支持❌不支持存储位置磁盘磁盘内存适用场景高并发事务读多写少临时数据缓存选择建议：优先选InnoDB（支持事务和外键）读多写少且无需事务选MyISAM临
【nnUnetv2】Code复现是Winky啊 #项目nnUnet 人工智能深度学习
作者提出一种nnUNet（no-new-Net）框架，基于原始的UNet（很小的修改），不去采用哪些新的结构，如相残差连接、dense连接、注意力机制等花里胡哨的东西。相反的，把重心放在：预处理（resampling和normalization）、训练（loss，optimizer设置、数据增广）、推理（patch-based策略、test-time-augmentations集成和模型集成等）、
MySQL性能优化实战笔记 - 通俗易懂版泥潭硬拔 mysql 性能优化笔记
1.存储引擎选择-到底选哪个？InnoDBvsMyISAM通俗对比想象你开了一家银行：InnoDB就像是有保险柜的银行支持事务：比如转账，要么都成功，要么都失败行级锁：小明在存钱时，小红还能同时取钱缺点：需要更多内存和CPUMyISAM就像是简易储物柜不支持事务：操作简单直接表级锁：一个人在用时，其他人要等待优点：读取速度快，占用资源少2.实战案例：常见性能问题及解决方案案例1：查询特别慢--糟糕
MySQL InnoDB 存储引擎详解 drebander 数据库 mysql android 数据库
InnoDB是MySQL中最常用、最强大的存储引擎之一，其支持事务、外键、行级锁等特性，非常适合对可靠性、并发性要求较高的场景。本文将详细解析InnoDB的核心特性、内部机制以及使用场景，帮助你更好地理解和优化MySQL数据库。1.为什么选择InnoDB存储引擎InnoDB是MySQL默认的存储引擎（从MySQL5.5开始）。相比其他存储引擎（如MyISAM），InnoDB的优势在于：支持事务：遵
150.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之生命周期与初始化 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之生命周期与初始化效果演示1.生命周期概述1.1组件生命周期@ComponentexportstructCubeRotateAnimationSamplePage{//组件创建时调用aboutToAp
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
Mysql相关知识：存储引擎、sql执行流程、索引失效 Cachel wood sql语言 sql server +mysql mysql sql android ab测试算法人工智能前端框架
文章目录MySQL存储引擎一、MySQL存储引擎概述二、常见存储引擎对比三、核心引擎详解1.InnoDB2.MyISAM四、如何选择存储引擎？五、引擎操作命令1.查看表的存储引擎2.修改表的存储引擎3.引擎与性能优化六、示例对比场景：频繁更新的订单表vs只读的产品分类表七、总结索引失效1.索引列使用函数或表达式2.隐式类型转换3.范围查询右侧的索引列失效4.模糊查询以通配符开头5.OR条件导致索引
EmbodiedSAM：在线实时3D实例分割,利用视觉基础模型实现高效场景理解数据猎手小k 3D 实例分割在线实时感知视觉基础模型（VFM）应用
2025-02-12，由清华大学和南洋理工大学的研究团队开发一种名为EmbodiedSAM（ESAM）的在线3D实例分割框架。该框架利用2D视觉基础模型辅助实时3D场景理解，解决了高质量3D数据稀缺的难题，为机器人导航、操作等任务提供了高效、准确的视觉感知能力。一、研究背景随着机器人技术和人工智能的发展，机器人在复杂环境中执行任务（如导航、操作和交互）的能力越来越依赖于对三维（3D）场景的实时、准
【论文精读】SCINet-基于降采样和交互学习的时序卷积模型打酱油的葫芦娃时序预测算法时序预测 SCINet TCN
《SCINet:TimeSeriesModelingandForecastingwithSampleConvolutionandInteraction》的作者团队来自香港中文大学，发表在NeurIPS2022会议上。动机该论文的出发点是观察到时间序列数据具有独特的属性：即使在将时间序列下采样成两个子序列后，时间关系（例如数据的趋势和季节性成分）也基本上得以保留。这个观察启发了作者去设计一种新型的神
大疆无人机航点飞行KMZ文件提取航点坐标程序员南飞无人机 macos java spring
一、需要插件jaxenjaxen1.1.4dom4jdom4j1.6.1二、KMZ解压成KMLpackagecom.dji.sample.common.util;importorg.dom4j.Document;importorg.dom4j.io.SAXReader;importjava.io.File;importjava.io.FileInputStream;importjava.io.In
5. MYSQL_存储引擎二多实例安装 q375923078 MYSQL 存储引擎 slow_log generic_log audit
文章目录一.MyISAM存储引擎(下)1.MyISAM还在使用的原因2.MyISAM文件组成3.myisamchk二.Memory存储引擎1.Memory介绍2.Memory特性3.Memory的物理特性三.CSV存储引擎1.CSV介绍2.CSV文件组成2.CSV特性四.Federated存储引擎1.Federated介绍2.Federated语法五.多实例安装1.多实例介绍2.安装要求3.安装操
深入GPU渲染流水管线：从顶点到像素的微观世界晴空了无痕图形学 GPU渲染管线
现代图形硬件的架构解密与优化实践一、渲染流水线全景解析1.经典渲染管线阶段划分应用阶段几何阶段光栅化阶段像素处理阶段输出合并阶段2.现代GPU架构演进SIMT架构特性：NVIDIASM(StreamingMultiprocessor)vsAMDCU(ComputeUnit)硬件管线并行度：顶点着色器：32线程/Warp像素着色器：8x8像素/Quad延迟渲染革命：Tile-BasedDeferre
Mysql数据库分表实现微笑的曙光（StevenLi）数据库 mysql 分表性能优化 merge
本次主要采用MERGE分表法、对表进行水平拆分；第一步：创建数据库DROPTABLEIFEXISTSstudents;CREATETABLEstudents(idbigint(20)NOTNULLAUTO_INCREMENT,namevarchar(20)DEFAULTNULL,numvarchar(20)DEFAULTNULL,PRIMARYKEY(id))ENGINE=MyISAMAUTO_I
构建AngularJS动态Web应用的示例教程你这人真狗
本文还有配套的精品资源，点击获取简介：AngularJS是一个由Google支持的前端JavaScript框架，用于创建动态Web应用程序。本文将通过一个名为“angular-sample-app”的示例应用程序，详细介绍AngularJS的核心特性，包括双向数据绑定、控制器、指令系统、服务与依赖注入、表单处理、路由与导航、模板和局部存储以及其他高级特性。通过这个示例应用的深入剖析，开发者可以学习
运维Tips | Ubuntu 24.04 安装配置 samba 文件共享全栈工程师修炼指南企业IT运维实践运维 ubuntu linux 服务器
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]Ubuntu24.04安装配置samba文件共享描述：我们将Ubuntu24.04作为机器学习的工作站，往往需要将Ubuntu24.04中的数据或者代码共享给我们其他使用Windows系统的小伙伴，此时我们可以使用SAMBA，开辟出一个文件共享目录供大家进行数据交换使用。SAMBA是什么?在Linux中，SAMBA是一个开源的软件套件，它提供了
软件性能测试深度解析（进阶篇）：JMeter高阶应用与性能工程体系构建追寻向上 jmeter 功能测试
六、JMeter内核机制深度剖析6.1JMeter架构设计原理JMeter采用模块化架构设计，核心模块包括：测试计划（TestPlan）：测试逻辑的容器，所有组件在此组织。线程模型：基于Java线程池实现虚拟用户（VirtualUser）并发，通过Ramp-Up参数控制线程启动梯度。请求处理引擎：采用事件驱动模型，每个Sampler（取样器）由独立线程执行，通过Timer（定时器）控制执行节奏。技
LVI-SAM、VINS-Mono、LIO-SAM算法的阅读参考和m2dgr数据集上的复现（留作学习使用）再坚持一下！！！学习
ROS一键安装参考：ROS的最简单安装——鱼香一键安装_鱼香ros一键安装-CSDN博客opencv官网下载4.2.0参考：https://opencv.org/releases/page/3/nvidia驱动安装:ubuntu18.04安装显卡驱动-开始战斗-博客园cuda搭配使用1+2cuda安装1：Ubuntu18.04下安装CUDA_ubuntu18.04安装cuda-CSDN博客cuda
Biobank genetic data探析（三）想摸鱼的生信小白 GWAS自学历程大数据
Biobankgeneticdata探析（三）——GenotypingprocessandsampleQC一.总览Category100313这类数据包含了Affymetrix做Genotypecalling的pipeline的流程信息（后续分析中可能用不到），以及样本质量控制的信息（下游分析中估计是必用了）。二.数据集描述2.1Genotypingprocess查看之后发现这部分不是很重要，毕竟
训练数据重复采样，让正负样本比例1：1 kimi-222 机器学习人工智能深度学习
详细解释resample函数：resample函数来自sklearn.utils，用于从数据集中重新抽样。replace=True表示允许重复抽样，即同一个样本可以被多次选中。n_samples指定抽样的数量。确保训练集数量相同：通过resample函数，你可以确保正训练集和负训练集的数量相同，即使其中一个集的数量小于另一个集的数量。如果n_train_num小于max_train_num，res
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

后缀自动机SAM详解

下面就来讲SAM的建立过程：

下面是模板代码

3、所有子串中字典序第 i 大的串（重要）

重要结论：

4.多个串的最长公共子串（重要）

你可能感兴趣的:(acm竞赛,后缀自动机,SAM)