niiick

后缀自动机SAM

后缀自动机简介

某个字符串s得后缀自动机SAM满足如下性质：

SAM是一个有向无环图，结点称为状态，表示一个或多个不同字符串，边称为转移，表示一个字符
SAM有一个可以到达任何结点的源点 $t_0$ ，它是唯一的，从 $t_0$ 出发到达任意结点经过的转移边连起来就是s得一个子串
从源点出发任意两条不同路径表示的字符串不同，从源点出发不能形成的路径都不是s的子串
SAM有若干个中止结点，从源点到任意中止结点形成的字符串都是s的后缀，且s的所有后缀都可以被某个从源点到中止结点的路径表示
在满足上述条件的自动机中，SAM的结点数是最少的

除开最后一个性质，SAM和AC自动机看起来差不多
但其最后一个性质却能保证SAM比AC自动机有优秀得多的时间和空间复杂度

EndPos集合与Parent Tree

Endpos的定义

对字符串S的任意非空子串t，我们记endpos(t)为t在S中所有结束位置的集合（假设索引从1开始）
例如对于字符串 $S = a b a b c$ ，则 $endpos("aba")=\{3\},\ endpos("ab")=\{2,4\}$

显然S的不同子串可能有相同的endpos，我们可以把S的所有非空子串根据其endpos集合划分成若干个等价类，即属于相同等价类的子串endpos相同

Endpos的性质

引理1：字符串S的两个不同非空子串u、w（设 $|u|\leq |w|$ ），当且仅当u是w的后缀，且u每次都已w的后缀形式出现在S中时，u、w的endpos相同

显然易证

引理2：字符串S的两个不同非空子串u、w（设 $|u|\leq |w|$ ）。
若u是w的子串，则 $\subseteq endpos(u)$
若u不是w的子串，则 $\bigcap endpos(u) = \emptyset$

通俗点说就是S的两个子串，他们的endpos要么是包含关系，要么不相交

引理3：同一endpos等价类中的子串长度连续，且较短者一定是较长者的后缀

由引理1，同一等价类中较短者是较长者的后缀显然成立

下面用反证法简单证明同一endpos等价类中的子串长度连续：
对于某一等价类，假设u、w分别为其中最短和最长的字符串，假设某字符串v是w的真后缀且u是v的真后缀
若v与u、w不在同一等价类中，由引理1，v一定由某次在S中不作为w的子串出现，那么u也一定会这个位置出现一次
此时u的endpos集合显然比w的大，矛盾

用Endpos构造Parent Tree

由引理2，我们不妨把endpos等价类的关系用树表示
即每个结点表示一个等价类，其中结点v是结点u的子节点，当且仅当v表示的等价类对应的endpos是u对应的endpos的子集
由此我们构造了一个森林，再为其加上一个表示空等价类的超级源点，便构成了Parent Tree
此时引理2在Parent Tree上便表示为父节点对应的等价类中的子串一定是子节点等价类中子串的后缀

例如字符串S=abcac，其endpos等价类构造的Parent Tree如下图所示
其中结点内标注的是该结点表示的等价类对应的endpos，结点旁红字标注该结点表示的等价类中包含的子串

此处我们再引入两个引理
先定义 $l e n (p), m i n l e n (p)$ 分别表示结点p对应等价类中最长和最短子串的长度

引理4：在Parent Tree中每个结点均满足 $l e n (f a (p)) + 1 = m i n l e n (p)$

设节点q表示的等价类中最长的子串为u，在u前添加一个字符会形成新子串w（假设w也是S的子串）
那么一定有 $endpos(w)\subset endpos(u)$ ，也即w一定属于q的某个子节点，且是这个子结点中最短的串

由引理3与引理4可以得到一个推论

推论1：设某结点p表示的等价类中最长的串为t，则从p到Parent Tree根节点路径上所有结点表示的等价类，恰好包含了t的所有后缀

这个推论将在构造SAM的过程中用到

引理5：任意一个字符串S (|S|=n) 的endpos等价类数量的阶为O(n)

我们可以通过Parent Tree来简单理解这个引理
假设超级源点表示的endpos集合为{1,2,…,n}
那么Parent Tree就是以超级源点为根开始在每个结点上划分若干次，将划分的每部分作为子节点得到

显然如果对每个结点都只从中间划一下能得到的Parent Tree结点数最多，这个数量为 $1+\sum_{i=1}^n 2^i=2n-1$
即endpos等价类数量的阶为O(n)

该引理是保证SAM复杂度的重要前提

从Parent Tree到SAM

首先我们明确，构造好的SAM的结点数量与S的endpos等价类数量一样
且这些结点间连接着两套不同的边，分别构成含唯一源点的DAG和Parent Tree
他们之间有一个非常优美的性质

性质1：从源点出发到达某节点p的不同路径构成的所有子串，恰好是p表示的等价类中包含的所有子串

SAM的构造是一个在线算法，可以在已构造好的字符串S的SAM中继续加入字符c，形成S+c的SAM
所以构造过程就是不断在当前字符串末尾加字符的过程
接下来现以一个实例模拟这个过程

构造实例

开始前先回顾前文的一个定义： $l e n (p), m i n l e n (p)$ 分别表示结点p对应等价类中最长和最短子串的长度

下面以S=abcac为例模拟SAM的构造
以下图中均以黑边表示DAG上的转移边，红边表示Parent Tree上子节点指向父节点的边（以下记为后缀连接）

①
初始时只有一个超级源点
加入第一个字符’a’，就新增了一个endpos等价类{a}，对应endpos为{1}
我们首先创建一个表示这个等价类的新结点，然后增加转移边与后缀链接如图
（这一步不能很明确的表达SAM的构造思路所以从下一步开始讲解）

②
接下来加入字符’b’，此时新增了一个endpos等价类{ab, b}，对应endpos为{2}
同样新建一个结点（记为cur）表示该等价类

========================================================

添加一条从上一轮创建的结点（记为p）到cur的转移是显然的
这样就有一条表示当前完整字符串的路径

接下来沿p的后缀链接跳到当前Parent Tree根
对经过的每个结点都添加一条到cur的转移（此处先假设这些转移都不存在）
由前文推论1和性质1可知这样可以构造出所有表示"以当前加入字符c为结尾的子串"的路径

最后将cur的后缀链接指向超级源点

加入字符’c’的过程也相同

③
接下来加入字符’a’，此时新增了一个endpos等价类{abca, bca, ca}，对应endpos为{4}
同时也改变了一个endpos等价类，等价类{a}的endpos从{1}变成了{1, 4}

此时构造不能再使用上文的方法，如下图
我们先创建了表示endpos {4}的结点cur，并从上一轮创建的结点p出发连接了一条转移
但根（p的第一个祖先）已有字符’a’的转移了

========================================================

当我们沿p的后缀链接跳到p的某个祖先p’，却发现p’已存在到新字符c的转移边
我们记这条转移边到达的节点为q，并设t为p表示的等价类中所包含的任意一个子串

显然endpos(t+c) = q所对应的endpos与cur的endpos的并集

若有len( q ) = len( p’ ) + 1
根据引理4可知q表示的等价类只包含一个子串，即 t+c

那么此时q所对应的endpos就变成了q所对应的endpos与cur的endpos的并集
所以我们可以直接令cur得后缀链接指向q

④ 最后加入字符’c’，此时新增了一个endpos等价类{abcac, bcac, cac, ac}，对应endpos为{5}
同时也分裂了一个endpos等价类，等价类{c, bc, abc}的分为了{c}和{bc, abc}，endpos分别为{3, 5}和{3}

我们同样先创建了表示endpos {5}的结点cur
并从p开始沿后缀链接对经过的添加到cur的转移
但在此过程中又遇到了新的情况——p’已有转移但len( q )=len( p‘ )+1

========================================================

当我们沿p的后缀链接跳到p的某个祖先p’，发现p’已存在到新字符c的转移边
同样记这条转移边到达的节点为q，并设t为p表示的等价类中所包含的任意一个子串

若有len( q ) > len( p’ ) + 1，则说明q表示的等价类中包含若干个子串
显然此时q表示的等价类中除 t+c 外其余子串endpos都没变，而endpos(t+c) = q所对应的endpos与cur的endpos的并集
所以我们从q中分裂出一个新结点单独表示 endpos(t+c)及其对应的等价类

记这个新节点为nq
显然从nq出发应该有和q一样的转移，nq的后缀链接也应该与q的后缀链接相同

由于此时nq对应的endpos为q所对应的endpos与cur的endpos的并集
所以q和cur的后缀链接都应该指向nq

此时便可以把p’及其祖先的指向q的转移c指向nq

至此SAM的构造就完成了

代码实现

我们先总结一下上文实现SAM构造的方法
每加入一个新字符c就新建一个结点cur，记上一轮新建的结点为p

从p开始沿后缀链接向根(源点)走，对经过的结点添加字符c的转移
若所有经过的结点都没有字符c的转移，则最后cur的后缀链接指向根

若某结点p’已有字符c的转移则，记该转移到达q
此时若len( q ) = len( p’ ) + 1，则cur的后缀链接指向q
若len( q ) > len( p’ ) + 1，则分裂q产生新结点nq，nq有和q一样的转移和后缀链接
将cur和q的后缀链接指向nq，并令p’及其祖先的指向q的转移c指向nq

可以证明构造SAM的时间复杂度为 $O (n)$

对每个结点定义结构体

struct state{
	int ch[26]; // 转移边
	int len,fa; // 等价类中最长子串长度 和 后缀链接
	state(){memset(ch,0,sizeof(ch)); len=fa=0;}
}st[maxn<<1];
int last=1,sz=1;

令源点为1，上一轮新建的结点为last，初始时last指向源点
下面是主要过程

void addToSAM(int c)
{
	int p=last, cur=last=++sz; // 新建节点
	
	st[cur].len=st[p].len+1; // 新结点等价类中最长子串长度为当前完整字符串长度
	while(p && !st[p].ch[c]) // p开始沿后缀链接向源点，对经过的结点添加字符c的转移
	{
		st[p].ch[c]=cur;
		p=st[p].fa;
	}
	
	if(!p) st[cur].fa=1; // cur的后缀链接指向根
	else
	{
		int q=st[p].ch[c];
		if(st[p].len+1==st[q].len) st[cur].fa=q; //cur的后缀链接指向q
		else // 分裂q
		{
			int nq=++sz;
			st[nq].len=st[p].len+1; // nq只含有t+c
			st[nq].fa=st[q].fa; // nq转移和后缀链接与q一样
			memcpy(st[nq].ch, st[q].ch, sizeof(st[q].ch));
			
			st[q].fa=st[cur].fa=nq; // cur和q的后缀链接指向nq
			
			while(p && st[p].ch[c]==q) // p及其祖先的指向q的转移c指向nq
			{
				st[p].ch[c]=nq;
				p=st[p].fa;
			}
		}
	}
}

int main()
{
	scanf("%s",str);
	int len=strlen(str);
	
	for(int i=0;i<len;++i)
	addToSAM(str[i]-'a');
}

SAM的应用

匹配子串

Q：给定一个文本串T和一个模式串P，问P是否作为T的子串出现
A：对T构造SAM，从源点开始沿转移边不断匹配P的每个字符，能匹配完就说明P在T中出现过

不同子串个数

洛谷P2408 不同子串个数
Q：给定一个字符串S，求S有多少个本质不同的子串
A：有两种解法
方法一：
文章开头提到了SAM的一个性质

从源点出发任意两条不同路径表示的字符串不同，从源点出发不能形成的路径都不是s的子串

所以本题就是求从源点出发有多少条不同的路径
而后缀自动机是一个DAG，所以只需要做一个DAG上的DP就行了

即构造好S的SAM，设 $d p [u]$ 表示从点u出发的不同路径条数
初始时 $d p [u] = 1$ ，转移方程 $dp[u]=\sum dp[v] ,\in E$
答案就是 $d p [1]$ ，该算法时间复杂度为 $O (n)$

方法二：
注意到本质不同的子串数量就是所有等价类大小之和

根据引理3——同一endpos等价类中的子串长度连续，以及引理4——每个结点均满足 $l e n (f a (p)) + 1 = m i n l e n (p)$
我们可以得到每个结点u表示的等价类得大小，即 $l e n (p) - l e n (f a (p))$

所以本质不同的子串数量为 $\sum len(p)-len(fa(p))$
该算法时间复杂度为 $O (n)$

该方法相较于方法一，可以在向SAM添加字符的过程中动态维护本质不同的子串数量

子串出现次数

洛谷P3804 【模板】后缀自动机 (SAM)
Q：给定一个字符串S，求其某个子串t的出现次数
A：
SAM中任意结点表示的等价类中包含的子串出现次数就是该等价类对应的endpos大小
而求某个结点对应endpos大小只需要在Parent Tree上dfs即可

设 $n u m [u]$ 表示结点u的endpos大小
若u是构造SAM时添加字符时新建的结点而不是分裂某结点得到的，初始化num[u]=1
因为这样的结点表示的等价类对应的endpos一定只含有添加新字符时的末尾位置
之后dfs从Parent Tree叶子开始 $num[u]=\sum num[v] \ (fa(v)=u)$ 即可得到每个结点的num

那么对于某个子串t的出现次数，只需要沿转移边找到t对应的末尾结点，输出其num
该算法时间复杂度为 $O (n)$

第k小子串

洛谷P3975 [TJOI2015]弦论
Q：给定一个字符串S，求其第k小子串
A：
先求出 $d p [u]$ 表示从点u出发的不同路径条数
从源点出发，每次按字典序枚举转移到的结点v，若dp[v]>k就进入v继续找，否则k-=dp[v]
最后输出经过的转移表示的字符即可

P3975这题还有另一个“不同位置的相同子串算作多个”的条件
此时求从点u出发的不同路径条数时初始化条件改为dp[u]=u对应的的endpos大小即可

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
rtos内存管理林内克思 java linux 算法
FreeRTOS将内存分配API保留在其可移植层，提供了五种内存管理算法：heap_1：最简单，不允许释放内存。heap_2：允许释放内存，但不会合并相邻的空闲块。heap_3：简单包装了标准malloc()和free()，以保证线程安全。heap_4：合并相邻的空闲块以避免碎片化。包含绝对地址放置选项。heap_5：如同heap_4，能够跨越多个不相邻内存区域的堆。特点缺点heap_1简单、不支
c++中迭代器的本质三月微风 c++开发语言
C++迭代器的本质与实现原理迭代器是C++标准模板库(STL)的核心组件之一，它作为容器与算法之间的桥梁，提供了统一访问容器元素的方式。下面从多个维度深入解析迭代器的本质特性。一、迭代器的基本定义与分类迭代器的本质迭代器是一种行为类似指针的对象，用于遍历和操作容器中的元素。它提供了一种统一的方式来访问不同容器中的元素，而无需关心容器的具体实现细节。标准分类体系C++标准定义了5种迭代器类型，按功能
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。 zzywxc787 人工智能
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。以下是具体变革方向及实际影响：1.实验设计智能化：告别“猜猜看”传统痛点：依赖经验选择测试变量（如按钮颜色、文案），忽略潜在高价值组合。AI解决方案：多臂老虎机算法（MAB）：动态分配流量至表现最优的变体（如：80%流量给当前最优，20%探索新选项），减少流量浪费高达70%（Netflix案例）
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

后缀自动机SAM

后缀自动机简介

EndPos集合与Parent Tree

Endpos的定义

Endpos的性质

用Endpos构造Parent Tree

从Parent Tree到SAM

构造实例

代码实现

SAM的应用

匹配子串

不同子串个数

子串出现次数

第k小子串

你可能感兴趣的:(后缀自动机SAM,算法)