pi9nc

Double Array Trie

分类：数据结构与算法 2012-02-06 18:42 1328人阅读评论(1) 收藏举报

   query c 数据结构 delete integer 算法 
 

目录(?)[+]

Trie逻辑结构

Trie是一种常见的数据结够，可以实现前缀匹配（hash是不行的），而且对于词典搜索来说也是O(1)的时间复杂度，虽然比不上Hash，但是空间会省不少。

比如下图表示了包含“pool, prize, preview, prepare, product, progress"的一个Trie

Trie的逻辑结构：每个圆圈都表示一个状态，比如状态1，状态之间的边表示状态1遇到字符p就变成状态2。用两个圈画的状态表示终止状态，也就是表示匹配了一个单词。

这是DFA的表示方法，当然按照正规的定义，还得有个“吸收”所以非法字符的状态，比如状态1碰到p之外的任何字符都会匹配失败，也就是会进入这个“吸收”状态，这个状态就像

黑洞，进去之后就永远没有出头之日了------永远在那个状态跳转。

Trie的实现

从上面可以知道，要表示一个Trie，关键就是一个跳转矩阵（DFA里的正式名字是状态转移表），比如上图可以这样表示

	1	2	3	4
p	2	X	X	X
r	X	X	X	X
o	X	3	X	X
e	X	X	4	X
..

X就表示那个“吸收”状态。

从上表看出，如果有N个状态，并且字母表的大小是M，那么逻辑上就是一个N*M的数组。M一般很容易知道，比如对于英文单词，M可能是26或者52，对于汉字，可能有好几千。

而N很显然和词典的大小有关系，词典越大，那么N一般也越大。另外也与词典数据有关，比如词典的词共有的前缀很多，那么N就越少；反之N就越大。

可以看出，一般这个二维数组会比较稀疏，所以可以压缩空间。

最容易想到的压缩方法当然是链表。比如把状态1可以接受的字符组成一个链表，但是链表的缺点是无法实现随机访问，这样效率会有问题。

我们也可以把链表换成树的结构，比如红黑树，这样可以log(n)的速度。但是还是比不上数组的o(1)的速度。

这时我们肯定想到了Hash，没错，使用Hash比不压缩的数组省空间（数组也可以理解为Hash），而且速度也慢不了很多。

但是Hash总会是有冲突的（当然可以构造Perfect Hash，但是如果数据经常变化，那么就不好处理），能不能既有数组般的随机访问性能，又能节省大量空间的方法呢？

这就是我们要讲到的Double Array Trie。不过先别急，我们先讨论Triple Array Trie。了解这种压缩的思路。

Triple Array Trie(TAT for short)

TAT的思想很简单，由于每个状态接受的字符很有限，大家可以共享一个数组。比如字母表是a-z这26个英文字母，我们可以用0-25这26个数组表示它们。

比如状态1接受“a,c,e"，那么我们可以把找一个“base”。可以把这个“base”理解成这个状态的Hash值。然后base,base+2,base+4就分配给状态1了。

又假设状态2接受“b,d"，那么状态2也可能Hash到和状态1相同的base，然后把base+1,base+3分配给状态2。这样它们能够相安无事的共存。

不过我怎么能知道base是属于状态1，而base+1是属于状态2呢？这就需要一个check的数组来标识了。

比如上图：状态s碰到字符c就变成状态t，那么首先从base里找到s的“hash地址”，这个地址指向base=base[s]，然后base+c我们分配给c的地址，通过check[base+c]==s我们知道
这个地址确实是分配给了s，所以我们读取next[base]，它的值就是t。这样你给我s和c，我通过上面的过程就能告诉下一个状态就是t。
我们来比较一下TAT和二维数组的时间和空间开销。

时间

二维数组：你给我s和c，我立马就能告诉你t，array[s*字母表大小+c]，当然需要一次乘法和加法算下标。内存读取一次。
TAT：给我s，首先读取base[s]，然后计算base[s]+c，然后读取chk=check[base[s]+c]，然后一次判断，如果chk==s，那么再读取一次next[base[s]+c]得到t。3次访问内存，一次加法

空间

二维数组：M*N*4(有一个32bit的int表示)

TAT：状态个数+双数组的长度，这个值比较难估计，与词典的数据分布有关。我使用了一个随机生成的例子：字母表大小26，词典大小20,000，N=154825，使用DAT后next和check的大小是

168505（因为没有实现TAT，所以我这里只能用DAT来估计，但TAT应该和DAT是差不多的。而且我目前使用的DAT使用了check压缩，这样导致双数组的大小会稍微大一些，check数

组的压缩参考下面）。

我们简单的比较一下：二维数组 26*150k*4=15M; TAT 150K*4+170K*8=2M，可以看出空间节省了多少！！如果像汉字这样字母表更大的词典，那么会节省的更多。

问题

从上面的分析我们看出，实现TAT的关键就是给每个状态一个合适的base，比如上面的例子，如果状态1的base是0，那么它就会占用next[0],next[2],next[4]，如果我们不小心把状态1的

base弄成了1，那么它会占用next[2],next[4]，这样就“冲突”了，所以要避免这种情况。如果出现了，我们就必须给某个状态，比如状态2分配一个新的base。

上图就展示了由于冲突，我们需要修改base[s]的例子。我们需要找到原来的base，然后遍历next[oldBase+0...字母表大小-1]，如果next值为s，说明这个next是属于s的，那么需要
把它“搬”到合适的地方，然后原来的check从s变成none，新地址的check从none变成s。

Double Array Trie(DAT for short)

还能压缩吗？

看起来TAT已经很不错了，但是还是有冗余的信息。

不过之前需要说明这样一个前提：Trie是一颗树，构造Trie时，只会增加状态；删除单词时，首先删除孩子，然后才能删除父亲。

形式化一点：假设状态s遇到c变成状态t，那么就不会有另一个状态r遇到c变成状态t（否则一个节点有两个父亲，那就不是树了）。

这有什么用呢？如果s遇到c变成t，s是t的父亲，t是s的孩子，那么t只能从s过来，那么就没有必要在next数组里指向base里，而可以直接让t=base[s]+c

如果看上图，那么就是所有的next[i]=i，也就是不需要next数组了。

这个可能有的绕，需要这样理解：状态只是一个数字，叫1还是2并不重要，反正是个唯一的标识就行了，比如原来状态0遇到c变成状态1，状态1遇到d变成状态2，那么我把状态1改成状

态100完全是没有区别的：状态0遇到c变成状态100，状态100遇到d变成状态2。

状态本身并不重要，重要的是它的base（可以理解为hash地址）

它的搜索过程如下：给定s和c，直接检查chk=check[base[s]+c]，如果chk==s，则t=base[s]+c，也就是把原来的base和next数组合并成为一个。

也许你会有这样的担心(细心的读者)，万一base[s]+c被别人用了呢？当然可以调整base[s]，这时t也跟着s变化。有没有怎么调整也冲突的情况呢？

考虑一下s遇到c变成t，已经r也遇到c变成t，这会怎么样？不论你怎么调整，因为base[s]=t-c=base[r]，也就是s和r的base相同，这没什么，关键是check数组

只能一个，要么s，要么r，这种情况没法处理。不过想想前面，Trie是一颗树，所以t只能有一个父亲节点，所以上面的例子是不可能出现的。

同样的，如果给s增加一个孩子t(通过字符c)，那么万一base[s]+c已经被别人使用了check[base[s]+c]=other，那么就必须给s的base换个地方，参考下图：

除了要修改t和t‘的check外，还需要把t’的base改成原来t的base。

后缀压缩

比如前面的例子，pool，状态3的后代最多只有一个孩子，也就是一个链（没有更多分支），所以可以把状态4和5去掉，然后状态3做为叶子节点，用一个指针指向字符串“ol”。

DATrie的插入

注意：这里的DATrie是指有后缀压缩的DATrie。如果没有后缀压缩，其实也类似。

根据插入点的位置，可以分为两种情况。

首先我们找到插入点，也就是在Trie树上不停的走，直到在非叶子节点遇到不能接受的字符或者遇到叶子或者所有的字符都走完了。

第一和第三种情况可以合并成一种，它们唯一的不同时，前者的后缀不空，后缀的后缀为空(#)表示。

比如现在的trie树如上，
我们要插入“pooch”，那么就是第二种情况，我们需要在状态3增加一个状态t， 3经过o变成t，然后t分成两个分支，一个是l，一个是c。
如果要插入“poa“，那么是第一种情况，如果要插入”po“，那么是第三中情况。这两种情况都需要从3增加状态，但是原来的孩子不需要改变。
插入po，只需要给3增加一个孩子t，边上的字符是#，然后t是叶子,
插入poa，需要给3增加孩子t，边上的字符是a，a是叶子节点，指向#
也就是说，第二种情况需要修改原来的tail（后缀压缩部分）

DATrie的删除

删除一个词首先需要找到这个词的路径，然后反向一个一个删除状态，直到遇到某个状态------这个状态至少有两个分支（也就是删除当前分支后还有分支）。

如果有后缀压缩的话，那么可以再压缩后缀（当然也可以不压缩）。比如上面的例子，删除“produce”，那么首先删除状态14，然后可以压缩状态15,13,12,11，让

状态10直接指向ucer#

双数组的Pool分配

我们这里讨论的DAT是一种动态数据结构，会不停的往里面插入删除单词。

这个时候就需要动态管理双数组了。因为如果base和check被使用的话，那么它们的值会大于等于0，所以可以让没有使用的base和check的值为-1，比如需要找

空闲的base时，我们可以从头开始扫描base，碰到-1就找到一个空闲的空间。

这种办法简单容易实现，但缺点是时间复杂度比较高。如果对插入删除要求不高的话，那么这种方法就比较简单可行，比如后面我们讲到的Static的DAT【构建一次，永不修改】

就可以使用这种方法。

改进的办法就是把空闲的空间组织成链表。我们可以用负数代表空闲，然后它的绝对值代表下一个空闲单元的地址（下标）。

check[0] = -r1

check[ri] = -ri+1 ; 1 <= i <= cm-1

     check[rcm] = -1

这里只使用了check来表示空闲单元，其实check空闲，那么对应的base也是空闲的。那么其实可以也利用上，来组织成一个循环链表：

     check[0] = -r1
     check[ri] = -ri+1 ; 1 <= i <= cm-1
     check[rcm] = 0
     base[0] = -rcm
     base[r1] = 0
     base[ri+1] = -ri ; 1 <= i <= cm-1

字母表的问题

对于英语来说，一般只有26个字母（或者52个，如果考虑大小写）+一些数字等，一般一个字节就可以表示下来。然后可以使用比较简单的算法把它们映射成0开始的连续整数。

比如只有字母和数字可以使用如下算法：

      int getIndex(char c){
        if(ch >='a' && ch <='z')
            return ch-'a';
        else if(ch >='0' && ch <='9')
            return ch-'0';
        else
            return -1;
      }

如果字母表很大，比如汉字，那么可能需要一个HashMap<Character,Integer>来保存了。不过这样的速度可能有问题，由于一般字符编码都会是连续的区域，所以也可以参考上面的方

法来实现，这样既省空间，又速度更快。

对于汉字这种“宽”字符，还有一种办法，那就是先把它转成多个单字节的数组。比如“北京”的unicode是“\u5317\u4eac“，那么可以把它看出4个字节。这样字母表最多256，正好可以

用一个字节表示。

libdatrie的用法

http://linux.thai.net/~thep/datrie/datrie.html#AnImp 这里有个c语言的实现，使用了标准的DAT实现，有后缀压缩。可以嵌入到自己的c程序中，也可以做为独立的程序运行。

下面介绍一下做为独立程序使用的方法。

安装

从网站下载，解压，标准的tar包，./configure && sudo make install安装。

默认程序安装在/usr/local/bin/trietool-0.2，so安装在/usr/lib/libdatrie.so.1，可以使用man trietool-0.2 查看用法。

示例

 要构造一个trie 名字叫test，首先需要告诉它我们的字母表，创建一个test.abm，比如我们的词典只有大小写的英文字母

    
    
    
    
     
     
     
      
       
       [java] view plain copy 
        
        
       
     
     
     
     
      
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ cat test.abm   
         
      [0x0041,0x005a]   
      [0x0061,0x007a]   
         
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test add abcd 0   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test add abce   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test add abcf   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test add abcg 1   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test query ab   
      query: Key 'ab' not found.   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test query abce   
      -1   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test query abcg   
      1   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test delete abcg   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test query abcg   
      query: Key 'abcg' not found.   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test delete abcg   
      No entry 'abcg'. Not deleted.   
         
         
         
         
      当然一个一个添加词典很麻烦，可以指定一个词典文件，这个文件的格式是一行一个词。   
      比如   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test add-list /usr/share/dict/words   
      lili@lili-desktop:~/datrie/libdatrie-0.2.4$ trietool-0.2 test query AOL   
      -1   
     
    
    
    
    
check数组的压缩

在DAT里，如果s遇到c变成t，那么就是base[s]+c=t,check[t]=s，如果我们能保证任意两个状态的base都不相同，那么我们可以不用在check数组存s，而只需要存c。

原来check数组里保存的是s，说明这个位置留给了s，base[s]+c=t，如果还有一个状态r，比如base[r]=base[s]，那么根据check[t]=s可以判断是从s->t而不是r->t。

如果我们做一个限制，让所有的状态的base都不同，那么我们就可以在check[t]里保存c而不是s，因为t-c就是s。

这样做有什么好处呢？一般的应用中，字符数远远小于状态数。比如英语，字母数可能不到100，8位足以表示。比如汉语，字母数可能小于4k，12位就可以表示了。

这样由于base的限制，虽然会导致base和check数组增大一些（我的随机实验这两个数组会稍微大一些，但是不会超过5%），但是这两个数组的大小会从8个字节变成

5个字节（英文为例），那么节约的空间还是非常可观的。

这种方法一般用作静态的（构造一次不再修改）DAT里，因为如果总是插入删除的话要保证base不重复代价更大。

此外DAT除了用来判断前缀匹配之外，可能把它用作Map这样的数据结构，所以还可以用check节省下来的位数来保存一个下标（指针）。

参考资料

1. http://linux.thai.net/~thep/datrie/datrie.html

2. http://www.chokkan.org/software/dastrie/

Golang数据结构与算法：实现经典算法的Go版本 Golang编程笔记 golang 算法开发语言 ai
Golang数据结构与算法：实现经典算法的Go版本关键词：Golang、数据结构、算法、经典算法、Go实现摘要：本文将带领大家深入探索在Golang中实现经典算法。我们会先介绍一些基础的数据结构和算法概念，然后用生动的故事和例子来解释这些概念，接着给出核心概念之间的关系。通过详细的代码示例，展示如何在Go语言里实现这些经典算法，还会介绍它们的实际应用场景、相关工具和资源，探讨未来的发展趋势与挑战。
C#推箱子游戏源代码解析与实践指南 Boa波雅
本文还有配套的精品资源，点击获取简介：C#推箱子游戏是一个经典的益智游戏，适合编程初学者学习C#语言和游戏开发的基础知识。本篇文章将深入探讨使用C#语言开发推箱子游戏的源代码，涉及面向对象编程、图形用户界面(GUI)、事件驱动编程、数据结构与算法、状态管理、错误检查与边界条件、游戏逻辑以及调试技巧。通过学习本课程，初学者将能够掌握C#编程的基础和游戏逻辑的实现，并能够创建用户友好的界面。1.面向对
数据结构与算法--Python栈栈实现综合计算器和逆波兰计算器前缀表达式中缀表达式后缀表达式逆波兰表达式 storyfull 数据结构与算法算法 python 栈逆波兰表达式逆波兰计算器
阅读目录栈实现综合计算器思路及Python实现思路Python实现模拟逆波兰计算器思路及Python实现思路Python实现正则表达式实现计算器栈实现综合计算器思路及Python实现思路先建立一个“数栈”用来压入数字，还有一个“符号栈”用来压入运算符，规定：减法从栈底向栈顶方法运算，乘除法优先级高于加减法具体操作过程：以“3+26-2”为例（1）数栈和符号栈皆为空，指针从左向右扫描表达式，数栈入栈
c++面试八股文（大公司通用）挨踢小明 IT生涯开发语言 c++
在C++面试中，常见的问题通常会围绕C++的基础知识、数据结构与算法、系统设计、编程技巧、以及实际应用中的场景。以下是华为C++面试中常见的“八股文”问题及其简要回答思路。1.C++语言基础C++中const的用法有哪些？回答：常量变量：constinta=10;指针常量：constint*p;（指向常量的指针），int*constp;（指针本身是常量）成员函数常量：voidfunc()const
零基础数据结构与算法——第二章：基本数据结构-队列&总结
2.1数组（Array）2.2链表（LinkedList）2.3栈（Stack）2.4队列（Queue）2.4.1队列的定义与特点想象一下排队买票的场景，先到的人先买票，后到的人排在队伍末尾，这就是队列的基本概念。队列是一种遵循先进先出（FIFO,First-In-First-Out）原则的线性数据结构。队列的主要特点包括：两端操作：在一端（队尾）添加元素，在另一端（队头）移除元素，就像人们在队伍
《解锁Vcpkg国内镜像源：C++开发者的速度秘籍》空云风语 QT 人工智能 c++开发语言
一、Vcpkg初相识在C++开发的广袤世界里，Vcpkg犹如一把神奇的钥匙，为开发者们打开了便捷之门，尤其是在依赖管理方面，发挥着举足轻重的作用。包管理工具对于C++开发而言，是至关重要的存在。C++作为一门强大且广泛应用的编程语言，在开发过程中常常需要依赖众多的第三方库。这些库涵盖了各种功能领域，比如网络通信、图形处理、数据结构与算法等。以网络通信为例，开发网络应用程序时，可能会用到像Boost
【LeetCode刷题指南】--消失的数字，轮转数组，移除元素草莓熊Lotso Leetcode刷题指南 c语言刷题经验分享其他
个人主页：@草莓熊Lotso作者简介：C++研发方向学习者个人专栏：《C语言》《数据结构与算法》《C语言刷题集》⭐️人生格言：生活是默默的坚持，毅力是永久的享受。前言：在之前的C语言刷题集中我们刷了很多IO类型的基础编程题，但是随着数据结构往后的学习以及企业面试的要求，我们还需要对接口型的题目进行练习，博主在这里准备了新的《LeetCode刷题指南》专栏给大家分享一些我自己在力扣上面写过的题目，提
【LeetCode】力扣题——轮转数组、消失的数字、数组串联艾莉丝努力练剑 LeetCode代码强化刷题 leetcode 算法职场和发展开发语言 c语言学习
个人主页：艾莉丝努力练剑❄专栏传送门：《C语言》、《数据结构与算法》、C语言刷题12天IO强训学习方向：C/C++方向⭐️人生格言：为天地立心，为生民立命，为往圣继绝学，为万世开太平前言：牛客网和LeetCode的刷题都不可或缺，我们都做一做，力扣的题目对提升代码能力很有帮助，需要有一点基础，几乎都是接口型的题目，在C语言刷题专栏我好像还没有介绍过这两者的区别，那么我们来了解一下——IO型和接口型
【数据结构与算法】直接插入排序例题愿做无知一猿算法与数据结构算法排序算法插入排序
原题：假设一组成绩的关键字序列如下（24.15.32.28.19.10.40）采用直接插入排序时，当插入记录19到有序表时，为找插入位置的需要比较次数为：答案4次分析直接插入排序的过程：原来：24.15.32.28.19.10.401）首先从第一个元素开始：24.15.32.28.19.40不变的，下面才是正题2）检查15：15和前面的24比较，24>15。结论：比较一次，交换位置（方便查看后面的
数据结构与算法领域贪心算法的深度剖析 AI天才研究院 ChatGPT 实战计算 Agentic AI 实战贪心算法算法 ai
数据结构与算法领域贪心算法的深度剖析关键词：贪心算法、最优子结构、贪心选择性质、动态规划、贪心策略、时间复杂度、算法设计摘要：本文从贪心算法的核心概念出发，系统剖析其数学原理、算法设计模式及工程实践方法。通过对比贪心算法与动态规划的差异，揭示贪心选择性质和最优子结构的本质联系。结合活动选择、最小生成树、最短路径等经典案例，详细阐述贪心策略的构建过程与正确性证明方法。最后通过工业级项目实战，展示贪心
深度优先在数据结构与算法中的独特作用 AI天才研究院 AI大模型企业级应用开发实战 Agent 实战 AI人工智能与大数据深度优先算法 ai
深度优先在数据结构与算法中的独特作用关键词：深度优先搜索、数据结构、算法设计、图遍历、递归、迭代、问题求解摘要：深度优先搜索（DFS）是计算机科学中最重要的图遍历算法之一，其通过"尽可能深"的探索路径的策略，在树与图的结构分析、问题求解中展现出独特价值。本文从DFS的核心原理出发，系统解析其在数据结构中的实现方式、算法设计中的问题建模方法，结合数学模型分析时间空间复杂度，通过迷宫求解、强连通分量检
数据结构与算法-练习打卡day5（每日温度）潇洒亦如我算法练习 java
数据结构与算法-练习打卡day5问题：解题：性能：问题：题目地址，点我解题：分析：至少需要两层，最简单就是两层for循环，也可以引入单调栈，可以去掉一些不是单调的中间值，节省遍历个数classSolution{/***publicint[]dailyTemperatures(int[]temperatureArray){*int[]diffArray=newint[temperatureArray
「C/C++」C/C++STL篇之 forward_list单向链表容器何曾参静谧 c语言 c++list
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
Github 2024-07-22 开源项目周报Top15
根据GithubTrendings的统计，本周(2024-07-22统计)共有15个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7TypeScript项目4非开发语言项目2Rust项目2JupyterNotebook项目1C#项目1JavaScript项目1C++项目1《Hello算法》：动画图解、一键运行的数据结构与算法教程创建周期：476天协议类型：Oth
数据结构与算法：贪心（一） WBluuue 算法 c++leetcode 贪心算法
前言有一说一贪心的题目真的ex，想不到就是想不到……一、贪心贪心就是通过在过程中每次达到局部最优，从而在最后实现整体最优。贪心的题目经常要用到排序和堆。越打cf越能感受到贪心的奇妙，很吃状态和灵感。解题的过程中往往依赖举大量例子，然后进行总结和归纳，然后才能发现规律。当然不排除怎么举都想不到的情况，此处点名上次edu的b题斐波那契叠正方形。二、题目1.最大数classSolution{public
春招Java上岸指南：从0到1的备战全攻略
个人主页:java之路-CSDN博客(期待您的关注)目录春招前的自我评估与目标设定核心知识巩固与提升Java基础知识数据结构与算法多线程与并发编程数据库知识框架学习项目经验积累与优化回顾现有项目参与开源项目打造个人项目面试准备与技巧提升简历撰写常见面试题解析模拟面试面试技巧与注意事项春招实战与心态调整春招信息收集投递策略面试实战应对心态调整春招前的自我评估与目标设定在开始春招备战之前，首先要对自己
Python数据结构与算法——数据结构(栈、队列) 依彡 python数据结构与算法 python 算法数据结构
目录数据结构介绍列表栈栈的基本操作：栈的实现（使用一般列表结构即可实现）：栈的应用——括号匹配问题队列队列的实现方式——环形队列队列的实现方式——双向队列队列内置模块栈和队列应用——迷宫问题栈——深度优先搜索队列——广度优先搜索数据结构介绍介绍：数据结构是值相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。简单说：数据结构就是设计数据以何种方式组织并存储在计算机中。比如
数据结构与算法-线性表-线性表的应用晴空闲雲数据结构与算法实践数据结构
1线性表1.5线性表的应用1.5.1线性表的合并【算法步骤】分别获取LA表长m和LB表长n。从LB中第1个数据元素开始，循环n次执行以下操作：从LB中查找第i个数据元素赋给e；在LA中查找元素e，如果不存在，则将e插在表LA的最后。【代码实现】顺序表实现：//合并两个线性表：顺序表实现。//将所有在线性表LB中但不在LA中的数据元素插入到LA中。voidMergeList_Sq(SqList*LA
DAY 24冲击蓝桥杯——Python数据结构与算法06 栈(Stack)
6.1特点回顾下队列：先进先出。栈则是先进后出，类比于浏览器的后退功能。6.2时间复杂度访问:O(N)栈顶元素搜索：O(N)插入:O(1)删除：O(1)栈顶元素6.3栈的常用操作6.3.1创建栈#创建stackstack=[]6.3.2添加元素#向末尾添加stack.append(1)6.3.3获取即将出stack的元素#获取即将stack的元素O(1)temp1
Go的数据结构与算法-----实现可变长数组 Go达人开发语言 golang go
切片在Golang中，数组长度是不可变的，那么我们可以自己实现简单的可变长数组。在Golang里面切片slice里就运用了可变长数组，slice是对底层数组的抽象和控制。那么我们先看看slice的结构体typeslicestruct{arrayunsafe.Pointer//表示任何类型的指针lenint//长度capint//容量}unsafe.Pointer是Go语言中的一个特殊类型，用于表示
【保姆级教程】2025年AI产品经理终极学习指南：从零基础到精通，收藏我这一篇就够了！ AGI大模型老王人工智能产品经理 Agent Qwen 大模型大模型教程大模型学习
成为一名优秀的AI产品经理不仅需要掌握相关的技术知识，还需要具备良好的产品思维、市场洞察力以及跨部门沟通协调能力。下面是一个详细的AI产品经理学习路线，旨在帮助有志于从事该职业的人士快速成长。AI产品经理的学习路线第一阶段：基础知识积累了解AI基本概念学习人工智能的基本定义和发展历程；掌握常见AI技术如机器学习、深度学习、自然语言处理、计算机视觉等的基础原理。2.计算机科学基础熟悉数据结构与算法；
Github 2024-06-07 Java开源项目日报Top10 老孙正经胡说 github java 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Java项目9非开发语言项目1TypeScript项目1Python项目1《Hello算法》：动画图解、一键运行的数据结构与算法教程创建周期：476天协议类型：OtherStar数量：63556个Fork数量：7731次关注人数：63556人贡献人数
IT专业高考假期预习指南 ak2111 程序人生高考程序人生
目录1.概述1.1.基础知识铺垫1.2.编程技能学习1.3.实际动手操作1.4.小结2.基础课程预习指南2.1.计算机组成原理2.2.C语言程序设计2.3.C++程序设计2.4.数据库原理2.5.计算机网络原理2.6.软件工程2.7.数据结构与算法2.8.编译原理3.技术学习路线图3.1.前端开发3.2.后端开发3.3.全栈开发3.4.数据科学3.5.人工智能1.概述对于有兴趣进入IT领域的新生，
阿里的极限压测：手撕红黑树卡壳时，技术主管抛出分布式锁失效危机搞Java的小码农 Java面试场景题 Java 面试高并发分布式锁红黑树技术挑战
标题：阿里的极限压测：手撕红黑树卡壳时，技术主管抛出分布式锁失效危机场景设定时间：阿里总部，终面环节，技术主管正在考核即将加入某高并发项目组的应届生小兰。小兰即将面对一场极限压测场景模拟，这是她能否通过终面的关键一战。第一轮提问：基础数据结构与算法面试官（技术主管）：小兰，首先我们来聊点基础的。你能否手撕红黑树，讲讲它的基本性质和实现原理？小兰：嗯……红黑树是一种自平衡二叉搜索树，它的节点有红黑两
蓝桥杯刷题指南 love_c++ 蓝桥杯职场和发展
蓝桥杯是中国普及性最好的计算机程序设计竞赛之一，参加者包括大学生、高中生和草根程序员等各个群体。通过刷题来提升自己的编程能力是参加蓝桥杯比赛的常见做法。下面是一些蓝桥杯常见的题型和刷题技巧，希望对大家有所帮助。基础入门题目：输出“HelloWorld！”计算两个整数的和判断一个数是不是素数这些题目是蓝桥杯入门级别的常见题目，通过这些简单的题目可以熟悉比赛的题目风格和解题思路。数据结构与算法：深度优
数据结构字符串（二）统计字符数胡乱huluan 数据结构与算法字符串数据结构算法 c++c语言
数据结构（八）学习数据结构与算法过程中的心得体会以及知识点的整理，方便我自己查找，也希望可以和大家一起交流。——统计字符数——1.题目描述判断一个由a-z这26个字符组成的字符串中哪个字符出现的次数最多1.1输入第1行是测试数据的组数n，每组测试数据占1行，是一个由a-z这26个字符组成的字符串每组测试数据之间有一个空行，每行数据不超过1000个字符且非空1.2输出n行，每行输出对应一个输入。一行
数据结构与算法中二叉树的高效应用技巧数据结构与算法学习 ai
数据结构与算法中二叉树的高效应用技巧关键词：二叉树、数据结构、算法、遍历、平衡二叉树、应用场景、性能优化摘要：本文将深入探讨二叉树在数据结构与算法中的高效应用技巧。我们将从基础概念出发，逐步深入到实际应用场景和性能优化策略，帮助读者掌握二叉树的核心原理和实用技巧。文章包含丰富的代码示例、性能分析图表和实际应用案例，适合从初学者到进阶开发者的各个层次读者。背景介绍目的和范围本文旨在全面介绍二叉树数据
【C/C++】面试基础题目收集 CodeWithMe C/C++c语言 c++面试
C++软件开发面试中常见的刷题题目通常可分为以下几大类：数据结构与算法、系统编程、面向对象设计、C++语言特性、并发编程等。一、数据结构与算法（力扣/牛客经典题）掌握STL和底层结构实现能力：数组&字符串两数之和（LeetCode1）三数之和（LeetCode15）盛水最多的容器（LeetCode11）最长不重复子串长度（LeetCode3）字符串转整数（LeetCode8）链表反转链表（Leet
【原神 × 插入排序】刷圣遗物也讲算法：圣遗物评分系统背后的排序逻辑你真的懂吗？星之尘1021 游戏视角下的算法通识课算法排序算法数据结构
改编自：王争《数据结构与算法之美》游戏演绎：米哈游《原神》核心关键词：插入排序、排序算法、评分系统、属性评价、强化圣遗物、冒泡排序对比引言：原神刷本=刷排序？玩《原神》的玩家每天日常是啥？体力用来刷圣遗物、精通头、暴击头、攻充沙……一堆副本爆一堆装备，怎么判断哪个最好？我们通常会：看主属性和副属性结合角色使用场景打分排个分先用“过渡毕业”的这个过程，其实背后用的就是排序算法！尤其是插入排序（Ins
数据结构与算法学习笔记----Kruskal算法明月清了个风数据结构与算法笔记（基础课）算法学习笔记
数据结构与算法学习笔记----Kruskal算法@@author:明月清了个风@@firstpublishtime:2024.12.21ps⭐️这也是一个思想比较简单的算法，只写了基本思想，具体的可以看代码理解一下Kruskal算法Kruskal算法同样是一种基于贪心策略的最小生成树求解算法，另一种是上一篇中的Prim算法。基本思想将所有的边按边长从小到大排序。遍历所有边，判断每条边所连接的两个节
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

Double Array Trie