微in

大话数据结构学习记录

第二章算法

1 讲算法更好的理解数据结构，相辅相成的关系

2 算法提高计算效率，那些公式是很必要的，是重要算法

算法定义：解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。

五个基本特征：输入，输出，有穷性，确定性和可行性

2.6 算法设计要求：

1 正确性：
无语法错误；
合法输入有满足要求输出；
非法输入有满足规格说明输出；
对于精心选择甚至刁难的数据有满足要求的输出结果

算法一般无法用程序证明，而是用数学方法证明，代价昂贵；一般到第三层次就可以了。

2 可读性
便于阅读、理解和交流

3 健壮性
当输入数据不合法时，算法也能做相关处理，而不是产生一场或者莫名其妙的结果

4 时间效率高和存储量低

2.7 算法效率的度量方法

1 事后统计
先写好算法，测试，统计时间

2 事前分析评估

消耗时间取决于四个因素：
1 算法采用的策略、方法；
2 编译产生的代码质量；软件支持
3 问题的输入规模；
4 机器执行指令的速度硬件性能

刨去软硬件因素，一个程序的运行时间取决于，算法的好坏和问题的输入规模

2.8 函数的渐进增长：增长趋势，忽略小量输入

对于给定的两个函数f(n) 和g(n),如果存在一个整数N，使得对所有的n>N，f(n) 总是比g(n)大，那么我们说f(n) 的增长渐进快于g(n)

2.9 时间量度

T(n) =O(f(n)) 随着问题规模n的增大，算法执行时间的增长率和f(n)的增长率相同，称作算法的渐进时间复杂度，简称时间复杂度。 O(1)常数阶，线性阶，平方阶，对数阶(比如二分法)

2.11 最坏情况和平均情况

最坏情况运行时间是一种保证，那就是运行时间将不会再坏了，通常我们提到的运行时间都是最坏情况的运行时间。

平均运行时间是所有情况中最有意义的，因为它是期望的运行时间。

2.12 算法空间复杂度

存储程序本身的指令、常数、变量、和输入数据、还需要存储对数据操作的存储单元。后面这个可能是指临时存储

第三章线性表 List “表”

零个或多个数据元素的有限序列：序列(前驱和后继)、有限

在较复杂的线性表中，一个数据元素可以由若干个数据项组成。

基本操作：初始化，判断是否为空，清空，获取/定位，删除/插入，长度
其他复杂操作可以由这些基本操作组合而成

3.4 顺序存储结构

定义：用一段地址连续的存储单元依次存储线性表的数据元素

顺序存储结构需要三个属性：
- 存储空间起始位置：数组data的存储位置
- 最大存储容量：数组的长度 Maxsize
- 线性表当前长度：length

由于存储位置是编号的，连续的，我们对每个线性表位置的存入或者取出数据，对于计算来说都是相等的时间，

存取时间性能为O(1). 我们把这种存储结构称为随即存储结构。

插入/删除时间复杂度O(n)

比较适合元素个数不太变化，存取数据的应用

3.6 线性表的链式存储结构

除了存储数据元素信息，还要存储它后继元素的存储地址，即逻辑关系。

我们把存储数据元素的域称为数据域，把存储直接后继位置的域称为指针域。
指针域中存储的信息称作指针或链；
这两部分信息组成数据元素的存储映像，称为节点(Node).
第一个节点的存储位置称为头指针；最后一个节点指针为空。

为了方便，常在第一个结点前附设一个结点，称为头结点。

3.7 单链表的读取

获取第i个元素就是从头开始找； O(n)

3.8 单链表的插入和删除

3.9 单链表的创建

一个动态生成链表的过程，从空表的初始状态起，依次建立各元素节点
有两种方式：头插法和尾插法

3.10 单链表的整表删除

经验性结论：
- 若线性表需要频繁查找，很少需要插入和删除是，宜采用顺序存储结构，反之用单链表结构；

当线性表中元素个数变化较大或者根本不知道有多大是，最好用单链表

3.12 静态链表

有些语言没有指针，该怎么实现链表呢?

用数组实的现：数组的元素有两个数据域组成，data和cul，cul相当于单链表中的next指针，存放该元素大的后继在数组中的下标

这种用数组描述的链表叫做静态链表，游标实现法。！！！

3.13 循环链表

对于单链表，每个结点存储了向后的指针，前驱结点找不到

* 将单链表中终端结点的指针端由空指针改为头指针，整个链表就形成一个环* 循环链表

判断条件，p - next 不等于头结点，则循环未结束

用尾指针表示循环列表，这样查找头指针和终端指针都很方便，这样也很方便两个链表的合并

3.14 双向链表

在单链表的每个结点中，再设置一个指向其前驱结点的指针域

第四章栈与队列

* 栈限定仅在表尾进行插入和删除操作的线性表*

* 队列只允许在一段进行插入操作另一端进行删除操作的线性表*

4.2 栈的定义

允许插入和删除的一端称为栈顶 top ，另一端称为栈底 bottom ：先进后出的线性表 Last in First out LIFO

插入：进栈压栈入栈
删除：出栈弹栈

栈：stack
插入：push ；弹出：pop 特殊不同于单链表

由于栈本身是一个线性表，那么前面讨论的线性表的顺序存储和链式存储也是适用的

4.4 栈的顺序存储结构及实现

顺序栈，定义一个top 变量来指示栈顶元素在数组中的位置空栈 top = -1 数组首元素为0

进栈和出栈操作都挺简单，时间复杂度O（1）

4.5 两栈共享空间

因为当空间不够用时，数组的扩展很麻烦；

定义一个数组，里面存储两个类型相同的栈

top1和top2 是栈1和栈2的栈顶指针，可以想象只要它两不见面，两个栈可以一直使用。

top1 +1 = top2 时为栈满。

通常是当两个栈的空间需求有相反关系时使用，比如股票买卖，一方出，一方进。

4.6 栈的链式存储结构及实现

链栈
链表有头指针，栈顶指针也是必须的，可以把栈顶放在单链表的头部，对于链栈来说，是不需要头结点的。

*　不存在栈满的情况，链栈为空就是top = NULL　*

链栈的操作绝大部分和单链表类似，只是在插入和删除上特殊一些

push 和 pop 操作都很简单，没有任何循环操作，时间复杂度均为 O(1)

* 对比： *

顺序栈存取是定位方便，但是可能存在空间浪费；链栈要求每个元素都要有指针域，也会增加内存开销，长度无限制。

4.7 栈的作用

引入简化了程序设计的问题，划分了不同关注层次，使得思考范围缩小，更加聚焦于我们要解决问题的可信，如果总是使用素族，要分散精力去考虑数组的下标增减等细节问题，反而容易掩盖问题的本质。高级语言都有栈结构的封装，可以直接使用。

注：这里提到的观点，是我学习中一直存在的问题，过于关注原理，而不是聚焦于问题的解决，容易拖延进度和受挫，毕竟还没有到真正天才的地步。不管怎样站在前人肩膀上都是不错的。

4.8 栈的应用 - 递归

斐波那契数列计算两种实现方式：迭代和递归

迭代：循环，不需要反复调用函数副本，大量消耗时间和内存

递归：选择结构，结构更清晰，简洁好理解

递归过程退回的顺序是它前行顺序的逆序。在退回过程中，可能要执行某些动作，包括恢复在前行过程中存储起来的某些数据。
* 编译器使用栈实现递归 *

4.9 栈的应用–四则运算表达式求值

括号的问题：

* 只有碰到左括号，就将此左括号进栈，不管表达式有多少重括号，反正遇到左括号就进栈，而后面出现右括号时，就让栈顶的左括号出栈，期间让数字运算*

先乘除的问题：

逆波兰：后缀表达法，不需括号，巧妙解决了程序实现四则运算的难题。

9 + （3-1）3 + 10 /2 换成： 9 3 1 - 3 + 10 2 / +

* 计算规则 * ：从左到右遍历表达式的每个数字和符号，遇到数字就进栈，遇到是符号，就将处于栈顶两个数字出栈，进行运算，运算结果进栈，一直到最终获得结果。

中缀表达式转后缀表达式

看看书中的实例 P136 挺好理解的

4.10 队列的定义

队列(queue)：只允许在一端进行插入操作，而在另一端进行删除操作的线性表。先进先出 FIFO

god 与 dog

4.12 循环队列

顺序存储结构：

进队容易，出队都要移动，耗时；

不去限制队列的元素必须存储在数组的前n个单元这一条件，出对的性能就会大大增加，对头不一定在下标为0的位置。
引入两个指针，front 指针指向对头元素，rear指针指向队尾元素的下一个位置，这样当front等于rear时，此队列不是还剩一个元素，而是空队列。

把队列头尾相接的顺序存储结构称为循环队列。

4.13 队列的链式存储结构及实现

链队列

第五章串

串(string)是由零个或多个字符组成的有限序列，又名叫字符串。
序列说明串的相邻字符之间具有前驱和后继的关系。

常用ASCII编码，总共可以表示256个字符，足够满足以英语为主的语言和特殊符号进行输入、存储、输出等字符需要。
但是全世界有各种语言和文字，所以有了Unicode编码，16位的二进制数表示一个字符，65万多个字符。为了和ASCII码兼容，Unicode的前256个字符与ASCII码完全相同。

字符串的各种操作，用的还是比较多的。

5.5 串的存储结构

顺序存储结构：申请一个数组存放，然后有在0这个位置记录串长度，也有的在末尾加‘\0’
实际上这样的存储很有问题，因为经常要连接多个字符串，容易超长，对于这样的变化，串值得存储空间可在程序执行过程中动态分配而得，比如在计算机中存在一个自由存储区，叫做“堆”。

链式存储结构
一个结点存一个字符，会有很大的空间浪费，可以存多个字符，一个结点未被占满时，可以用“#”或者其他字符补全。

一个结点存多少个字符才合适很重要，会直接影响串的处理效率，需要根据实际情况作出选择。
性能不如顺序存储结构好。

5.6 朴素的模式匹配算法

对主串的每一个字符作为子串开头，与要匹配的字符串进行匹配；对主串做大循环，每个字符开头做T的长度的小循环，直到匹配成功或全部遍历完成为止。

* 算法很低效！ *
差不多是穷举，遍历，对于二进制，很多0-1的序列，效率低。

5.7 KMP模式匹配算法：需要复习

Knuth Morris Pratt

大大避免重复遍历的情况

实际上对于实现还不是很熟，理解不透！还需要再看 p169

O(m+n) 比O((n-m+1)*m)更好。
当模式与主串之间存在许多部分匹配时优势明显

改进算法

算法导论第32章字符串匹配。

这一节需要重新看。

第六章树

* 树是n个结点的有限集。 n= 0时称为空树。在任意一棵非空树中：(1) 有且仅有一个特定的称为根的结点； (2) 当n >1 时，其余结点可分为m(m>0)个互不相交的有限集T1、T2、……、Tm，其中每个集合本身又是一棵树，并且称为根的子树*
- 一对多的数据结构
- 树的定义其实是我们在讲解栈时提到的递归的方法。
- 子树是互不相交的

结点拥有的子树数称为结点的度(Degree)。度为0的结点称为叶结点(Leaf)或终端结点；度不为0的结点称为非终端结点或分支结点。
树的度是树内各结点的度的最大值。

- 树中结点的最大层次称为树的深度(Depth) 或高度

如果将树中结点的各子树看成从左至右是有次序的，不能互换的，则称该树为有序树，否则称为无序树。

森林（Forest）是m棵互不相交的树的集合。对树中每个结点而言，其子树的集合即为森林。

6.4 树的存储结构

线性存储结构：
- 双亲表示法：
每个结点中，附设一个恶指示器指示其双亲结点在链表中的位置。容易找到双亲，但是需要遍历才可以找到子结点。
可以再加一个域，存储最左子结点。
增加右兄弟域来体现兄弟关系。

存储结构的设计是一个非常灵活的过程，设计是否合理，取决于基于该存储结构的运算是否适合、是否方便，时间复杂度好不好等。

孩子表示法
每个结点有多个指针域，其中每个指针指向一棵子树的根结点，我们把这种方法叫做多重链表表示法。
每个结点的度是不同的，分为两种方案来解决。
* 方案一 *
指针域的个数就等于树的度，

^ 表示空的；
可以看到，容易浪费空间，当树的各结点度相差比较小时，空间充分利用

方案二 ：每个结点指针域的个数等于该结点的度，我们专门取一个位置来存储结点指针域的个数。

由于各个结点的链表是不同的结构，加上要维护结点的度的数值，在运算上就会带来时间上的损耗。

孩子表示法

6.5 二叉树的定义

这里又有循环定义，递归。

二叉树不存在度大于2的结点。
左子树和右子树是有顺序的，次序不能任意颠倒。
即使书中某结点只有一棵子树，也要区分是左子树还是右子树

二叉树有雾中基本形态：
1 空二叉树； 2 只有一个根结点； 3 根结点只有左子树； 4 根结点只有右子树； 5 根结点既有左子树又有右子树。

特殊二叉树：

1 斜树

所有结点都只有左子树叫左斜树；所有结点都是只有右子树的叫右斜树。
其实就类似于线性表，线性表可以理解为树的一种特殊形式。

2 满二叉树

所有分支结点都存在左子树和右子树，并且所有的叶子都在同一层上，这样的二叉树称为满二叉树。
- 但是每个结点都存在左右子树，不能算是满二叉树，还必须要所有的叶子都在同一层上，这就做到了整棵树的平衡。

3 完全二叉树

判断二叉树是否是完全二叉树树：给每个结点按照满二叉树的结构逐层变号，如果编号出现空档，说明不是完全二叉树。

6.6 二叉树的性质

1 第i层上至多有2^(i-1)个结点
2 深度为k的二叉树至多有2^k -1个结点
3 对于任何二叉树，叶子数n0，度为2的结点数为n2，则n0 = n2 +1.
4 具有n个结点的完全二叉树深度为[log2N] + 1
5

6.7 二叉树的存储结构

可以一一对应，没有结点的为空，一般顺序存储结构只用于完全二叉树，以免空间浪费太多

二叉链表：一个数据域和两个指针域

6.8 遍历二叉树

是指从根结点出发，按照某种次序依次访问二叉树中所有结点，使得每个结点被访问一次且仅被访问一次。

1 前序遍历
2 中序遍历：不熟悉
后序遍历
规则：若树为空，则空操作返回，否则从左到右先叶子后结点的方式遍历访问左右子树，最后是访问根结点。

- 层序遍历

* 看代码更容易理解这个过程。*

6.8.6 推导遍历结果 P213
可能是重点考题

已知前序和后序遍历，不能确定一棵二叉树。

6.9 二叉树的建立

类似于二叉树的遍历

6.10 线索二叉树

利用空余的地址，存放指向结点在某种遍历次序下的前驱和后继结点的地址。
- 把这种之前前驱和后继的指针称为线索。

其实线索二叉树，等于把一棵二叉树变成了一个双向链表，这样对我们的插入删除结点、查找某个结点都带来了方便。

为了区分指针到底指向了哪里，增加了两个标签

、

6.11 树、森林与二叉树的转换

树的孩子兄弟法可以将一棵树用二叉链表进行存储，所以借助二叉链表可以相互转换；
从物理结构上看，它们的二叉链表是相同的，只是解释不太一样；只要设定一定的规则，用二叉树来表示树，甚至表示森林都是可以，森林与二叉树也可以相互进行转换。

树和森林的遍历问题：
树：先根遍历；后根遍历
森林：前序遍历；后序遍历

树的先根遍历和后根遍历完全可以借用二叉树的前序遍历和中序遍历的算法来实现。我们找到了对树和森林这种复杂问题的简单解决办法。

6.12 赫夫曼树及其应用

赫夫曼编码，文件压缩和解压
带权路径长度最小的二叉树称做霍夫曼树。或者叫最优二叉树。

数据传输，根据字母出现概率还构造二叉树，然后转化成相应的二进制

7 图

图是由顶点的有穷非空集合和顶点之间边的集合组成，通常表示为：G（V,E）

7.2 图的定义

无向图：边用无序偶对(vi，vj)来表示。
有向图：有向边，弧，弧尾，弧头:

7.3 图的抽象数据类型

了解这些操作

7.4 图的存储结构

由于图结构的复杂，所以不能用简单的顺序存储结构来表示。
多重链表，即一个数据多个指针域组成的结点表示图中顶点，尽管可以实现图结构，但是，如果各个顶点的度数相差很大，按度数最大的顶点设计会造成资源浪费，若按照每个顶点自己的度数设计不同的顶点结构，又会带来操作不便。

1 邻接矩阵

图的邻接矩阵(adjacency matrix)存储方式是用两个数组来表示图：一个一维数组存储顶点信息，一个二维数组存储边或者弧的信息。
很熟悉了。

网：

无穷表示一个计算机允许的、大于所有边上权值的值，也就是一个不可能的极限值，代表不存在。

初始化耗费时间 O(n^2)

2 邻接表

邻接矩阵对于边数相对顶点较少的图，存在存储空间的极大浪费。

第一列是数组存储顶点信息；
每一行代表对应顶点的邻接表，记录其邻接点，用单链表存储

对于有向图，则是出度的邻接点；可以建立逆邻接表，获取入度信息

3 十字链表 Orthogonal List 需要重看

对于有向图，邻接表有缺陷，出度和入度每次只能方便一个；十字链表法就是把邻接表和逆邻接表法结合起来。

结构较复杂，还没认真完全看清晰，
在有向图应用中，十字链表是非常好的数据结构类型

4 邻接多重表

操作无向图的边，用邻接表比较麻烦。因为与两个链表有关。

仿造十字链表，对边表结点的结构进行改造，。

5 边集数组

适合对边依次进行处理的操作。
Kruskal 克鲁斯卡尔算法中有应用

7.5 图的遍历 Traversing Graph

从图中某一顶点出发访遍图中其余顶点，且使每一个顶点仅被访问一次，这一过程就叫做图的遍历

避免重复，需要记录访问数组；避免陷入死循环

深度优先遍历和广度优先遍历

深度优先

广度优先

深度优先更适合目标比较明确，以找到目标为主要目的的清况，而广度优先更适合在不断扩大遍历范围时找到相对最优的情况。

7.6 最小生成树

我们把构造连通网的最小代价生成树称为最小生成树 (Minimum Cost Spanning Tree)

两种经典算法：普里姆（prim）和克鲁斯卡尔算法

要注意，所有的u，然后怎样找出最小的边，算法中是用一个数组迭代存储边的值。

Kruskal :直接从边出发，把所有的边按照权值，从小到大排序，然后一个个往里加，同时判断是否会形成回路，这个回路判断很巧妙！
定义一个数组parent，每次往树里加入一条边，设置数组起点位置的值为边终点的值，

每次将待加入边的起始和终点，用find函数，如果返回值一样说明形成环路。注意find中的while,f值的设定。

这里的里面是用连通分量来说明的。

7.7 最短路径

迪杰斯特拉算法 Dijkstra
一步步计算起始点到其他顶点的最近路径，根据顶点的拓展不断更新最小路径值。

每得到一个最佳顶点，就更新最短路径，知道达到最后一个顶点。
第一个点很好获取的，然后就是第二个点。。。
O(N^2)

弗洛伊德算法 Floyd
比较简洁的方法

7.8 拓扑排序

无环图的应用

在一个表示工程的有向图中，用顶点表示活动，用弧表示活动之间的优先关系，这样的有向图为顶点表示活动的网，称为AOV网(Activity On Vertex Network)
活动之间有制约关系，不能存在回路

7.9 关键路径–未看完

解决工程完成需要的最短时间问题
对一个流程图获取最短时间，就必须分析它们的拓扑关系，并且找到当中最关键的流程，这个流程的时间就死最短时间。

把路径上各个活动所持续的时间之和称为路径长度，从源点到汇点具有最大长度的路径叫关键路径，在关键路径上的活动叫关键活动

找到所有活动的最早开始时间和最晚开始时间，并且比较它们，如果相等就意味着此活动是关键活动，活动的路径为关键路径。

第八章查找

提到搜索引擎，很好奇其数据存储结构是什么样的，如何才能保持如此快速的搜索。：高级算法，分布式，多服务器，

这里实际上讲述数据库的一些原理

8.2 查找概论

查找表：同一类型的数据元素构成的集合
关键字Key：数据元素中某个数据项的值，又称为键值，用它可以标识一个数据元素。

查找就是根据给定的某个值，在查找表中确定一个其关键字等于给定值的数据元素。

查找表：静态查找表和动态查找表
静态查找表：只作查找操作的查找表；
动态查找表：在查找过程中同时插入查找表中不存在的数据元素，或者从查找表中删除已经存在的某个数据元素。

为了提高查找的效率，需要专门为查找操作设置数据结构，这种面向查找操作的数据结构称为查找结构。

8.3 顺序表查找

逐个进行记录的关键字和给定值比较
优化：用for循环，需要对i是否越界做判断，实际上可以再开头设置哨兵，a[0]=key，用while循环处理比较，数据很多时，效率提高很大。

8.4 有序表查找

8.4.1 折半查找-二分查找

要使用有序表，但是对于频繁插入和删除的数据集来说，维护有序的排序会带来不小的工作量。

插值查找

根据实际的值来更改查找的位置，不一定是在中间。

对于表长较大，而关键字分布比较均匀的查找表来说，性能较好。斜率，

斐波那契查找：黄金分割原理

8.5 线性索引查找

按照时间顺序存储的快速增长的数据，网站的数据，日志。
索引是为了加快查找速度而设计的一种数据结构。

索引就是把一个关键字与它对应的记录相关联的过程。
索引技术是组织大型数据库以及磁盘文件的一种重要技术。

索引：线性索引、树形索引、和多级索引

线性索引就是将索引项集合组织为线性结构，也称为索引表。有稠密索引，分块索引，倒排索引

稠密索引指在线性索引中，将数据中的每个记录对应一个索引项，索引项是按照关键码有序的排列
数据量大时，仍效率低
分块索引把数据集的记录分成了若干块，块内无序，块间有序
因为有序维护成本太高
每一块对应一个索引项
倒排索引 - 最基础的搜索技术
搜索引擎在极短时间内回复答案
索引项的通用结构是：次关键码(文章关键词)，记录号(文章编码)，其中记录号表存储相同次关键字的所有记录的记录号。

由于不是由记录来确定属性，而是由属性值来确定记录的位置，因而称为倒排索引。

8.6 二叉排序树

一列数，按照一定规则构造成一棵二叉树，当我们对它进行中序遍历时，就可以得到有序的序列，所以我们通常称之为二叉排序树。
规则：

它的左右子树也分别为二叉排序树。

构造一棵二叉排序树的目的，是为了提高查找和插入删除关键字的速度。

插入和删除操作都挺有意思的，不愿意看详细的介绍。。

8.7 平衡二叉树(AVL树)

是一种二叉排序树，其中每一个节点的左子树和右子树的高度差至多等于1.
将二叉树上结点的左子树深度减去右子树深度的值称为平衡因子BF (Balance Factor)
首先是二叉排序树，平衡因子BF = -1 0 +1

为什么需要平衡二叉树？
举例说明：{3,2,1,4,5,6,7,10,9,8} 构建二叉排序树

但是高度达到8的二叉树，对于查找是很不利的；右图高度为4的二叉排序树可以提高查找效率。

在构建的过程中，保证平衡，不断的调整才行，看过程挺麻烦的。

8.8 多路查找树(B树)

在磁盘存读取中应用
前面计算的都是内存中的运算复杂度，但是数据集很大，对数据的处理需要不断从硬盘等存储设备中调入或调出内存页面，一旦涉及到外部存储设备，关于时间复杂度的计算就会发生变化，

多路查找树 multi-way search tree: 其每一个结点的孩子数可以多于两个，且每一个结点处可以存储多个元素
所有元素之间存在某种特定的排序关系。

2-3树其中每一个结点都具有两个孩子或者三个孩子：
2结点包含一个元素和两个孩子或没有孩子；
3结点包含一大一小两个元素和三个孩子或没有孩子

2-3树困难之处在于插入和删除，毕竟某个结点可能是3结点，可能是2结点。
2-3-4树同样是插入删除较复杂

B树：是一种平衡的多路查找树，2-3树和2-3-4树都是B树的特例。结点最大的孩子数目称为B树的阶。
由于B树每结点可以具有比二叉树多得多的元素，所以与二叉树的操作不同，它们减少了必须访问结点和数据块的数量，从而提高了性能。
B树的数据结构就是为了内外存的数据交互准备的。
B+树
解决元素遍历中元素重复的过程，加入新的元素组织方式

不是严格的树结构。

8.9 散列表查找(哈希表)概述

储存位置 = f(关键字) 这样不需要比较就可获得记录的存储位置，通过一个函数：散列技术
把对应关系f称为散列函数，又叫哈希函数hash。
采用散列技术将记录存储在一块连续的存储空间中，这块连续存储空间称为散列表或哈希表(hash table)

哈希表查找步骤：
1）在存储时，通过散列函数计算记录的散列地址，并按此散列地址存储该记录。
2）当查找时，通过同样的散列函数计算记录的散列地址，按此散列地址访问该记录。
散列技术既是一种存储方法，也是一种查找方法。
散列主要是面向查找的存储结构。

散列技术最适合的求解问题是查找与给定值相等的记录
有些关键字对应很多记录的情况不适合散列技术；也不适合范围查找
设计一个简单、均匀、存储利用率高的散列函数是散列技术中最关键的问题。
key 不同值一样造成冲突

8.10 散列函数的构造方法

算法： 1 计算简单； 2 散列地址分布均匀

1 直接定址法
取关键字的某个线性函数值为散列地址

2 数字分析法
比如手机号，可以用后四位作为散列地址；
抽取方法是使用关键字的一部分来计算散列存储位置的方法

3 平方取中法
一个数平方，再抽取中间的3位，用作散列地址。
适合不知道关键字的分布，而位数又不是很大的情况。

4 折叠法
关键字分割成位数相等的几部分，然后将这几部分叠加求和，并按散列表表长，取后几位作为散列地址。
有时不能保证分布均匀，也可以将某部分反转；
折叠法事先不需要知道关键字的分布，适合关键字位数较多的情况。

5 除留余数法

6 随即数法
当关键字的长度不等时，采用这个方法构造散列函数是比较合适的。

综合考虑：
1 计算散列地址所需的时间
2 关键字的长度
3 散列表的大小
4 关键字的分布情况
5 记录查找的频率

8.11 处理散列冲突的方法

1 开放定址法
一旦发生了冲突，就去寻找下一个空的散列地址，只要散列表足够大，空的散列地址总能找到，并将记录存入。

增加平方运算的目的是为了不让关键字都聚集在某一块区域。我们称之为二次探测法。正负变化可以双向寻找。
位移量线性变化的，称为线性探测法，
位移量di 采用随即函数计算得到，称之为随即探测法。

2 再散列函数法
事先准备多个散列函数，一个冲突了，换另外一个。

3 链地址法

将所有关键字为同义词的记录存储在一个单链表里，我们称之为同义词字表，在散列表中只存储所有同义词子表的头指针。

4 公共溢出区法
为所有冲突的关键字建立了一个公共的溢出区来存放。

如果相对不基本表而言，有冲突的数据很少的情况下，公共溢出区的结构对查找性能来说还是非常高的。

8.12 散列表查找实现

挺简单的

散列表性能分析：
如果没有冲突，时间复杂度为O(1)；但实际上冲突不可避免，那么散列查找的平均查找长度取决于哪些因素？
1 散列函数是否均匀
2 处理冲突的方法
线性探测处理可能产生堆积，二次探测法更好，链地址法处理不会产生任何堆积，具有更好的平均查找性能。
3 散列表的装填因子 = 填入表中记录个数/散列表长度
总可以选择一个合适的装填因子以便将平均查找长度限定在一个单位之内。以空间换时间。

第九章排序

假设有n个记录的序列为{r1,r2,……，rn}，其对应的关键字分别为{k1,k2,……，kn},需确定1,2，……，n的一种排列p1，p2，……，pn，使相应的的关键字满足非递减或非递增关系，即使得序列成为一个按关键字有序的序列，这样的操作就称为排序。

排序可以看成是线性表的一种操作。

9.2 排序的基本概念和分类

1 排序的稳定性
待排序的记录序列中可能存在两个或两个以上的关键字相等的记录，排序结果可能会存在不唯一的情况，因此给出稳定和不稳定排序的定义。

算法是否稳定，要通过分析才能得出。

2 内排序和外排序：待排序的记录是否全部被放置在内存中

外排序是由于排序的记录个数太多，不能同时放置在内存，整个排序过程需要在内外存之间多次交换数据才能进行。
对于内排，算法性能主要受3个方面的影响：
1 时间性能
在内排中，主要进行两种操作：比较和移动。这两个操作尽量少才好。移动可以通过改变记录的存储方式来予以避免。

2 辅助空间
除了存放待排序所占用的存储空间之外，执行算法所需要的其他存储空间。

3 算法的复杂性
指的是算法本身的复杂度，而不是指算法的时间复杂度。

内排序分为：插入排序、交换排序、选择排序、和归并排序。
简单算法：冒泡排序，简单选择排序、直接插入排序
改进算法：希尔排序、堆排序、归并排序、快速排序。

9.3 冒泡排序

Bubble Sort 一种交换排序，基本思想是：两两比较相邻记录的关键字，如果反序则交换，直到没有反序的记录为止。
冒泡的细节上可以有很多种变化。
很多种变化！！！

初级版：让每一个关键字都和它后面的每一个关键字比较，如果大则交换，这样第一位置的关键字在一次循环后一定变成最小值。
总是把最小的数放到最前面，但是有些次小的因为交换放到后面了，其实效率很低。

正宗的冒泡排序：从后往前循环，相邻的比较，较小的数字如同气泡般慢慢浮到上面，因此叫冒泡算法。
冒泡算法优化：增加一个标记变量，当排序已经完成时，不需要继续循环下去。

复杂度分析：最好的情况是n-1次比较，O(n)；最坏的是逆序，需要比较n(n-1)/2次，复杂度为O(n^2)。

9.4 简单选择排序

冒泡排序的思想是不断地在交换，通过交换完成最终的排序；在排序是找到合适的关键字再做交换，并且只移动一次就完成相应关键字的排序定位，这是选择排序法的初步思想。

选择排序的基本思想是每一趟在n-i+1(i=1,2, … ,n-1)个记录中选取关键字最小的记录作为有序序列的第i个记录。

简单选择排序法(Simple Selection Sort)就是通过n-i次关键字间的比较，从n-i+1(i=1,2, … ,n-1)个记录中选取关键字最小的记录，并和第i个记录交换之。

复杂度分析：最大的特点是交换移动数据次数相当少，这样就节约了响应的时间，无论最好最差情况，比较次数都是一样多n(n-1)/2，复杂度和冒泡排序一样O(n^2)，但是性能上还是要略优于冒泡排序。

9.5 直接插入排序

Straight Insertion Sort 的基本操作是将一个记录插入到已经排好序的有序表中，从而得到一个新的、记录数增1的有序表。
先相邻比较，找到逆序的结点，然后将其后面的结点后移，把这个逆序结点插入。(用的链表记录)
空间上只需要一个记录的辅助空间，时间复杂度，平均比较和移动次数约为n^2/4，比冒泡和简单选择排序性能要好。

9.6 希尔排序 Shell Sort

前面智力题很好玩。

之前排序算法的时间复杂度基本都是O(n^2)，希尔算法是突破这个时间复杂度的第一批算法之一。
插入排序在，记录本身基本有序或者记录数较少时直接插入的优势比较明显，但是现实中这属于特殊情况，希尔排序是先将大量的记录进行分组先对子序列插入排序，然后对整个序列排序。
避免子序列合并之后，整个序列不能达到基本有序，采用
- 跳跃分割的策略：将相距某个“增量”的记录组成一个子序列，这样才能保证在子序列内分别进行直接插入排序后得到的结果是基本有序而不是局部有序。

关键并不是随便分组后各自排序，而是将相隔某个增量的记录组成一个子序列，实现跳跃式的移动，使得排序的效率提高。
增量的选取很关键，目前只有经验值，增量序列的最后一个增量值必须等于1才行。

时间复杂度为O(n^1.5)。

9.7 堆排序 Heap Sort

简单选择排序，没有把每一趟的比较结果保存下来，在后一趟中，有许多比较在前一趟已经做过了，但是由于未保存这些比较结果，所以后面重复执行这些比较。

如果在选择到最小记录的同时，并根据比较结果对其他记录做出相应的调整，那样排序的总体效率就会非常高了。
堆排序就是对简单选择排序进行一种改进。

堆是具有下列性质的完全二叉树：每个结点的值都大于或等于其左右孩子结点的值，称为大顶堆；或者每个结点的值都小于或等于其左右孩子结点的值，称为小顶堆。

还需要解决两个问题：
1 如何由一个无序序列构建成一个堆？
2 如何在输出堆顶元素后，调整剩余元素成为一个新的堆？
构建堆的复杂度为O(n)，第i次取堆顶记录重建堆需要用O(logi)的时间，并且需要取n-1次堆记录，因此重建堆的时间复杂度为O(nlogn)。
最好、最坏都是O(nlogn)。空间复杂度上，它只有一个用来交换的暂存单元。

由于记录的比较和交换是跳跃式进行，因此堆排序也是一种不稳定的排序方法。

初始构建堆所需的比较次数较多，因此，它并不适合待排序序列个数较少的情况。

9.8 归并排序

归并的Merging函数蛮有意思！

时间复杂度：需要将待排序序列中的所有记录扫描一遍，耗费O(n)，完全二叉树的深度克制，归并排序要进行log2n次，所以总的时间复杂度O(nlogn)，这是归并排列算法中最好、最坏、平均的时间性能。
由于归并排序在归并过程中需要与原始记录序列同样数量的存储空间存放归并结果以及递归时深度为log2n的栈空间，空间复杂度为O(n+logn)。

需要两两比较，不存在跳跃，归并排序是一种稳定的排序算法。
比较占内存，但效率高且稳定的算法。

非递归实现归并排序

递归会造成时间和空间上的性能损耗，可以将递归转化成迭代。
使用归并排序时，尽量考虑用非递归方法。

9.9 快速排序

插入排序- 希尔排序插入类
简单选择排序-堆排序选择类
冒泡排序 - 快速排序交换排序

快排也是通过不断比较和移动交换来实现排序的，只不过它的实现，增大了记录的比较和移动的距离，将关键字较大的记录从前面直接移动到后面，关键字较小的记录从后面直接移动到前面，从而减少了总的比较次数和移动交换次数。

时间复杂度
空间复杂度
非稳定排序，因为是跳跃式的交换

优化
1 优化选取枢轴
然后选取首次的枢轴的时候，这里可能选取的并不好，导致效率低。
需要改进：随机数，三数法，九数法
2 优化不必要的交换
采用替换而不是交换的方式

-3 优化小数组时的排序方案
直接插入是简单排序中性能最好的；
快速排序的递归反而影响性能。分割到后面的时候可以采用插入排序，这个数是7，也有说是50.
两种方法结合起来用。

优化递归操作
如果待排序的序列划分极端不平衡，递归深度将趋近于n，而不是log2N
,每次递归调用都会用栈空间，如果能减少递归，将大大提高性能。
尾递归优化，两次递归变成一次，实际上还是两次，只是先后执行，而不是同时。

你可能感兴趣的:(算法)

数据结构奇妙旅程之深入解析快速排序山间漫步人生路数据结构排序算法算法
快速排序（QuickSort）是一种高效的排序算法，它使用了分治法的策略来将一个数组排序。其基本思想是选择一个基准元素，通过一趟排序将待排序的数据分割成独立的两部分，其中一部分的所有数据都比基准元素小，另一部分的所有数据都比基准元素大，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。工作原理选择基准：从待排序的序列中选一个元素作为基准（pivo
php 把一个数组分成有n个元素的二维数组的算法风清扬-独孤九剑 php php 算法
一、第一种解法0){$columns_map[$position]++;//这个地方格外注意,$position与$columns比较$position=($position<$columns-1)?++$position:0;$array_length--;}foreach($columns_mapas$val){$newarray[]=array_splice($array,0,$val);}
【算法分析与设计】去除重复字母五敷有你算法分析与设计 java javascript 开发语言算法数据结构
个人主页：五敷有你系列专栏：算法分析与设计⛺️稳中求进，晒太阳题目给你一个字符串s，请你去除字符串中重复的字母，使得每个字母只出现一次。需保证返回结果的字典序最小（要求不能打乱其他字符的相对位置）。示例示例1：输入：s="bcabc"输出："abc"示例2：输入：s="cbacdcbc"输出："acdb"思路贪心+单调栈实现【字符串删除一个字符使其字典序最小的贪心策略】：对于两个长度相同的字符串，
yarn的安装和使用全网最详细教程 zxj19880502 yarn npm
一、yarn的简介：Yarn是facebook发布的一款取代npm的包管理工具。二、yarn的特点：速度超快。Yarn缓存了每个下载过的包，所以再次使用时无需重复下载。同时利用并行下载以最大化资源利用率，因此安装速度更快。超级安全。在执行代码之前，Yarn会通过算法校验每个安装包的完整性。超级可靠。使用详细、简洁的锁文件格式和明确的安装算法，Yarn能够保证在不同系统上无差异的工作。三、yarn的
图论记录之最短路迪杰斯特拉 Just right 算法图论 java 开发语言
简述思想这个思想能用一句话来概括，精简到的极致:每次找到一个最短距离的点并更新起点到各个点的最短距离如果要可视化的话，B站搜索Dijksra算法，有视频讲解伪代码写到这里，其实是想整一个动画的，这样效果更好点，但由于种种原因所以就拖一下intdijkstr(){dist[1]=0;其余的点的距离全部初始化为真无穷，不要写成int的最大值迭代n次将不在s中的，且距离最近的点给tsj即先到t，再加上t
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
【数据结构】实验一实现顺序表各种基本运算的算法张鱼·小丸子数据结构实验 c++数据结构
题目：实现顺序表各种基本运算的算法要求：1、建立一个顺序表，输入n个元素并输出；2、查找线性表中的最大元素并输出；3、在线性表的第i个元素前插入一个正整数x；4、删除线性表中的第j个元素；5、将线性表中的元素按升序排列；6、将线性表中的元素就地逆序（只允许用一个暂存单元）；#include#defineSIZE1000usingnamespacestd;typedefstruct{int*a;//
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Java回溯知识点（含面试大厂题和源码）一成码农 java 面试开发语言
回溯算法是一种通过遍历所有可能的候选解来寻找所有解的算法，如果候选解被确认不是一个解（或至少不是最后一个解），回溯算法会通过在上一步进行一些变化来丢弃这个解，即“回溯”并尝试另一个候选解。回溯法通常用递归方法来实现，在解决排列、组合、选择问题时非常有效。回溯算法的核心要点：路径：也就是已经做出的选择。选择列表：也就是你当前可以做的选择。结束条件：也就是到达决策树底层，无法再做出选择的条件。回溯算法
第七章索引及执行计划，存储引擎执笔为剑 #MySQL运维篇编辑器 mysql
第七章索引及执行计划，存储引擎1，索引及执行计划1，作用：提供类似书目录的作用，目的是优化查询2，所用的种类（根据算法）B树索引Hash索引R树FulltextGIS3，B树基于不同的查找算法分类介绍B-tree：在范围查询方面提供了更好的性能（>showengines;#存储引擎作用在表上，不同的表可能有不同的存储引擎mysql>select@@default_storage_engine;#查
Java面试题：解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用，Java中的多线程是如何实现的，Java垃圾回收机制的基本原理，并讨论常见的垃圾回收算法杰哥在此 Java系列 java jvm 算法面试
Java内存模型与多线程的深入探讨在Java的世界里，内存模型和多线程是开发者必须掌握的核心知识点。它们不仅关系到程序的性能和稳定性，还直接影响到系统的可扩展性和可靠性。下面，我将通过三个面试题，带领大家深入理解Java内存模型、多线程以及并发编程的相关原理和实践。面试题一：请解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用。关注点：JVM内存结构的基本组成堆、栈、方法区的功能和
优化选址问题 | 基于和声搜索算法求解基站选址问题含Matlab源码天天酷科研优化选址问题（LP）matlab 和声搜索算法基站选址问题
目录问题代码问题和声搜索算法（HarmonySearch,HS）是一种模拟音乐创作过程中乐师们凭借自己的记忆，通过反复调整各乐器的音调，直至达到最美和声状态为启发，通过反复调整解向量的各分量来寻求全局最优解的智能优化算法。下面是一个基于和声搜索算法求解基站选址问题的Matlab伪代码框架。请注意，这个框架是一个基本的实现，你可能需要根据你的具体问题和约束条件进行调整和优化。代码%和声搜索算法求解基
【循环神经网络rnn】一篇文章讲透 CX330的烟花 rnn 人工智能深度学习算法 python 机器学习数据结构
目录引言二、RNN的基本原理代码事例三、RNN的优化方法1长短期记忆网络（LSTM）2门控循环单元（GRU）四、更多优化方法1选择合适的RNN结构2使用并行化技术3优化超参数4使用梯度裁剪5使用混合精度训练6利用分布式训练7使用预训练模型五、RNN的应用场景1自然语言处理2语音识别3时间序列预测六、RNN的未来发展七、结论引言众所周知，CNN与循环神经网络（RNN）或生成对抗网络（GAN）等算法结
15届蓝桥杯备赛(3) sad_liu #sad_liu的刷题记录蓝桥杯职场和发展
文章目录15届蓝桥杯备赛(3)回溯算法组合组合总和III电话号码的字母组合组合总和组合总和II分割回文串子集子集II非递减子序列全排列全排列II贪心算法分发饼干最大子数组和买股票的最佳时机II跳跃游戏15届蓝桥杯备赛(3)提高C++程序的输入输出效率，尤其是在需要大量输入输出操作时。ios_base::sync_with_stdio(false);cin.tie(nullptr);cout.tie
C#杨辉三角形 wenchm c#算法数据结构
目录1.杨辉三角形定义2.用数组实现10层的杨辉三角形3.使用List泛型链表集合设计10层的杨辉三角形（1）代码解释：（2）算法中求余的作用4.使用List泛型链表集合设计10层的等腰的杨辉三角形1.杨辉三角形定义杨辉三角是一个由数字排列成的三角形数表，其最本质的特征是它的两条边都是由数字1组成的，而其余的数则等于它上方的两个数之和。杨辉三角有两种常用的表示形式。2.用数组实现10层的杨辉三角形
代码随想录 day29 第七章回溯算法part05 厦门奥特曼代码随想录算法 golang 剪枝
491.递增子序列46.全排列47.全排列II1.递增子序列关联leetcode491.递增子序列本题和大家刚做过的90.子集II非常像，但又很不一样，很容易掉坑里。思路不能改变原数组顺序不能先排序去重同一层去重树枝上可以有重复元素新元素添加条件大于等于当前次收集数组最右元素value>array[right]题解funcfindSubsequences(nums[]int)[][]int{ret
分布式应用下登录检验解决方案敲键盘的小夜猫分布式 java
优缺点JWT是一个开放标准，它定义了一种用于简洁，自包含的用于通信双方之间以JSON对象的形式安全传递信息的方法。可以使用HMAC算法或者是RSA的公钥密钥对进行签名。说白了就是通过一定规范来生成token，然后可以通过解密算法逆向解密token，这样就可以获取用户信息。生产的token可以包含基本信息，比如id、用户昵称、头像等信息，避免再次查库，可以存储在客户端，不占用服务端的内存资源，在前后
数据结构——单向链表（C语言版） GG Bond.ฺ 数据结构链表 c语言
在数据结构和算法中，链表是一种常见的数据结构，它由一系列节点组成，每个节点包含数据和指向下一个节点的指针。在C语言中，我们可以使用指针来实现单向链表。下面将详细介绍如何用C语言实现单向链表。目录1.定义节点结构体2.初始化链表3.插入节点4.删除节点5.遍历链表6.主函数1.定义节点结构体首先，我们需要定义表示链表节点的结构体。每个节点包含一个数据域和一个指向下一个节点的指针域。typedefst
【牛客】SQL148 筛选昵称规则和试卷规则的作答记录 talle2021 MySQL-刷题 MySQL 数据库
描述现有用户信息表user_info（uid用户ID，nick_name昵称,achievement成就值,level等级,job职业方向,register_time注册时间）：iduidnick_nameachievementleveljobregister_time11001牛客1号19002算法2020-01-0110:00:0021002牛客2号12003算法2020-01-0110:00
C语言之猴子吃桃普通的一个普通猿 C语言算法 c语言算法开发语言
目录一简介二代码实现循环实现递归实现三时空复杂度A.循环实现B.递归实现一简介猴子吃桃问题是一个经典的递推算法题目，它描述如下：一只猴子第一天摘下若干个桃子，当天吃掉了所摘桃子数的一半多一个。之后每天早上，猴子都会吃掉前一天剩下桃子数的一半多一个。直到第十天早上，猴子只剩下了一个桃子。二代码实现使用C语言来解决这个问题，可以通过循环或者递归的方式来计算猴子第一天到底摘了多少个桃子。以下是两种方法的
【数据结构】复杂度计算一只小鹿lu 数据结构
1、时间复杂度1.1概念时间复杂度的定义：在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。一个算法所花费的时间与其中语句的执行次数成正比例，算法中的基本操作的执行次数，为算法的时间复杂度。1.2大O的渐进表示法大O符号（BigOnotation）：是用于描述函数渐进行为的数学符号。推导大O阶方法：1、用常数1取代运行时间中的所有加法常数。2、在修改后的运行次数函数中，只保
代码随想录算法训练营第三十一天|455.分发饼干、376. 摆动序列、 53. 最大子序和 Eugene Tsui 算法
文档讲解：455.分发饼干、376.摆动序列、53.最大子序和题目链接：455.分发饼干、376.摆动序列、53.最大子序和思路：今天开始了贪心的题目，贪心的题目要么比较简单，要么就很难，找不到头绪，今天的题目还是相对简单一些的。第三题中最难想的一个点就是，如果sum=0;i--){if(cookie>=0&&s[cookie]>=g[i]){res++;cookie--;}}returnres;
matlab ICP配准高阶用法——统计每次迭代的配准误差并可视化点云侠 matlab点云工具箱 matlab 开发语言计算机视觉线性代数算法
目录一、概述二、代码实现三、结果展示1、原始点云2、配准结果3、配准误差本文由CSDN点云侠原创，原文链接。如果你不是在点云侠的博客中看到该文章，那么此处便是不要脸的爬虫。一、概述在进行论文写作时，需要做对比实验，来分析改进算法的性能，期间用到了迭代误差分布统计的比较分析，为直观表示配准误差，需要进行可视化
贪心算法问题勒布朗-前端算法贪心算法算法
分发饼干-455假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子i，都有一个胃口值gi，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干j，都有一个尺寸sj。如果sj>=gi，我们可以将这个饼干j分配给孩子i，这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子，并输出这个最大数值。注意：你可以假设胃口值为正。一个小朋友最多只能拥有一块饼干。示
路径优化算法 | 基于蚁群的城市路径优化算法应用及其Matlab实现算法如诗路径优化算法（Path Optimization）算法 matlab 路径优化算法
蚁群算法（AntColonyOptimization,ACO）是一种模拟自然界中蚂蚁觅食行为的优化算法，用于解决如旅行商问题（TSP）等组合优化问题。在蚁群算法中，每只蚂蚁在搜索路径时都会释放信息素，并根据信息素浓度和其他启发式信息来选择下一个节点。随着时间的推移，较短的路径上累积的信息素会更多，从而吸引更多的蚂蚁，最终找到最优路径。在城市路径优化问题中，蚁群算法可以用于找到连接多个城市的最短路径
2024最新华为OD机试试题库全 -【加密算法】- C卷算法小叮当华为OD试题练习A+B+C卷华为od 加密算法 python java c++dfs
1.题目详情1.1⚠️题目有一种特殊的加密算法，明文为一段数字串，经过密码本查找转换，生成另一段密文数字串。规则如下：明文为一段数字串由0~9组成密码本为数字0~9组成的二维数组需要按明文串的数字顺序在密码本里找到同样的数字串，密码本里的数字串是由相邻的单元格数字组成，上下和左右是相邻的，注意：对角线不相邻，同一个单元格的数字不能重复使用。每一位明文对应密文即为密码本中找到的单元格所在的行和列序号
比较好的知识点 hc.Geng java
2023年Java超全面试题及答案解析---https://blog.csdn.net/qq_42301302/article/details/1287852747分钟带你细致解析4个Java算法必刷题---https://blog.csdn.net/hcxy2022/article/details/12796379750道JAVA基础算法编程题【内含分析、程序答案】---https://blog
LeetCode_32_困难_最长有效括号 Lins号丹 LeetCode进阶之路 leetcode 算法
文章目录1.题目2.思路及代码实现详解（Java）2.1动态规划2.2不需要额外空间的算法1.题目给你一个只包含'('和')'的字符串，找出最长有效（格式正确且连续）括号子串的长度。示例1：输入：s=s=s="(()"输出：222解释：最长有效括号子串是"()"示例2：输入：s=s=s=")()())"输出：444解释：最长有效括号子串是"()()"示例3：输入：s=s=s=""输出：000提示：
什么是特征检测和描述，OpenCV中常见的特征检测算法有哪些？ -Max-静- #opencv学习 opencv 算法人工智能
特征检测和描述是计算机视觉中的基本概念，它们在图像识别、对象跟踪、图像拼接等多种任务中发挥着至关重要的作用。特征检测是指识别图像中重要的特定点、区域或结构，这些特征通常具有独特性、可重复性以及对光照变化、旋转和比例变换等变化的鲁棒性。这些特征点可以用作进一步分析的参考。特征描述是基于一定的几何或者颜色信息生成特征点的特征描述符，这种描述应满足欧式空间的仿射不变性和噪声鲁棒性，并且不同特征点的特征描
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分