larry_do

大话数据结构学习笔记

1 初识概念

程序设计=数据结构+算法
（1）数据结构：是相互之间存在一种或多种特定关系的数据元素的集合。
（2）逻辑结构（面向问题）和物理结构（面向计算机）。
（3）逻辑结构：是指数据对象中数据元素之间的相互关系。（集合结构，线性结构，树形结构，图形结构）
（4）物理结构（存储结构）：是指数据的逻辑结构在计算机中的存储形式。（顺序存储和链式存储）
（5）顺序存储结构：连续的存储单元，逻辑与物理一致
（6）链式存储：任意存储单元，可连续，可不连续。
（7）抽象数据类型（Abstract Data Type, ADT）：是指一个数学模型及定义在该模型上的一组操作。
（8）算法：解决确定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。
（9）算法的基本特性：输入，输出，有穷性，确定性和可行性。
（10）好的算法：时间效率高和存储量低。
（11）算法效率关注主项（最高阶项）的阶数。
（12）算法的时间复杂度。大O记法，O(1)常数阶，O(n)线性阶，O(n2)平方阶，O(logn)对数阶。
（13）O(1)2)3)n)n)
（14）算法的空间复杂度: S(n)=O(f(n)), n表示问题规模，f(n)为语句关于n所占存储空间的函数。

2线性表（List）

（1）零个或多个数据元素的有限序列。
（2）前驱元素，后继元素。第一个元素无直接前驱，最后一个元素无直接后继，中间元素仅有单一直接前驱和直接后继。
（3）线性表的顺序存储结构：用一段地址连续的存储单元依次存储线性表的数据元素。它的存取时间性能为O(1),具有这一特点的存储结构称为随机存取结构。插入或删除为O(n)。
（4）线性表的链式存储。结点（node）:数据域，指针域。
（5）单链表：每个结点中只包含一个指针域。链表中第一个结点的存储位置叫做头指针。线性链表的最后一个结点指针为“空”（NULL或“^”）
(6)在单链表的第一个结点前附设一个结点，称为头结点。头结点的数据域可不存储任何信息。也可以存储线性表长度等公共数据。
（7）若线性表为空，则头结点的指针域为“空”。

	单链表结构	顺序存储结构
存储分配方式	任意存储单元存放线性表	连续存储空间，依次存储
时间性能	查找O(n);插入和删除O(1)	查找O(1) ;插入和删除O(n)
空间性能	不需要分配存储空间，元素个数不受限制	预分配空间大了浪费，小了上溢

（8）静态链表：用数组描述的链表。（游标实现法）
(9)在动态链表中，结点的申请和释放分别借用malloc()和free()两个函数实现。在静态链表中则不行。
（10）静态链表的优缺点

优点	缺点
在插入与删除时，只改游标cur;不做大量移动	未解决连续存储分配带来的表长难以确定的问题；失去了顺序存储结构随机存取的特性

（11）循环链表：终端结点的指针由空指向头结点，单循环链表。尾指针。
（12）双向链表（double linked list）:在单链表中，再设置一个指向前驱结点的指针域。

3栈与队列

3.1栈

（1）栈（stack）：后进先出（Last In f=First Out）,LIFO结构，仅在表尾进行插入和删除操作的线性表；栈顶（top）,栈底（bottom），空栈；
（2）表尾即栈顶（top）,进栈（压栈或入栈）（push）；出栈（弹栈）(pop)；
（3）小例子：
1，2，3依次进栈，不存在312这样的出栈顺序，思考？
（4）栈的顺序存储结构，顺序栈。
（5）两栈共享空间（两居室）；++top1 --top2;一个栈在增长，一个栈在缩短。
（6）栈的链式存储结构，（链栈），基本不存在栈满的情况；将头结点作为栈顶指针top；
（7）栈的大小不可预料，多用链栈；大小在可控范围内，则使用顺序栈，好一些。
（8）栈的应用1：递归（前行和回退），，，，，，，斐波拉契数列（fibonacci）两种实现方法：迭代和递归。
迭代是循环结构，递归是选择结构。递归更简洁，但大量递归调用会建立函数的副本，会耗费大量的时间和内存。迭代不需要反复调用函数和占用额外的内存。
（9）栈的应用2：四则运算表达式求值，，，，
一种不需要口号的后缀表达法，（逆波兰（Reverse Polish Notion，RPN））.931-3*+102/+ 遇到数字就进栈，遇到符号就将处于栈顶的两个数字出栈，计算，再将计算结果进栈。从而获得最后的计算结果。
我们平时所用标准四则运算表达式，叫中缀表达式。9+（3-1）*3+10/2

3.2队列(Queue)

（1）队列：先进先出（FIFO），仅在一端插入(队尾)，另一端删除（队头）的线性表；
（2）队列顺序存储的不足，，也有front,rear。后排满，前排空，的“假溢出”。
(3)循环队列(顺序存储)：队头（front）指向队头元素。队尾（rear）指向队尾元素的下一个位置。头尾相接的顺序存储结构。
（4）判断循环队列满的方法

标志变量flag
保留一个元素空间

（5）考虑第2种，保留一个空间。

队列满的条件：（rear + 1）%QueueSize == front
计算队列长度的公式：（rear - front + QueueSize）%QueueSize

（6）链队列：队列的链式存储

（7）确认队列长度时，用循环队列；无法预估队列长度，用链队列。

4 串

（1）串：由零个或多个字符组成的有限序列，又叫字符串。
（2）空串（null string）：
(3)在计算机中存在一个自由存储区，焦作“堆”。这个堆可由C语言中的malloc()和free()来管理。
（4）串的顺序存储结构与链式存储结构。其中，链式存储结构中，一个结点可以存放一个字符，也可以存放多个字符。若一个结点未占满，可用“#”或其他非串值字符补全。
（5）串的模式匹配：子串定位操作。
（6）朴素的模式匹配算法：单个字符逐一匹配，单个字符往后移动，挨个遍历。
（7）KMP模式匹配算法：仅当模式与主串之间存在许多“部分匹配”的情况下才体现出它的优势，否则两者差异并不明显。
（8）改进KMP算法，参考算法导论，第2版32章字符串匹配。

5树（Tree）

5.1基本概念

（1）树是n（n>=0）个节点的有限集。n=0为空树。
（2）在任意非空树中：

有且仅有一个特定的称为**根（Root）**的结点。
当n>1时，其余结点可分为m（m>0）个互不相交的有限集，其中每一个集合本身又是一棵树，并称为根的子树（SubTree）

（3）度（Degree）：结点拥有的子树数；
（4）叶结点或终端结点（Leaf）：度为0的结点；
（5）非终结点或分支结点：度不为0；
（6）内部结点：根结点，分支结点。树的度是树内部结点的度的最大值。
（7）结点的子树称为该结点的孩子（child），相应地，该结点称为孩子的双亲（Parent）。同一个双亲的孩子之间互称兄弟（Sibling）。结点的祖先是从根到该结点****所经分支上的所有结点。以某结点为根的子树中的任一结点都称为该结点的子孙。
（8）结点的层次（level）：根为第一层，根的孩子为第二层。双亲在同一层的，互称为堂兄弟。
（9）树的深度（Depth）或高度：树中结点的最大层次。
（10）有序树：树中结点的各子树看成从左至右是有次序的，不能互换的。否则，称为，无序树。
（11）森林（Forest）：m(m>=0)棵互不相交的树的集合。

线性结构	树结构
第一个数据元素：无前驱	根结点：无双亲，唯一
最后一个数据元素：无后继	叶结点：无孩子，可以多个
中间元素：一个前驱一个后继	中间结点：一个双亲多个孩子

5.2树的存储结构

（1）双亲表示法：每个结点中，附设一个指示器指示其双亲结点在数组中的位置。

data	parent

data是数据域，存储结点的数据信息；parent是指针域，存储该结点的双亲在数组中的下标。

data	parent	firstchild

增加一个长子域，存储长子的下标，对于有0或1个孩子的结点来说，这样的结构解决了要找结点孩子的问题，甚至是有2个孩子，知道长子是谁，另一个当然就是次子。

data	parent	rightsib

增加右兄弟域，体现兄弟关系。存储右兄弟的下标。

小结：上述结构可以组合，存储结构的设计是一个非常灵活的过程，一个存储结构设计得是否合理，取决于该存储结构的运算是否适合、是否方便，时间复杂度好不好等。

（2）孩子表示法：
多重链表表示法：每个结点有多个指针域，其中每个指针指向一棵子树的根结点。

data	child1	child2	child3	…	childd

data是数据域，child1到childd是指针域，用来指向该结点的孩子结点。
方案一：指针域的个数等于树的度。
方案二：指针域的个数等于该结点。

data	degree	child1	child2	child3	…	childd

其中degree为度，存储该结点的孩子结点的个数。

**具体解决办法：**把每个结点的孩子结点排列起来，用单链表做存储结构，则n个结点有n个孩子链表，如果是叶子结点则此单链表为空。然后，n个头指针又组成一个线性表，采用顺序存储结构，存放进一个一维数组中。
但，在这个结构中，要知道某个结点的双亲，需要遍历所有结点。此处可以把双亲表示法与孩子表示法结合一下。双亲孩子表示法。

（3）孩子兄弟表示法

data	firstchild	rightsib

任意一棵树，它的结点的第一个孩子如果存在就是唯一的，它的右兄弟如果存在也是唯一的。data数据域，firstchild指向该结点的第一个孩子结点，rightsib指向该结点的右兄弟结点。
这种方法将复杂的树，表示成了一棵二叉树。

5.3二叉树（Binary Tree）

5.3.1二叉树的基本概念

(1)定义：二叉树是n(n>=0)个结点的有限集合，该集合或者为空集（称为空二叉树），或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
（2）二叉树的特点：

每个结点最多有两棵子树
左、右子树有序，即使只有一棵子树也做不同区分
（3）五种基本形态：空二叉树、只有一个根结点、根结点只有左子树、根结点只有右子树、根结点既有左子树又有右子树。

5.3.2特殊的二叉树

（1）斜树（左斜树，右斜树）
（2）满二叉树：

叶子结点只出现在最下一层
非叶子结点的度为2
在同样深度的二叉树中，满二叉树的结点个数最多，叶子数最多
（3）完全二叉树：二叉树按层序编号，与满二叉树中对应位置编号完全相同，则称为完全二叉树。（编号不能出现空挡，否则就不是完全二叉树）。特点：
叶子结点只能出现在最下两层
最下层的叶子一定集中在左部连续位置
倒数第二层，若有叶子结点，一定都在右部连续位置
如果结点度为1，则该结点只有左孩子，即不存在只有右子树的情况。
同样结点数的二叉树，完全二叉树的深度最小。

5.4二叉树

5.4.1二叉树的性质

（1）第i层，最多有2^i-1个结点
（2）深度为K,至多有2^k-1个结点
（3）终端结点数为n₀度为2的结点数为n₂，则n₀=n₂+1。利用分支数推导
（4）具有n个结点的完全二叉树的深度为[log₂n]+1。（[x]表示不大于x的最大整数）
（5）如果对一棵有n个结点的完全二叉树，对任意结点i

若i=1,则i是二叉树的根，无双亲；若i>1，则其双亲是结点[i/2]
若2i>n，则结点i无左孩子（结点i为叶子结点）；否则，其左孩子是结点2i
若2i+1>n，则结点i无右孩子；否则其右孩子是结点2i+1

5.4.2二叉树的存储结构

（1）二叉树的顺序存储结构
完全二叉树按层序编号存储在数组中；对于一般二叉树，可以对没有结点的地方留空“^”
（2）二叉链表

lchild	data	rchild

5.4.3二叉树遍历（递归）

（1）二叉树的遍历，所有结点，访问一次且仅被访问一次。
（2）二叉树遍历方法：

前序遍历：根结点–左子树–右子树
中序遍历：左子树–根结点–右子树
后序遍历：从左至右先叶子后结点的方式，访问左右子树，最后访问根结点
层序遍历：从上至下逐层遍历，同一层从左到右。

注意：

已知前序遍历和中序遍历，可以唯一确定一棵二叉树
已知后续遍历和中序遍历，可以唯一确定

但已知前序和后续，则不行。如前序ABC,后续CBA,则有4种情况

5.5二叉树的建立（递归）

（1）普通二叉树；
（2）扩展二叉树：每个结点的空指针引出一个虚结点“#”。

5.6线索二叉树

（1）n个结点的二叉树，（二叉链表存储），有n-1条分支，存在2n-（n-1）=n+1个空指针域。
（2）指向前驱和后继的指针称为线索，加上线索的二叉链表称为线索链表，相应的二叉树就称为线索二叉树。将二叉树转变成一个双向链表。
（3）对二叉树以某种次序遍历使其变为线索二叉树的过程承做是线索化。

lchild	ltag	data	rtag	rchild

ltag=0,该结点指向左孩子，=1指向前驱
rtag=0,该结点指向右孩子，=1指向后继

（4）线索化的过程就是遍历的过程中修改空指针的过程。

5.7树、森林与二叉树的转换

（1）树转二叉树：

加线：兄弟之间
去线：树中结点，只保留它与第一个孩子结点的连线
层次调整：第一个孩子是左孩子，兄弟转化来的是右孩子

（2）森林转化为二叉树

每棵树转换为二叉树
第一棵二叉树不动，从第二棵树开始，依次把后一颗树的根结点作为前一棵二叉树根结点的右孩子，用线连起来。

（3）二叉树转换成树（逆过程）

加线：某结点左孩子存在，则将其左孩子的所有右孩子作为此结点的孩子
去线：删除原二叉树中所有结点与其右孩子结点的连线。
层次调整

（4）二叉树转换成森林
判断一棵二叉树转换成一棵树，还是森林，看这个二叉树的根结点有没有右孩子即可。有则可以转换成森林，没有则转换成树

从根节点开始，若右孩存在，则删除连线
然后将分离的二叉树转换成树

（5）树的遍历

先根遍历树（类似于前序）：先访问树的根结点，然后依次先根遍历根的没棵子树
后根遍历（类似于后序）：先依次后根遍历每棵子树，然后访问根结点。

（6）森林的遍历

前序遍历：依次先根遍历每棵树
后序遍历：依次后根遍历每棵树

5.8赫夫曼树及其应用

（1）最基本的压缩编码方法
（2）路径长度：一个结点到另一个结点之间路径上的分支数。
（3）树的路径长度：根结点到每一结点的路径长度之和。
（4）结点的带权路径长度：从该结点到树根之间的路径长度与结点上权的乘积
（5）树的带权路径长度：根结点到每一结点的带权路径长度之和
（6）带权路径长度WPL最小的二叉树称作赫夫曼树。（最优二叉树）
（7）赫夫曼算法描述:

1）n个权值{ w1,w2…wn}，n棵二叉树集合F={T1,T2,T3…Tn}（仅有根结点）
2)选两个权值最小的根结点做左右子树，构造新的二叉树，且置新的二叉树的根结点的权值为左右子树权值之和.
3)在F中删除这两棵树，加入新二叉树
4)重复2）和3）步骤，直到F只含一棵树为止。

（8）前缀编码：任一字符的编码都不是另一个字符的编码的前缀。（设计长短不等的编码）
（9）赫夫曼编码：

字符集
电文出现的频率集
以字符作为叶子结点，以频率作为权重
进行赫夫曼编码，
规定做分支为0，右分支为1；对字符进行编码

6图

6.1图的基本概念

（1）图的表示：G(V,E)。V为图G中顶点（Vertex或Node）的集合，要求：有穷非空；E是图G中边的集合，可以为空。
（2）无向边（Edge）：无序偶对（v_i,v_j）表示；无向图
（3）有向边:也称为弧（Arc）,有序偶i,v_j>表示，v_i弧尾（Tail），v_j弧头(Head)。有向图。
（4）简单图：不存在顶点到自身的边，不存在同一条边重复出现。
（5）无向完全图：任意两个顶点之间都存在边的无向图。共有n(n-1)/2条边（因计算有重复）
（6）有向完全图：同上，共有n(n-1)条边。
（7）稀疏图：有很少条边或弧。反之，为稠密图
（8）边或弧相关的数叫做权（Weight）,带权图称之为网。
（9）子图（Subgraph），与子集概念类似。
（10）(v,v’)属于E，则称顶点v和v’互为邻接点（Adjacent）,(v,v’)与顶点v和v’相关联。顶点v的度是和v相关联的边的数目。TD(v)。
（11）有向图中：入度ID（v）,出度OD(v),顶点v的度TD(v)=ID（v）+OD(v)
(12)路径（path）:一个顶点序列。路径的长度是路径上的边或弧的数目。
（13）回路或环(Cycle)：第一个顶点到最后一个顶点相同的路径。
(14)简单路径:序列中顶点不重复出现的路径
（15）简单回环或简单环：除第一和最后顶点外，其余点不重复的回路。
（16）连通图：任意两个顶点连通的无向图，任意两顶点之间有路径，称之为连通。
（17）无向图中的极大连通子图：连通分量。
（18）在有向图中，任意两点间存在路径，称为强连通图。有向图中的极大强连通子图称为有向图的强连通分量。
（19）连通图的生成树：一个极小的连通子图。n个顶点，n-1条边
（20）有向图中，恰有一个顶点入度为0，其余顶点的入度均为1，则是一棵有向树。有向图生成的森林：由若干棵有向树组成，含有图中全部顶点，但只有足以构成若干棵不相交的有向树的弧。

6.2图的存储结构

6.2.1图的邻接矩阵存储方式：

（1）一个一维数组存储图中顶点信息，一个二维数组（邻接矩阵）存储边或弧的信息。无向图对称，有向图不对称。
（2）网：没有边的权值设定为极大值。

6.2.2邻接表的存储方式

（1）将数组与链表相结合的存储方式
（2）处理方式：

数组存放顶点信息，每个顶点数据中还需要存储指向第一个邻接点的指针。
每个顶点的所有邻接点构成一个线性表，用单链表存储，无向图叫边表，有向图叫弧尾的出边表。

注：在有向图中，有逆邻接表，即以顶点为入度关系的边表；可以在边表汇总增加一个权值数据域。

6.2.3 十字链表（有向图）

（1）邻接表：关心出度问题；逆邻接表：关心入度问题。两者结合成十字链表。容易获得顶点的出度与入度。
顶点表的结构如下：

data	firstin	firstout

firstin表示入边头指针，firstout表示出边头指针。

tailvex	headvex	headlink	taillink

tailvex 指弧起点在顶点表的下标，headvex指弧终点在顶点表的下标；headlink指入边表指针域，指向终点相同的下一条边。taillink指边表指针域，指向起点相同的下一条边。如果是网，可增加Weight。

6.2.4邻接多重表

（1）在无向图中，删除边操作。
重新定义边表结点：

ivex	ilink	jvex	jlink

ivex，jvex表示与某条边所依附的两个顶点在顶点表中的下标。ilink指向依附顶点ivex的下一条边；jlink指向依附顶点jvex的下一条边。

6.2.5边集数组

（1）由两个一维数组组成。一个存储顶点信息，一个存储边的信息。每个边数组由一条边的起点下标（begin）,终点下标（end）和权（weight）

适合于对边进行处理操作。

6.3图的遍历

（1）访遍所有顶点，仅访问一次
（2）深度优先遍历（Depth_First_Search）,DFS.

类似于一棵树的前序遍历
连通图，可一次完成；对于非连通图，则对其连通分量分别进行深度优先遍历。
邻接矩阵的时间：O(n²)
邻接表的时间：O(n+e)，n个顶点，e条边。适用于点多边少时，效率大大提高

（3）广度优先遍历（Breadth_First_Search）,BFS

类似于树的层序遍历

小结：深度优先更适合目标比较明确，以找到目标为主要目的的情况；
而广度优先更适合在不断扩大遍历范围时找到相对最优解的情况。

6.4最小生成树

（1）一个连通图的生成树是一个极小的连通子图。包括图中所有顶点，只有足以构成一棵树的（n-1）条边
（2）最小生成树：构造连通网的最小代价生成树。
（3）经典方法：普里姆算法（Prim）（O(n²)）与克鲁斯卡尔（Kruskal）（O(eloge)）算法

Prim：以某顶点为起点，逐步找各顶点上最小权值的边来构建最小生成树。适用于稠密图，边比较多的情况。
Kruskal：直接找权值最小的边来构建生成树，过程中防止形成环路。边比较少的，稀疏图。

6.5最短路径

（1）最短路径：对于非网图即两顶点之间边数最少；对于网图即两点之间边上权值和最小。源点，终点
（2）迪杰斯特拉（Dijkstra）算法（O(n²)）：基于已经求出的最短路径的基础之上，求得更远顶点的最短路径。每一步最优。要求任意顶点到其余所有顶点的最短距离时（O(n³)）.
(3)佛洛依德（Floyd）算法(O(n³))：求所有顶点至所有顶点的最短路径的问题。

6.6 拓扑排序

（1）无环的图应用；即图中没有回路。
（2）AOV网（Activity On Vertex Network）：表示工程的有向图，顶点表示活动，弧表示活动之间的优先关系。
（3）G=(V，E)为n个顶点的有向图，V中的顶点序列，若v_i到v_j有一条路径，则在顶点序列中顶点v_i必须在顶点v_j之前。我们称这样的顶点序列为一个拓扑序列。
（4）拓扑排序：对一个有向图构造拓扑序列的过程。
输出结果有两个：

一是全部顶点被输出，说明他是不存在环（回路）的AOV网；
二是顶点数少了，说明这个网存在环（回路），不是AOV网；

适用于各种各样的工程或项目的流程图中。

（5）拓扑排序算法思路：

从AOV网中选择一个入度为0的顶点输出，然后删去此顶点，并删除以此顶点为尾的弧，
继续重复此步骤，知道输出全部顶点或AOV网中不存在入度为0的顶点为止。
时间复杂度：O(n+e)
解决一个工程能否顺序进行的问题

6.7关键路径

（1）AOE网（Activity On Edge Network）：在一个表示工程的带权有向图中，用顶点表示事件，用有向边表示活动，用边上的权值表示活动的时间，这种有向图的边表示活动的网。
（2）始点或源点（没有入边）；终点或汇点（没有出边）。
（3）路径长度：路径上各个活动所持续的时间之和；
（4）关键路径：从源点到汇点具有最大长度的路径；在关键路径上的活动，叫关键活动。
（5）该算法对于工程的前期工期估算和中期的计划调整都有很大的帮助。对于有几条关键路径的有向无环图，需要同时在几条路径上提高速度才行。

7查找（Search）

7.1基本概念

（1）查找表（Search Table）：同一类型的数据元素（或记录）构成的集合。
（2）关键字（Key）：数据元素中某个数据项的值，又称为键值，用它可以标记一个数据元素。也可以标识一个记录的某个数据项（字段），我们称之为关键码。
（3）主关键字（Primary key）：可以唯一地标识一个记录。主关键字所在的数据项称为主关键码。
（4）次关键字（Secondary key）：可以识别多个数据元素（或记录）的关键字。次关键字所对应的数据项称为次关键码
（5）查找：即给定某个值，在查找表中确定一个其关键字等于给定值得数据元素（或记录）。
（6）静态查找表（Static Search Table）：只作查找操作的查找表

“特定的”数据是否在表中
检索“特定的”数据元素和各种属性

（7）动态查找表（Dynamic Search Table）

查找时插入数据元素
查找时删除数据元素

7.2顺序表查找（O(n)）

（1）顺序查找（Sequential Search）又叫线性查找。从表中第一个（或最后一个）记录开始，逐一比较，查找。
（2）优化：设置哨兵，从尾部比较

7.3有序表查找

（1）折半查找（Binary Searc
h）又称二分查找。（O(logn)）

前提：关键码有序，线性变必须采取顺序存储。

(2)插值查找（interpolation search）

适用于关键字分布比较均匀的查找
插值公式
$+\frac{key-a[low]}{a[high]-a[low]}(high-low)$

(3)斐波拉契查找（Fibonacci Search）

利用了黄金分割原理实现
时间复杂度：O(logn)，平均性能优于折半查找，特殊情况下，也有效率低于折半查找的情况

小结：折半查找时加法与除法运算，插值查找进行复杂的四则运算，斐波拉契查找只是简单的加减法运算。

7.4线性索引查找

（1）数据按先后顺序存储，海量数据。
（2）索引：是为了加快查找速度而设计的一种数据结构。即把一个关键字与对应的记录相关联的过程。一个索引由若干个索引项构成，每个索引项至少包含关键字和其相对应的记录在存储器中位置等信息。
（3）索引按结构分类：线性索引，树形索引和多级索引。
（4）线性索引：将索引项集合组织为线性结构，也称为索引表。
（5）三种线性索引：稠密索引，分块索引和倒序索引。
（6）稠密索引：

在线性索引中，将数据集中的每个记录对应一个索引项。
索引项是按照关键码有序排列的。（这是稠密索引的优点，但当数据集非常大，比如上亿，那就意味着索引也得有同样的数据集长度规模，对于内存有限的计算机来说，可能就需要反复去访问磁盘，查找性能大大下降）
可用到折半，插值，斐波拉契等有序查找算法

（7）分块索引：
被广泛应用于数据库表查找等技术。

分块有序，是把数据集的记录分成了若干块，并且这些块需要满足两个条件：
1）块内无序
2）块间有序
分块索引的索引项结构：
最大关键码
块中的记录个数
用于指向块首数据元素的指针
分块索引查找步骤：
1）块间有序，可用折半查找，插值等算法
2）块内无序，则用顺序查找
算法的时间复杂度：若n=t时，则为O( $\sqrt{n}$ )

(8)倒排索引
记录号表存储具有相同次关键字的所有记录的记录号（可以是指向记录的指针或是该记录的主关键字）

1）最基础的搜索技术
2）索引项的通用结构：次关键码和记录号表
查找记录非常快。但维护比较困难，插入或删除操作都需要作相应的处理。

小注：做好这方面的研究，可否进google或百度做搜索引擎的软件工程师。

7.5二叉排序树（Binary Sort Tree）

(1)又称二叉查找树（中序遍历即可得到从小到大的排列）

若左子树不空，则左子树上所有值均小于它的根结点值
若右子树不空，则右子树上所有值均大于它的根结点值
它的左右子树分别为二叉排序树
（2）二叉排序树的删除：
叶子结点
仅有左或右子树的结点
左右子树均有的结点（找到直接前驱或后继，替换该结点，然后删除该结点）

（3）二叉排序树的查找性能取决于二叉排序树的形状，但其形状是不确定的，应尽可能的使其深度与完全二叉树相同，均为[log₂n]+1，那么查找时间复杂就是O(logn)，近似于折半查找,若时左或右斜树，则为O(n),和顺序查找没有区别。

7.6平衡二叉树（AVL树）

（1）一种二叉排序树，其中每个结点的左右子树的高度差至多等于1。
（2）一种高度平衡的二叉树
（3）将二叉树上每一个结点的左子树深度减去右子树深度的值称为平衡因子BF(Balance Factor)。即BF=-1,0,1则是平衡二叉树
(4)最小不平衡树：距离插入结点最近的，且平衡因子的绝对值大于1的结点为根的子树。
（5）平衡二叉树构建的基本思想：在构建二叉排序树的过程中，每当插入一个结点时，先检查是否因插入而破坏了树的平衡性，若是，则找出最小不平衡树。在保证二叉排序树特性前提下，调整最小不平衡树中各结点之间的链接关系，进行相应的旋转，使之成为新的平衡子树。
（6）查找时间复杂度：O(logn)，插入和删除也一样。

二叉排序树还有其他平衡方法：红黑树（Red Black Tree）

7.7多路查找树（Multi-way search tree）（B树）

（1）每个结点的孩子数可以多于两个，且每个结点处可以存储多个元素。由于是查找树，所有元素之间存在某种特定的排序关系。
(2)每个结点存储多少个元素，以及它的孩子数是非常关键的部分。4种特殊形式：2-3树，2-3-4树，B树，B+树
（3）2-3树

概念：每个结点都具有2个孩子（2结点）或3个孩子（3结点）。
一个2结点包含一个元素和两个孩子（或没有孩子）；不能只有一个孩子。（序列大小关系类似二叉排序树）
3结点：一小一大两元素和三个孩子（或没有孩子）。左子树包含小于较小元素的元素，右子树包含大于较大元素的元素，中间子树包含介于两元素之间的元素。
2-3树的叶子要求都在同一层次上。

（4）2-3-4树

类比于2-3树，对其概念的拓展

（5）B树（B-tree）

一种平衡的多路查找树
2-3树和2-3-4树都是B树的特例。
结点最大的孩子数目称为B树的阶（order）
2-3树是3阶B树，2-3-4树是4阶B树
B树的数据结构是为内外存的数据交互准备的

（6）B+树

B+树是应文件系统所需而出的一种B树的变形树
特别适用于带有范围的查找

7.8散列表查找（哈希表）

7.8.1基本概念

（1）散列技术是在记录的存储位置和它的关键字之间建立一个确定的对应关系f，使得每个关键字key对应一个存储位置f（key）。.
（2）f称为散列函数，又称为哈希（Hash）函数。
（3）采用散列技术将记录存储在一块连续的存储空间中，这块连续存储空间称为散列表或哈希表（Hash table）。
（4）散列技术既是一种存储方法，也是一种查找方法。
（5）散列技术最适合的求解问题是查找与给定值相等的记录。
（6）不适用的地方：

同样的关键字对应很多记录
范围查找

（7）冲突：两关键字key1与key2不相等，但f(key1)与f(key2)却相等。此时，key1与key2被称为散列函数的同义词。

7.8.2散列函数的构造

（1）要求：计算简单、散列地址分布均匀
（2）常用方法1：直接定址法

取关键字的某个线性函数值为散列地址，即f(key)=a*key+b,(a,b均为常数)
适用查找表较小且连续的情况

（3） 常用方法2：数字分析法

适合处理关键字位数比较大的情况。抽取，之后可对数字进行反转，右环位移，左环位移，等操作
如果事先知道关键字的分布且关键字的若干位分布较均匀，可以考虑用此法

（4）常用方法3：平方取中法

适用于不知道关键字的分布，而位数又不是很大的情况

（5）常用方法4：折叠法

事先不需要知道关键字的分布，适合关键字位数较多的情况。

（6）常用方法5：除留余数法

对散列表长度为m的散列函数公式为：f(key)=key mod p (p<=m)
- p的取值十分关键，经验通常p为小于或等于表长（最好接近m）的最小质数或不包含小于20质因子的合数。

（7）常用方法6：随机数法

f(key)=random (key)
当关键字的长度不等时，采用这个方法较合适

小结：综合考虑的因素构造散列表

计算散列表地址所需要的时间
关键字的长度
散列表的大小
关键字的分布情况
记录查找的频率

7.8.3处理散列冲突的方法

（1）开放定址法

只要发生冲突，就寻找下一个空的散列地址，前提是散列表未填满
公式：f_i(key)=(f(key)+d_i)MOD m (d_i=1,2,3,…,m-1)
又称线性探测发
上诉方法会导致，不是同义词却需要争夺一个地址的情况，被称为堆积。
二次探测：f_i(key)=(f(key)+d_i)MOD m (d_i=1²,-1²,2²,-2²,…,q²,-q², q<=m/2)
随机探测：对d_i采用随机函数得到。采用的是伪随机数，采用同样的随机种子，使存储和读取时，产生同样的随机数。

（2）再散列函数法

当冲突时，就换新的散列函数（RH_i(key) ）
f_i(key)=RH_i(key) (i=1,2,…k)
增加了计算时间

（3）链地址法

在冲突位置给单链表增加结点
存在在查找时需要遍历单链表的性能损耗

（4）公共溢出区法

新建溢出表，存储冲突元素，在溢出表中顺序查找。
在溢出较少的情况下，公共溢出区的结构对查找性能来说还是非常高的

7.8.4散列表查找的实现

（1）散列表查找性能分析

散列函数是否均匀
处理冲突的方法
散列表的填装因子( $\alpha$ )：=填入表中的记录数/散列表长度。
散列表的时间复杂度：O(1)，通常将散列表的空间设置的比查找集大，以空间换时间，提高查找效率。

8排序

（1）

你可能感兴趣的:(初学者)

Python通关秘籍之基础教程(一） Smile丶Life丶 Python 通关指南：从零基础到高手之路 python 开发语言后端
引言在编程的世界里，Python就像一位温和而强大的导师，它以简洁优雅的语法和强大的功能吸引着无数初学者和专业人士。无论你是想开发网站、分析数据、构建人工智能，还是仅仅想学习编程思维，Python都是你的理想选择。Python的魅力在于它的易读性和广泛的应用场景。它的代码就像英语句子一样自然，即使是完全没有编程经验的人也能快速上手。同时，Python拥有庞大的生态系统，从Web开发（Django、
MiniMind：3小时训练26MB微型语言模型，开源项目助力AI初学者快速入门 nine是个工程师关注人工智能语言模型开源
开发｜界面｜引擎｜交付｜副驾——重写全栈法则：AI原生的倍速造应用流来自全栈程序员nine的探索与实践，持续迭代中。欢迎关注评论私信交流~在大型语言模型(LLaMA、GPT等)日益流行的今天，一个名为MiniMind的开源项目正在AI学习圈内引起广泛关注。这个项目让初学者能够在3小时内从零开始训练出一个仅26.88MB大小的微型语言模型，体积仅为GPT-3的七千分之一，却完整覆盖了从数据处理到模型
FPGA电子系统设计项目实战VHDL语言第2版王振红：深入掌握FPGA设计姜奇惟Sparkling
FPGA电子系统设计项目实战VHDL语言第2版王振红：深入掌握FPGA设计【下载地址】FPGA电子系统设计项目实战VHDL语言第2版王振红这是一本专注于FPGA电子系统设计的实战指南，适合初学者和进阶开发者。全书共11章，从FPGA设计基础到VHDL语言应用，再到综合电子系统设计实例，内容全面且实用。通过深入浅出的讲解，读者不仅能掌握FPGA设计方法，还能具备实际应用能力。书中详细介绍了Quart
FPGA电子系统设计项目实战 VHDL语言第2版王振红幸刚磊Thomas
FPGA电子系统设计项目实战VHDL语言第2版王振红【下载地址】FPGA电子系统设计项目实战VHDL语言第2版王振红这是一本专注于FPGA电子系统设计的实战指南，适合初学者和进阶开发者。全书共11章，从FPGA设计基础到VHDL语言应用，再到综合电子系统设计实例，内容全面且实用。通过深入浅出的讲解，读者不仅能掌握FPGA设计方法，还能具备实际应用能力。书中详细介绍了QuartusⅡ工具的使用、VH
初学者之Redis 美好的事情能不能发生在我身上 redis 数据库缓存 java 后端 spring spring boot
文章目录前言一、什么是Redis二、Redis基本类型三、通用命令四、基础命令1.String类型2.List类型3.Set类型4.Hash类型5.Zset有序集合类型五、在Java中的运用1.配置信息2.配置类3.操作String类型4.操作Hash类型5.操作List类型6.操作Set类型7.操作ZSet类型六、修改营业状态的实例总结前言第一次学习Redis，最后的目标是在idea中连接red
当保存为 Sha256 时，如何管理 MinIO 存储中的图像使用情况？ bug菌¹ 全栈Bug调优(实战版)Imagen minio Sha256
本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你早日登顶，迈向财富自由的梦想！同时，欢迎大家关注、收藏、订阅本专栏，更多精彩内容正在持续更新中。让我们一起进步，Up！Up！Up！备注：部分问题/难题源自互联网，经过精心筛选和整理，结合数
人工智能怎么入门？零基础入门指南：从小白到AI实战者的第一步 OpenCV图像识别人工智能人工智能计算机视觉自然语言处理神经网络机器学习
人工智能（AI）是当今最具前景的科技领域之一。从聊天机器人到自动驾驶，从图像识别到语音翻译，AI正在以前所未有的速度改变世界。但对于初学者来说，一个最常见的问题是：“我没有基础，也不是学数学或计算机的，人工智能还能学吗？我该怎么入门？”答案是：可以学，而且你并不孤单。越来越多的人正在以“跨专业、转行、自学”的方式进入AI领域。关键是，你需要一个清晰的入门路径，理解应该先做什么、学什么、避开什么误区
Java中容易混淆的概念解析：重载（Overload）与重写（Override）覃伟强0402 java 开发语言
一、课程引入在Java的学习过程中，重载（Overload）和重写（Override）是两个非常基础但又容易让初学者混淆的概念。它们都涉及到方法的使用，但在定义、作用范围、规则等方面有着明显的区别。理解这两个概念的区别，对于我们编写高质量、可维护的Java代码至关重要。今天，我们就来深入剖析这两个容易混淆的概念，通过实际代码示例，让大家清晰地掌握它们的差异。二、变量、常量和字段变量：在Java中，
python的基础语法1《从“Hello World”到“Hello Universe”：一个初学者的语法狂想曲》 Monkey的自我迭代 python学习 python 开发语言
别让缩进、报错劝退！手把手避坑，Python少走弯路。一最基础的函数print()该函数的参数有6种形式，分别为字符串，变量，表达式，多个参数，末尾设置，函数。下面是示例代码：print(666)#字符串a=1print(a)#变量b=1c=2print(b+c)#表达式d=1print('计算结果为:',d)#多个参数print(1,2,3,end='')#末尾设置print(list(1,2,
使用 Node.js 调用 DeepSeek API：一个简单示例 CDOG程序狗 node.js
好的！以下是一篇简洁的文章，介绍如何使用前端JavaScript（以Node.js为例）调用DeepSeekAI框架，并提供一个具体的代码示例。文章面向初学者，涵盖基本步骤和注意事项。使用Node.js调用DeepSeekAPI：一个简单示例DeepSeek是一个强大的AI平台，提供类似OpenAI的API接口，开发者可以通过JavaScript轻松集成其语言模型，实现智能问答、文本生成等功能。本
定义一个dto对象_正确理解DTO、值对象和POCO
今天推荐的文章比较技术化也比较简单，但是对于一些初学者而言，可能也是容易搞混的概念：就是如何理解DTO、值对象和POCO之间的区别。所谓DTO就是数据传输对象(DataTransferObject)，POCO就是简单CLR对象(PlainOldCLRObject)，概念来源于Java中的POJO；不过值对象(ValueObject)并非.NET中的值类型(ValueType)的实例对象，而是领域驱
使用Python进行数据可视化的初学者指南
首先，我们需要确保你的计算机上安装了Python环境。访问Python官方网站可以下载最新的Python版本。接下来，我们将使用matplotlib库来进行图形绘制，这是一个广泛使用的绘图库。你可以通过Python的包管理器pip来安装它：pipinstallmatplotlib一旦安装完成，我们就可以开始绘制我们的第一个图表了。让我们从最简单的图形——折线图开始。假设我们有以下数据集表示某城市一
Python核心基础DAY1--Python的基础变量类型之字符串和数字类型
一、引言Python作为一种功能强大且广泛应用的编程语言，其基础变量类型是构建各种复杂程序的基石。在Python中，字符串和数字类型是最常用的基础变量类型之一。对于初学者来说，深入理解这两种类型是掌握Python编程的关键第一步。无论是数据处理、算法实现还是构建Web应用程序，对字符串和数字类型的熟练运用都至关重要。二、变量变量是代数的思想，是用来引用数据和功能占位的，具备动态性和可变性；使用的变
踏上C++游戏开发之旅：初学者指南与实战代码
游戏开发是一个充满挑战和创造力的领域，而C++作为其中的一种强大工具，为开发者提供了实现他们最狂野游戏创意的能力。如果你是一个初学者，想要开始学习C++游戏开发，那么这篇文章将为你提供一条清晰的学习路径和实用的代码示例，帮助你迈出第一步。1.基础知识：C++和计算机科学在开始游戏开发之前，你需要确保自己已经掌握了C++的基本语法和一些计算机科学的基础知识。这包括但不限于：变量和数据类型控制结构（i
HDFS 伪分布模式搭建与使用全攻略（适合初学者 & 开发测试环境） huihui450 hdfs hadoop 大数据
HDFS（HadoopDistributedFileSystem）作为Hadoop生态系统的核心组件，广泛应用于海量数据的分布式存储场景。对于开发者而言，伪分布模式提供了一种低成本、高还原度的学习与测试方式。本文将详细介绍如何在本地搭建并使用HDFS的伪分布模式，包括环境准备、配置过程、常用命令及常见问题排查，帮助你快速入门Hadoop分布式文件系统的实践操作。一、什么是伪分布模式？Hadoop有
为什么国内的教科书编写的如此晦涩？点云SLAM 数学学习方法
很多人在学习过程中都有类似感受：中国的教科书“难搞懂”。造成这种现象的原因主要可以从以下几个方面来分析：1.教学目标更重“系统性”而非“启发性”中国教科书通常强调知识的完整性、系统性、逻辑性，但不强调引导性和直觉体验。很多内容是按照“定义→定理→推论”的顺序展开，对初学者不友好，因为缺少“为什么要学”“生活中的例子”“背后直觉”的铺垫。国外教材比如《Calculus》（Stewart）会在每章开头
AI初学者如何对大模型进行微调？——零基础保姆级实战指南
仅需8GB显存，三步完成个人专属大模型训练四步实战：从环境配置到模型发布步骤1：云端环境搭建（10分钟）推荐使用阿里魔塔ModelScope免费GPU资源：#注册后执行环境初始化pip3install--upgradepippip3installbitsandbytes>=0.39.0gitclone--depth1https://github.com/hiyouga/LLaMA-Factory.
为什么在 macOS 中运行 Python 项目必须使用虚拟环境？ coding随想 Python macos python 开发语言
为什么在macOS中运行Python项目必须使用虚拟环境？在macOS上开发Python项目时，虚拟环境（VirtualEnvironment）是一个不可或缺的工具。无论你是初学者还是资深开发者，理解虚拟环境的意义和使用方法，都是提升开发效率和项目稳定性的关键。本文将从macOS的特殊性出发，深入浅出地解释为什么在macOS中运行Python项目必须使用虚拟环境。一、macOS系统Python的局
C#的接口有什么用？ alincea C#C#接口interface
转自：https://blog.csdn.net/seanbei/article/details/37812477接口对于初学者来说是一个太抽象的东西。看了教材之后基本都是一个感觉：接口到底是用来干嘛的？书上讲声明接口，实现接口，并不难，难的是什么时候用接口呢？网上有几个非常通俗的讲解，很受益。再用自己的思路梳理一下，应该不算抄袭吧。案例：猫狗叫声明接口：interface接口-叫{方法-叫();
【免费下载】 Python 3.9 安装包下载皮香菡Ethel
Python3.9安装包下载【下载地址】Python3.9安装包下载本仓库提供Python3.9的安装包下载。Python是一种广泛使用的编程语言，它具有简洁易懂的语法，适合编程新手和经验丰富的开发者使用。无论您是初学者还是专业人士，Python都能帮助您快速实现您的编程目标项目地址:https://gitcode.com/open-source-toolkit/41ae8资源描述本仓库提供Pyt
深入详解 AI 与深度学习：从零开始掌握 BERT 模型架构拉不拉斯AICoding 技术探索人工智能深度学习 bert
深入详解AI与深度学习：从零开始掌握BERT模型架构引言在自然语言处理（NLP）领域，BERT（BidirectionalEncoderRepresentationsfromTransformers）是近年来最具影响力的模型之一。它通过双向上下文理解彻底改变了NLP任务的处理方式。本文将从基础概念到核心原理、应用场景和实践技巧，深入浅出地讲解BERT，帮助初学者快速掌握这一技术。一、BERT的核心
新手必看的python学习心得 2401_89815407 python 开发语言
Python学习心得：从入门到实践的体会Python作为一门简洁高效的编程语言，其学习过程充满趣味与挑战。通过系统学习与实践，总结出以下关键经验与感悟。Python新手常见代码问题及解决方法Python作为一门易学易用的编程语言，吸引了大量初学者。然而新手在学习过程中常会遇到一些典型问题。以下是常见问题及解决方案。缩进错误Python使用缩进区分代码块，新手容易混淆缩进方式或忘记缩进。正确做法是统
【Python】——使用python实现GUI图书管理系统：Tkinter+SQLite实战星星法术嗲人 python基础 sqlite 数据库
本文将通过一个完整的python项目——图书管理系统，演示如何利用Tkinter构建GUI界面，结合SQLite数据库实现增删改查功能。代码简洁易懂，适合python初学者学习和二次开发。一、项目功能概览图书管理：添加、查看、修改、删除图书信息数据存储：使用SQLite持久化存储图书数据可视化界面：表格展示数据，支持快速选择和编辑输入校验：关键字段非空校验与操作确认提示二、技术栈与依赖库impor
【小米App】编程猫入门指南 Botiway 移动APP windows android studio python linux kotlin
编程猫提供了多种工具和课程，帮助用户入门安卓应用开发。以下是入门指南：选择开发工具AppInventor：适合初学者，通过拖拽式的可视化编程，无需编写复杂代码即可创建安卓应用。学习基础课程编程猫官方课程《AppInventor入门》：学习AppInventor的基本操作，了解组件、事件和逻辑设计。《安卓应用开发基础》：掌握安卓应用的基本结构、界面布局和常用控件。在线教程和视频在编程猫官网、Bili
python聚合函数aggregate和annotate的小坑你喝不喝热水啊 python python
最近在工作项目中发现了一个坑，就是关于aggregate和annotate这两个聚合函数的区别用法。现在百度上很多搜索的答案对初学者不是很友好，就是直接给出了一句代码，然后也不讲清楚，就用annotate后的结果取第一条（如：a[0]）取值。这样就导致很多初学者也不会去思考太多，直接copy下来就用，最后导致数据汇总有问题（也不止初学者了，项目组里面有些工作了几年的人都不知道二者区别，也是百度到了
深入理解安卓系统架构与开发技术
本文还有配套的精品资源，点击获取简介：安卓基础知识课程为初学者及进阶开发者提供安卓系统架构、关键开发技术以及最新开发工具的全面介绍。课程涵盖了从系统架构层面的核心概念如HAL、系统库、应用框架、应用程序层，到应用开发的关键组件，包括Dalvik/ART虚拟机、UI设计、Intent通信机制、资源管理、权限系统、进程与线程处理、AndroidStudio/Gradle集成、应用调试与测试，以及And
【高频考点精讲】前端性能监控中的安全隐患：如何安全地收集用户数据全栈老李技术面试前端高频考点精讲前端 javascript html css 面试题 react vue
前端性能监控中的安全隐患：如何安全地收集用户数据‍作者：全栈老李更新时间：2025年7月‍适合人群：前端初学者、进阶开发者版权：本文由全栈老李原创，转载请注明出处。最近有个粉丝在后台问我："老李啊，我们公司要做性能监控，但法务部门死活不让收集用户数据，说会踩红线，这活儿还怎么干？"这问题问得好，今天咱们就来聊聊这个前端工程师的必修课——如何在性能监控中安全地收集数据。（全栈老李友情提示：本文代码示
【高频考点精讲】前端AR/VR开发入门：WebXR API的基本使用场景全栈老李技术面试前端高频考点精讲前端 javascript html css 面试题 react vue
前端AR/VR开发入门：WebXRAPI的基本使用场景‍作者：全栈老李更新时间：2025年6月‍适合人群：前端初学者、进阶开发者版权：本文由全栈老李原创，转载请注明出处。最近有个学员问我："老李啊，现在元宇宙这么火，我们前端能做点啥？"我笑着告诉他："WebXR了解一下？"今天咱们就来聊聊这个让前端工程师也能玩转AR/VR的神奇API。我是全栈老李，一个喜欢把复杂技术讲简单的技术博主。WebXR是
【高频考点精讲】前端状态管理方案对比：从Redux到Zustand演进全栈老李技术面试前端高频考点精讲前端 javascript html css 面试题 react vue
前端状态管理方案对比：从Redux到Zustand演进‍作者：全栈老李更新时间：2025年6月‍适合人群：前端初学者、进阶开发者版权：本文由全栈老李原创，转载请注明出处。最近在给团队做技术分享时，发现很多同学对状态管理的选择很纠结。今天全栈老李就来聊聊这个话题，从Redux到Zustand的演进历程，帮你理清思路。状态管理的前世今生还记得2015年我刚接触React时，组件间通信全靠props层层
LintCode算法刷题记录（入门 + 简单部分）隔壁敲代码的小王算法刷题笔记算法 LintCode
由于是初学者，实现的方法都很简单，暂时不考虑效率，之后（可能）会更新1.A+B问题给出两个整数aa和bb,求他们的和。样例如果a=1并且b=2，返回3。挑战显然你可以直接returna+b，但是你是否可以挑战一下不这样做？（不使用++等算数运算符）说明a和b都是32位整数么？是的我可以使用位运算符么？当然可以注意事项你不需要从输入流读入数据，只需要根据aplusb的两个参数a和b，计算他们的和并返
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，