周陆军

讲透学烂二叉树(二)：图中树的定义&各类型树的特征分析

日常中我们见到的二叉树应用有，Java集合中的TreeSet和TreeMap，C++ STL中的set、map，以及Linux虚拟内存的管理，以及B-Tree，B+-Tree在文件系统，都是通过红黑树去实现的。虽然之前写过《再谈堆排序：堆排序算法流程步骤透解—最大堆构建原理》但是二叉树的基本性质，对我来说，从入门到放弃是搞了好几回。

树的基本概念

树（Tree）：树是一种数据结构，可以表示层次关系，它是由n（n>=1）个有限节点组成一个具有层次关系的集合。形状像一棵倒挂的树。

树：不包含回路的连通无向图（树是一种简单的非线性结构）

树有着不包含回路这个特点，所以树就被赋予了很多特性

一棵树中任意两个结点有且仅有唯一的一条路径连通
一棵树如果有n个结点，那它一定恰好有n-1条边
在一棵树中加一条边将会构成一个回路
树中有且仅有一个没有前驱的结点称为根结点

在对树进行讨论的时候将树中的每个点称为结点，

根结点|树根（root）：没有父结点的结点，即树最顶层的节点
叶结点|树叶（Leaf）：没有子结点的结点（没有子点的都称为叶子）
内部结点|分支结点|树枝（Subtree）：除了根节点以外且拥有叶子节点，即一个结点既不是根结点也不是叶结点

集合概念理解树

树（Tree）是n（n>=0）个结点的有限集。在任意一棵非空树中：

有且仅有一个特定的称为根（Root）的结点；
当n>1时，其余结点可分为m(m>0)个互不相交的有限集T1,T2,T3,...Tm，其中每一个集合本身又是一棵树，并且称为根的子树（Subtree）。

树的基本特性

结点的子树的根称为该结点的孩子（Child）。相应的，该结点称为孩子的双亲（Parent）。同一个双亲的孩子之间互称兄弟（Sibling）。其双亲在同一层的结点互为堂兄弟。

树的度

深度|高度（Depth）：是指从根结点到这个结点的层数，根结点为第一层。每个结点都有深度，比如上图左边的树的4号结点深度是3。

结点的度：结点拥有的子树的数目称为结点的度（Degree）。

树的度：树中结点的最大的度，即：是树内各结点的度的最大值。
叶子的度：度为0的结点（tips：在任意一个二叉树中，度为0的叶子结点总是比度为2的结点多一个）
分支的度：度不为0的结点

结点的层次（Level）

层次：根结点的层次为1，其余结点的层次等于该结点的双亲结点的层次加1

树的高度：树中结点的最大层次

有序树与无序树

树中结点的各子树看成从左至右是有次序的（即不能交换），则称该树为有序树，否则称为无序树。在有序树中最左边的子树的根称为第一个孩子，最右边的称为最后一个孩子。

森林（Forest）

森林（Forest）是m（m>=0）棵互不相交的树的集合。对树中每个结点而言，其子树的集合即为森林。

二叉树

二叉树(Binary Tree)是一种树形结构，它的特点是每个节点最多只有两个分支节点，一棵二叉树通常由根节点，分支节点，叶子节点组成。而每个分支节点也常常被称作为一棵子树。

二叉树是递归定义的，其结点有左右子树之分。

二叉树的基本概念：

二叉树是一种非线性结构，二叉树通常采用链式存储结构，存储结点由数据域和指针域（指针域：左指针域和右指针域）组成，二叉树的链式存储结构也称为二叉链表，对满二叉树和完全二叉树可按层次进行顺序存储

树和二叉树的三个主要差别

树的节点个数至少为1，而二叉树的节点个数可以为0
树中节点的最大度数(节点数量)没有限制,而二叉树的节点的最大度数为2
树的节点没有左右之分，而二叉树的节点有左右之分

二叉树特点：

每个结点最多有两颗子树
左子树和右子树是有顺序的，次序不能颠倒
即使某结点只有一个子树，也要区分左右子树
二叉树可为空，空的二叉树没有结点，非空二叉树有且仅有一个根节点

二叉树基本性质：

在二叉树的第k层上，至多有2^(k-1)个结点，k=1时，只有一个根节点，2^(k-1) = 2^0 = 1
深度为k的二叉树至多有2^k-1个节点，k=2时，2^k-1 = 2^2 - 1 = 3个节点
如果总结点数为n0，度为2(子树数目为2)的节点数为n2，则n0=n2+1
度为0的结点n0（即叶子结点）总是比度为2的结点多一个，即n0=n2+1
具有n个结点的完全二叉树的深度至少为[log2n]+1，其中[log2n]表示log2n的整数部分
有N个结点的完全二叉树各结点如果用顺序方式存储，如数组存储
1. left = index * 2 + 1，
2. right = index * 2 + 2
3. 序数 >= floor(N/2)都是叶子节点
给定N个节点，能构成h(N)种不同的二叉树，其中h(N)为卡特兰数的第N项，h(n)=C(2*n, n)/(n+1)。
设有i个枝点，I为所有枝点的道路长度总和，J为叶的道路长度总和J=I+2i。

二叉树中有两种特殊的二叉树：满二叉树、完全二叉树

完全二叉树：

第一种解释：完全二叉树是指最后一层左边是满的，右边可能满也可能不满，然后其余层都是满的（这句话不太好理解），看下面第二种解释

第二种解释：除第h层外，其他各层（1到h-1）的结点数都达到最大个数，第h层从右向左连续缺若干结点，则这个二叉树就是完全二叉树

也就是说如果一个结点有右子结点，那么它一定也有左子结点

第三种解释：除最后一层外，每一层上的节点数均达到最大值，在最后一层上只缺少右边的若干结点

深度为k的，有n个结点的二叉树，当且仅当其每一个结点都与深度为k的满二叉树中编号从1至n的结点一一对应时，称之为完全二叉树。

完全二叉树的两个特性：

具有n个结点的完全二叉树的深度为Math.floor(㏒₂ n) + 1;
如果对一棵有n个结点的完全二叉树（其深度为Math.floor(log_2 n) + 1）的结点按层序编号（从第1层到第Math.floor(log_2 n) + 1，每层从左到右），则对任一结点（1<=i<=n）有：
- 如果i=1，则结点i是二叉树的根，无双亲；如果i>1，则其双亲parent(i)是结点Math.floor(i/2)。
- 如果2i > n，则结点i无左孩子（结点i为叶子结点）；否则其左孩子LChild(i)是结点2i.
- 如果2i + 1 > n，则结点i无右孩子；否则其右孩子RChild(i)是结点2i + 1;

满二叉树：

满二叉树：一颗深度为k且有2^k - 1个节点的二叉树称为满二叉树。

二叉树中每个内部结点都有存在左子树和右子树（或者说满二叉树所有的叶结点都有同样的深度）

满二叉树也是一种完全二叉树，但完全二叉树不一定是满二叉树。

二叉堆

二叉堆由一棵完全二叉树来表示其结构，可用数组来表示。二叉堆需要满足：

二叉堆的父节点的键值总是大于或等于(小于或等于)任何一个子节点的键值
当父节点的键值大于或等于(小于或等于)它的每一个子节点的键值时，称为最大堆（最小堆）

注：最大堆：父结点>=子结点，最小堆：父结点=<子结点，

堆的实现通过构造二叉堆（binary heap），实为二叉树的一种；由于其应用的普遍性，当不加限定时，均指该数据结构的这种实现。

二叉搜索树（二叉查找树、二叉排序树）

二叉查找树(Binary Search Tree，BST)，又称为有序二叉树，排序二叉树。每个结点都符合： 父结点>右子结点>左子结点。

二叉查找树中对于目标节点的查找过程类似与有序数组的二分查找，并且查找次数不会超过树的深度。

二叉搜索树的特性：

若任意节点的左子树不空，则左子树上所有节点的值均小于它的根节点的值；
若任意节点的右子树不空，则右子树上所有节点的值均大于它的根节点的值；
任意节点的左、右子树也需要满足左边小于右边的性质
没有键值相等的节点。

二叉搜索树主要的几个操作：

查找（search）
插入（insert）
遍历（transverse）

二叉查找树的性质：对二叉查找树进行中序遍历，即可得到有序的数列。　二叉查找树的高度决定了二叉查找树的查找效率。

二叉排序树与堆的区别

在二叉排序树中，某结点的右孩子结点的值一定大于该结点的左孩子结点的值；在堆中却不一定，堆只是限定了某结点的值大于（或小于）其左右孩子结点的值，但没有限定左右孩子结点之间的大小关系。

即

二叉堆：父结点>=子结点||父结点=<子结点，
排序树：父结点>右子结点>左子结点

在二叉排序树中，最小值结点是最左下结点，其左指针为空；最大值结点是最右下结点，其右指针为空。在大根堆中，最小值结点位于某个叶子结点，而最大值结点是大根堆的堆顶（即根结点）。

堆是为了实现排序而设计的一种数据结构，它不是面向查找操作的，因而在堆中查找一个结点需要进行遍历，其平均时间复杂度是O(n)。

二叉排序树是为了实现动态查找而设计的数据结构，它是面向查找操作的。对于目标节点的查找过程类似与有序数组的二分查找，在二叉排序树中查找一个结点的平均时间复杂度是O(log n)；

设节点数目为n，树的深度为h，假设树的每层都被塞满(第L层有2^L个节点，层数从1开始)，则根据等比数列公式可得h=log（n+1）。即最好的情况下，二叉查找树的查找效率为O(log n)。当二叉查找树退化为单链表时，比如，只有右子树的情况,如下图所示，此时查找效率为O(n)。

总之，二叉查找树越是“矮胖”，也就是每层尽可能地被“塞满”（每个父节点均有两个子节点）时，查找效率越高。

每层都被塞满时，查找效率最高，最高为O(log n)。
当二叉查找树退化为单链表时，查找效率最低，最低为O(n)。

为了解决二叉查找树退化为单链表时查找效率低下的问题，引入了平衡二叉树(AVL)。

平衡二叉树（Balanced binary tree）

平衡二叉树定义：平衡二叉树（Balanced Binary Tree）又被称为AVL树（有别于AVL算法），且具有以下性质：它是一棵空树或它的左右两个子树的高度差的绝对值不超过1，并且左右两个子树都是一棵平衡二叉树。平衡二叉树的常用算法有红黑树、AVL树等。在平衡二叉搜索树中，我们可以看到，其高度一般都良好地维持在O(log2n)，大大降低了操作的时间复杂度。

最小二叉平衡树的节点的公式如下：F(n)=F(n-1)+F(n-2)+1

这个类似于一个递归的数列，可以参考Fibonacci数列，1是根节点，F(n-1)是左子树的节点数量，F(n-2)是右子树的节点数量。

从平衡二叉树的性质可知，平衡二叉树就是避免了二叉查找树退化为单链表的极端情况。二叉查找树的查找、插入、删除较好时间复杂度是O(log n)，最差是O(n)。二叉平衡树保证查找、插入、删除的时间复杂度稳定在O(log n)下。

总结：

完全二叉树是效率很高的数据结构，堆是一种完全二叉树或者近似完全二叉树，所以效率极高，像十分常用的排序算法、Dijkstra算法、Prim算法等都要用堆才能优化，二叉排序树的效率也要借助平衡性来提高，而平衡性基于完全二叉树。这里推荐阅读《讲透学烂二叉树一：树和图的概念以及二叉树的基本性质》

平衡查找树之AVL树

AVL树定义：AVL树是最先发明的自平衡二叉查找树。AVL树得名于它的发明者 G.M. Adelson-Velsky 和 E.M. Landis，他们在 1962 年的论文 "An algorithm for the organization of information" 中发表了它。在AVL中任何节点的两个儿子子树的高度最大差别为1，所以它也被称为高度平衡树，n个结点的AVL树最大深度约1.44log2n。查找、插入和删除在平均和最坏情况下都是O(logn)。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树。这个方案很好的解决了二叉查找树退化成链表的问题，把插入，查找，删除的时间复杂度最好情况和最坏情况都维持在O(logN)。但是频繁旋转会使插入和删除牺牲掉O(logN)左右的时间，不过相对二叉查找树来说，时间上稳定了很多。

AVL树的自平衡操作——旋转

AVL树最关键的也是最难的一步操作就是旋转。旋转主要是为了实现AVL树在实施了插入和删除操作以后，树重新回到平衡的方法。

平衡二叉树-AVL树(LL、RR、LR、RL旋转)

让AVL树重新平衡的操作叫做旋转（Rotate），旋转操作是树的基本操作也是其中一个难点，对于旋转，使用结点上下移动反而会好理解一点，失衡结点的BF为2或-2，注意这个失衡结点一般取的是最小失衡结点，

AVL树在实现上需要在每个结点中保留高度信息，或者使用平衡因子（Balanced Factor），简称BF，每个结点的平衡因子等于左子树的高度减去右子树的高度，因此平衡值只有三种-1，+1和0。AVL树主要是在增加或删除结点后需要重新计算平衡因子，调整树的结构使其重新平衡。

二叉树不平衡的四种情况

首先要确定中心结点，即最小失衡结点A，其平衡因子的绝对值为2，主要有四种不平衡的情况：

（1）在A的左儿子B的左子树插入，又称为LL；

（2）在A的左儿子C的右子树插入P，又称为LR；

（3）在A的右儿子C的左子树插入P，又称为RL；

（4）在A的右儿子B的右子树插入，又称为RR。

要记住两个重要节点，一个是失衡结点，另一个是失衡结点的儿子，该儿子在失衡路径上，旋转操作则是依据失衡结点的儿子为中心，对失衡结点进行下移动。在这四种失衡情况中（1）和（4）是一样的，（2）和（3）是一样的，前者使用单旋转，后者使用双旋转。

AVL树单旋转和双旋转

在进行旋转操作时，首先要找到最小失衡结点，判断失衡的类型，然后选择旋转的类型，如何判断呢？根据上面的图片中的结点A，BF为2确定为左儿子左边L，根据左儿子的BF为-1，则确定为R，此时属于不平衡情况（2），使用双旋转，下面详细介绍单旋转和双旋转的四种旋转方式。

1、LL右旋转

P下移，占据C的右儿子空穴，C的右儿子称为P的左儿子

2、RR左旋转

P下移，占据C的左儿子空穴，C的左儿子作为P的右儿子。

3、LR左右旋转

双旋转分为两步：左旋转，以P的儿子C作为失衡结点，Q的右儿子q，Q下移，占据q的左儿子，q的左儿子左儿子作为Q的右儿子，q作为P的左儿子。

右旋转，P下移，作为p的右儿子，q的右儿子作为P的左儿子。

4、RL右左旋转

右旋转，P的右儿子C作为新的失衡结点Q，Q的左儿子q，Q下移，作为q的右儿子，q的右儿子作为Q的左儿子，q作为P的右儿子。

左旋转，P下移，占据q的左儿子，q的左儿子作为P的右儿子。

平衡的二叉搜索树的分类：

平衡的二叉搜索树一般分为两类：

严格维护平衡的，树的高度控制在log2n，使得每次操作都能使得时间复杂度控制在O(logn)，例如AVL树，红黑树；
非严格维护平衡的，不能保证每次操作都控制在O(logn)，但是每次操作均摊时间复杂度为O(logn)，例如伸展树。

伸展树（Splay Tree）

伸展树（Splay Tree），是一种二叉搜索树（Binary Search Tree，又称二叉排序树Binary Sort Tree），由丹尼尔·斯立特（Daniel Sleator）和罗伯特·恩卓·塔扬（Robert Endre Tarjan）在1985年发明。

伸展树的基本概念

AVL树在每次删除或添加结点时都需要使用旋转操作平衡二叉树，以获得最好的查找效率，伸展树是另一种二叉树，它不需要高度或平衡因子这些平衡信息。伸展树使用另一种方式实现高效率的查找，不平衡但要求每次操作的那个结点旋转到根结点上来，这样下次查找它就能达到最快效率了，这是根据计算机的局部原理，当一块数据被访问后，此后段时间内也会该数据或附近的数据也会被再次用到。这也就是说，进行增加、删除、查找等操作都需要将本次操作的结点或附近结点旋转到根结点上，可对所有操作都调整，或只针对查找进行调整。

伸展树进行M次操作，其时间复杂度为O(M logN)，而普通二叉树最坏情况为O(N)，连续M次操作为O(M*N)。如果一个算法M次操作的时间为O(MF(N))，则O(F(N))称为该算法的摊还时间或摊还代价，伸展树的摊还代价为O(logN)。

伸展树的实现原理

综上，伸展树不需要AVL树的平衡信息，高度或BF，它是一个普通二叉查找树，它的出发点是：频繁查找一个深结点X，会造成花费的时间过多，采取的办法是：将树在X处展开，将该结点旋转到根结点，自下向上单旋转，对访问路径上的每个结点和父结点进行单旋转，这样频繁访问结点即可大大减少时间，但是执行M次操作仍然至少需要M*N的时间（最坏情况单链表为N）。

伸展树在实现上可使用上面说的单旋转，根据目标结点，全部使用单旋转，但是效率并不好，例如单链表的情况，依次插入1、2、3、4、5，其效率并不好，结点4深度依然比较深，如下图：

为了解决这个问题，我们采取一种特别的实现，根据三种情况进行旋转：

（1）当前结点只有父亲结点，使用单旋转，很明显这种情况的父亲结点为根结点；

（2）当前结点有父亲结点和祖父结点，呈之字形，例如当前结点是父亲结点的右儿子，父亲结点是祖父结点的左儿子。之字形的情况进行一次AVL双旋转，如下图：

当前结点有父亲结点和祖父结点，呈一字形，也就是类似LL和RR的情况，但是并不是使用单旋转，而是进行一字形对称旋转。假设祖父结点是根结点，那么让当前结点X成为根结点，父亲结点称为X的右儿子，祖父结点成为父亲结点的右儿子，X的原右儿子成为父亲的左儿子，父亲结点的右儿子成为祖父结点的左儿子，下图是一个例子：

相对于仅仅使用单旋转，新实现方法的效率更高，使用新的旋转方式，对1、2、3、4、5的单链表情况在5处展开的过程如下图：

平衡二叉树之红黑树

红黑树的定义：

红黑树是一种自平衡二叉查找树，是在计算机科学中用到的一种数据结构，典型的用途是实现关联数组。它是在1972年由鲁道夫·贝尔发明的，称之为"对称二叉B树"，它现代的名字是在 Leo J. Guibas 和 Robert Sedgewick 于1978年写的一篇论文中获得的。它是复杂的，但它的操作有着良好的最坏情况运行时间，并且在实践中是高效的: 它可以在O(logn)时间内做查找，插入和删除，这里的n是树中元素的数目。

红黑树和AVL树一样都对插入时间、删除时间和查找时间提供了最好可能的最坏情况担保。这不只是使它们在时间敏感的应用如实时应用（real time application）中有价值，而且使它们有在提供最坏情况担保的其他数据结构中作为建造板块的价值；例如，在计算几何中使用的很多数据结构都可以基于红黑树。此外，红黑树还是2-3-4树的一种等同，它们的思想是一样的，只不过红黑树是2-3-4树用二叉树的形式表示的。

红黑树的性质：

红黑树是每个节点都带有颜色属性的二叉查找树，颜色为红色或黑色。在二叉查找树强制的一般要求以外，对于任何有效的红黑树我们增加了如下的额外要求:

性质1. 节点是红色或黑色。
性质2. 根是黑色。
性质3. 所有叶子都是黑色（叶子是NIL节点）。
性质4. 每个红色节点必须有两个黑色的子节点。(从每个叶子到根的所有路径上不能有两个连续的红色节点。)
性质5. 从任一节点到其每个叶子的所有简单路径都包含相同数目的黑色节点。

设平衡二叉树的深度为N，则N%2=0结点为黑色，N%2=1结点为红色。

下面是一个具体的红黑树的图例：

这些约束确保了红黑树的关键特性: 从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。结果是这个树大致上是平衡的。因为操作比如插入、删除和查找某个值的最坏情况时间都要求与树的高度成比例，这个在高度上的理论上限允许红黑树在最坏情况下都是高效的，而不同于普通的二叉查找树。

要知道为什么这些性质确保了这个结果，注意到性质4导致了路径不能有两个毗连的红色节点就足够了。最短的可能路径都是黑色节点，最长的可能路径有交替的红色和黑色节点。因为根据性质5所有最长的路径都有相同数目的黑色节点，这就表明了没有路径能多于任何其他路径的两倍长。

红黑树这段内容来自maybe2030 整理自wiki百科之红黑树的内容

B-树（B-Tree）

B-树和下面的B+树是相当有用和比较重要的树数据结构（B-树和B树的叫法是一样的），B树，概括来说是一个一般化的二叉查找树，可以拥有多于2个子节点。与自平衡二叉查找树不同，B-树为系统最优化大块数据的读和写操作。B-tree算法减少定位记录时所经历的中间过程，从而加快存取速度。这种数据结构常被应用在数据库和文件系统的实作上。

B-树的基本概念

B-树也是一种平衡树，称为M路平衡查找树（并不是二叉的，M=2就是平衡二叉查找树），M称为阶数或度数或叉数或最多子树数，指的是一个结点拥有最多的儿子数。上面一直提到关键字域，关键字用于确定结点的分布规则，又称为键值，和数据库表的主键和唯一键是一样的。1个关键字最多有2个儿子，如二叉树，M阶平衡树的关键字数为M-1，在B-树的数据结构实现上，主要是使用关键字数M-1，可使用数组存储，或设计其它的容器如链式数据结构，其中3阶B树又叫2-3树，4阶B树又叫2-3-4树，如下图是一个3阶B叉树：

B-tree树即B树，B即Balanced，平衡的意思。因为B树的原英文名称为B-tree，而国内很多人喜欢把B-tree译作B-树，其实，这是个非常不好的直译，很容易让人产生误解。如人们可能会以为B-树是一种树，而B树又是另一种树。而事实上是，B-tree就是指的B树。

B树的搜索，从根结点开始，如果查询的关键字与结点的关键字相等，那么就命中；否则，如果查询关键字比结点关键字小，就进入左儿子；如果比结点关键字大，就进入当前兄弟节点的右边节点(二叉树就是右节点)

B-树的主要特性如下：

每个结点的儿子数为2~M，为什么不是至少1个？因为B树的生长方向是自底向上，在分裂的时候不会造成只有1个儿子，为什么最大为M？因为阶数为M为最大儿子数，其关键字数最大为M-1；
非根非叶子结点的儿子数为[M/2]~M，[]为向上取整，或使用ceil()函数，这个不用太注意，实际上只要你正确操作B树不会发生异常的情况；
所有树叶的深度都相同，这就是说B树总是平衡的。

首先要指出，以上B-树只是一个参考的规范并不是绝对标准，你可以根据自己的需求自己设计，这里的M一直指的都是每个结点的最大儿子数，而在我们的代码中更直接的是使用关键字数，关键字数等于M-1，要注意是否混淆了。

B树的主要数据存储在所有结点上，和一般的二叉树是一样的，在二叉树上一个关键字对应一个数据对象，B树中H个关键字对应有H个数据对象，也就是说关键字和数据对象的数量是相同的。如果使用的是数据对象中的成员作为数据关键字，则在节点中可以直接声明一个数据对象的数组存储（或者其它类型的容器），否则自定义创建一个关键字数组，另外再创建数据对象数组，这样会相当麻烦（实际可以在数据对象中创建虚拟关键字，在结点声明）。

B-树的搜索，从根结点开始，对结点内的关键字（有序）序列进行二分查找，如果命中则结束，否则进入查询关键字所属范围的儿子结点；重复，直到所对应的儿子指针为空，或已经是叶子结点；

B树的特性

定义任意非叶子结点最多只有M个儿子；且M>2；
根结点的儿子数为[2,M]；
除根结点以外的非叶子结点的儿子数为[M/2,M]；
每个结点存放至少M/2-1（取上整）和至多M-1个关键字；（至少2个关键字）
非叶子结点的关键字个数=指向儿子的指针个数-1；
非叶子结点的关键字：K[1],K[2],…,K[M-1]；且K[i]
非叶子结点的指针：P[1],P[2],…,P[M]；其中P[1]指向关键字小于K[1]的子树，P[M]指向关键字大于K[M-1]的子树，其它P[i]指向关键字属于(K[i-1],K[i])的子树；
所有叶子结点位于同一层；

B+树（B+Tree）

B树和B+树的主要应用在于数据库开发，例如MySQL的索引引擎就是使用B+树实现的，如此看来，使用数据库的目的除了数据持久化就是索引了，如果数据库失去了索引功能，那么和一般的文件访问也就区别不大了。说到数据库，这里稍微讨论一下相关的内容，数据库文件是存储在硬盘上的，程序访问数据需要调用外设硬件去读取硬盘上的数据，一次读取操作称为一次IO操作，IO操作是比较耗时的，因此提高数据访问的速度也就是要降低IO操作的次数。

相对于物理磁盘而言，数据的最小单位为扇区，一般512字节，相对文件系统而言，一次IO操作读取的数据大小目前可达到4K，也就是8个扇区。假如一个结点为4K，N个结点，最多深度为O(log N)，底数为M/2，加入一个结点存储200个关键字，一百万个结点只需读取几次即可，而关键字的查询速度也是对数时间O(log M)，如此你可以发现使用B树或B+树的功能强大。

B+树基本概念

B+树和B树的定义是等价的，其中有的定义是儿子数比关键字数小1，这个不是很重要，完全可以自定义。

B+的搜索与B-树也基本相同，区别是B+树只有达到叶子结点才命中（B-树可以在非叶子结点命中），其性能也等价于在关键字全集做一次二分查找；

B+的性质：

　　1.所有关键字都出现在叶子结点的链表中（稠密索引），且链表中的关键字恰好是有序的；

　　2.不可能在非叶子结点命中；

　　3.非叶子结点相当于是叶子结点的索引（稀疏索引），叶子结点相当于是存储（关键字）数据的数据层；

　　4.更适合文件索引系统。

B+和B树不同之处

B+树主要分为索引结点和叶子结点，索引结点为内部结点，主要用于存储关键字，不再存储数据，这样一个索引结点的空间就小多了（一次IO操作可以读取更多的关键字），叶子节点是数据记录存储的地方。索引结点中的关键字按升序排列。
B+树每个叶子结点保存相邻叶子结点的指针（双向链表），这样因为叶子结点中的关键字也是按升序排列的，那么B+树不仅可以提供随机访问，还可以进行范围访问，因此使用B+树实现索引引擎会比B树更有优势。
非叶子结点的子树指针与关键字个数相同；
非叶子结点的子树指针P[i]，指向关键字值属于[K[i], K[i+1])的子树（B-树是开区间）；
为所有叶子结点增加一个链指针；
所有关键字都在叶子结点出现；

注意，只有叶子结点才存储实际数据，MySQL的InnoDB引擎直接在叶子结点存储数据本身，而MyISAM引擎则是在叶子结点存储数据的逻辑地址，前者的方式称为聚簇索引，后者称为非聚簇索引，下面是这两种索引结构的粗略图：

　B+树的搜索与B树也基本相同，区别是B+树只有达到叶子结点才命中（B树可以在非叶子结点命中），其性能也等价于在关键字全集做一次二分查找；

B*树

B*树是B+树的变体，在B+树的非根和非叶子结点再增加指向兄弟的指针，将结点的最低利用率从1/2提高到2/3。

B*树定义了非叶子结点关键字个数至少为(2/3)*M，即块的最低使用率为2/3（代替B+树的1/2）；

B+树的分裂：当一个结点满时，分配一个新的结点，并将原结点中1/2的数据复制到新结点，最后在父结点中增加新结点的指针；B+树的分裂只影响原结点和父结点，而不会影响兄弟结点，所以它不需要指向兄弟的指针；

所以，B*树分配新结点的概率比B+树要低，空间使用率更高。

前缀树(Tire树)

Tire树称为字典树，又称单词查找树，Trie树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，查询效率比哈希树高。　

Tire树的三个基本性质：

根节点不包含字符，除根节点外每一个节点都只包含一个字符；
从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串；
每个节点的所有子节点包含的字符都不相同。

Tire树的应用：

前缀树里面可以存一堆字符串，也可以说是一堆单词，存完之后我们可以轻松判断一个指定的字符串是否出现过。”比如说对于某一个单词，我们要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单“。例如：给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，求第一次出现在第几个位置。

串的快速检索

给出N个单词组成的熟词表，以及一篇全用小写英文书写的文章，请你按最早出现的顺序写出所有不在熟词表中的生词。

在这道题中，我们可以用数组枚举，用哈希，用字典树，先把熟词建一棵树，然后读入文章进行比较，这种方法效率是比较高的。

“串”排序

给定N个互不相同的仅由一个单词构成的英文名，让你将他们按字典序从小到大输出。用字典树进行排序，采用数组的方式创建字典树，这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。

最长公共前缀

对所有串建立字典树，对于两个串的最长公共前缀的长度即他们所在的结点的公共祖先个数，于是，问题就转化为求公共祖先的问题。

关于算法相关的详细代码，查看https://github.com/zhoulujun/algorithm

参考文章：

[Data Structure] 数据结构中各种树 https://www.cnblogs.com/maybe2030/p/4732377.html#_label3

你真的懂树吗？二叉树、AVL平衡二叉树、伸展树、B-树和B+树原理和实现代码详解 www.srcmini.com/1315.html

伸展树（Splay Tree）进阶 - 从原理到实现 https://www.cnblogs.com/dilthey/p/9379652.html#splay-2.1

二叉树的遍历（前序、中序、后序、已知前中序求后序、已知中后序求前序） https://www.cnblogs.com/lanhaicode/p/10390147.html

js数据结构-二叉树（二叉堆）https://segmentfault.com/a/1190000017761929

图的基本概念，图的遍历、拯救007 https://www.cnblogs.com/hi3254014978/p/9535276.html

小白学数据结构——二、树与堆（基本概念及二叉树、二叉堆的python实现） https://blog.csdn.net/qq_33414271/article/details/78506632

如果子结果编号为i，求其父节点编号 https://blog.csdn.net/qingmengwuhen1/article/details/51926409?utm_source=blogxgwz5

常见数据结构(二)-树(二叉树，红黑树，B树) https://segmentfault.com/a/1190000007173881

js 中二叉树的深度遍历与广度遍历(递归实现与非递归实现) https://www.jianshu.com/p/5e9ea25a1aae

平衡二叉树-AVL树(LL、RR、LR、RL旋转) https://www.cnblogs.com/ybf-yyj/p/9513706.html

数据结构----树及二叉树的遍历JS https://blog.csdn.net/qq_43043859/article/details/101347877

https://www.cnblogs.com/guxuanqing/p/10540551.html

转载本站文章《讲透学烂二叉树(二)：图中树的定义&各类型树的特征分析》,
请注明出处：https://www.zhoulujun.cn/html/theory/algorithm/TreeGraph/8282.html

你可能感兴趣的:(二叉树,平衡树,伸展树)

PTA数据结构与算法-第一章——褚论 ?Suki PTA习题算法数据结构 c++
文章目录第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题单选题程序填空题第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题(neuDS)数据的物理结构是指数据在计算机中的实际存储形式。T(neuDS)数据的物理结构是指数据在计算机中的实际
C++数据结构————二叉树 Гений.大天才 C++语言入门以及基础算法 c++数据结构开发语言
【前言】在数据结构与算法的世界里，二叉树（BinaryTree）始终占据着核心地位。它既是众多高级树形结构（B+树、红黑树、线段树、字典树……）的“基因”，又是面试、竞赛与工程实战中绕不开的考点。本文将用大约2万字的篇幅，从“零”开始，把C++二叉树的所有常见形态、常见算法、常见坑点与常见优化一次性讲透。全文配套可编译运行的C++17/20代码2000余行，所有示例均在GCC13/Clang17/
【C++进阶】二叉搜索树特性 && 二叉搜索树模拟实现花影随风_ 数据结构算法
0.前言（对学习map与set内容的铺垫）我们之前在c语言部分数据结构初阶就已经讲过二叉树了，为什么那时我们不讲二叉搜索树呢？这是有原因的，这里讲二叉树进阶是因为：1.map与set特性需要先铺垫二叉搜索树的概念，理解了二叉搜索树可以更好的理解map与set2.当时用c语言讲二叉树时没有将进阶，是因为这部分较难，长时间下容易忘记。3.一些OJ题更适合用c++解决，当时用c语言会比较麻烦，需要动态开
【算法训练营Day12】二叉树part2 十八岁讨厌编程算法训练营算法
文章目录翻转二叉树对称二叉树二叉树的最大深度二叉树的最小深度翻转二叉树题目链接：226.翻转二叉树解题逻辑：翻转二叉树也就是将所有非叶节点的左右孩子相互交换，那么我们就可以采用层序遍历判断非叶节点进行翻转：初始化一个辅助队列将根节点添加到队列中去弹出队头元素如果该元素的两个子节点均不为null则翻转两个子节点然后将子节点入队如此循环往复直到队列为空代码如下：classSolution{public
力扣 hot100 Day46 qq_51397044 Hot100 leetcode 算法
199.二叉树的右视图给定一个二叉树的根节点root，想象自己站在它的右侧，按照从顶部到底部的顺序，返回从右侧所能看到的节点值。//自己写的classSolution{public:vectorrightSideView(TreeNode*root){vectorresult;if(!root)returnresult;queueq;q.push(root);while(!q.empty()){i
力扣 hot100 Day47 qq_51397044 Hot100 leetcode 数据结构算法
114.二叉树展开为链表给你二叉树的根结点root，请你将它展开为一个单链表：展开后的单链表应该同样使用TreeNode，其中right子指针指向链表中下一个结点，而左子指针始终为null。展开后的单链表应该与二叉树先序遍历顺序相同。//抄的classSolution{public:voidflatten(TreeNode*root){TreeNode*dummy=newTreeNode();Tr
LeetCode Top100特训九筒- LeetCode 算法力扣
更新中……两数相加盛水最多的容器电话号码的字母组合删除链表的倒数第N个结点字母异位词分组寻找两个正序数组的中位数合并区间不同路径（与最小路径和类似）正则表达式匹配颜色分类单词搜索只出现一次的数字合并K个升序链表接雨水移除元素最长有效括号不同的二叉搜索树验证二叉搜索树对称二叉树从前序与中序遍历序列构造二叉树最长连续序列排序链表乘积最大子数组编辑距离最小栈最小覆盖子串计算右侧小于当前元素的个数柱状图中
【LeetCode102.二叉树的层序遍历】vs.【LeetCode103.二叉树的锯齿形层序遍历】小鲈鱼- 数据结构 c++算法
题目链接LeetCode102.二叉树的层序遍历：102.二叉树的层序遍历-力扣（LeetCode）LeetCode103.二叉树的锯齿形层序遍历：103.二叉树的锯齿形层序遍历-力扣（LeetCode）实现思路定义一个队列，每一轮循环，队列都会放入新的一层的节点；在下一次循环中，取出上一层放入的所有新节点（放入数组中），并依次从队列中踢出这些节点，获取到这些节点的左右孩子，再放入队列中。如此，就
【Flutter】面试记录古希腊被code拿捏的神 flutter 面试职场和发展
本文部分内容参考博文目录Flutter三棵树渲染原理渲染原理三者之间的关系参数位置参数mixin、extends和implementsmixin（混入）extends（继承）implements（实现）Flutter如何与Native通信的?如何从Flutter传递一个dart类到原生？常用的三种状态管理框架provider的渲染机制二叉树遍历递归与迭代什么是迭代？什么是递归？（怎么写一个递归函数
代码训练营DAY13 第六章二叉树part01 _Coin_- 数据结构算法
理论基础二叉树种类存储方式遍历方式深度优先搜索&广度优先搜索深度：前序遍历、中序遍历、后序遍历（中间在前or中or后，左右顺序固定）广度：二叉树定义递归遍历（必须掌握）递归分析三步法1、确定递归函数的参数和返回值2、确定终止条件3、确定单层递归逻辑前序遍历144.二叉树的前序遍历-力扣（LeetCode）/***Definitionforabinarytreenode.*structTreeNod
C++ unordered_set基础概念、对象创建、赋值操作、数据插入、数据删除、代码练习 1 2 每天搬一点点砖 c++数据结构开发语言
unordered_set的底层是哈希表。增删改查的时间复杂度：数组O(n)二叉树O(logn)哈希表O(1)哈希表的本质原理：哈希键--（哈希函数）--哈希值--（取模、位于）--桶/ID这里的哈希键一般是任意类型，所以需要先通过哈希函数转换为整数，我们叫他哈希值，再通过取模（一般使用的时候采用位于运算），映射到某个桶中。这样就可以把任意类型的数据存储到数组中，且能够快速查找到。桶：下标索引又叫
python进阶之数据结构与算法--入门-二叉树小白piao 数据结构与算法python篇数据结构算法二叉树 python
二叉树概念：之前已经提及了关于树的概念，要想知道之前讲了什么请关注，前边文章里都有提及。这里不做赘述。二叉树是具有以下属性的有序树：1、每个节点最多有两个孩子节点2、每个孩子节点被命名为左子节点和右子节点3、对于每个节点的孩子节点，在顺序上，左子节点优先于右子节点4、若子树的根为内部节点v的左子节点或者右子节点，则该子树相应地被称为节点v的左子树或者右子树5、若每个节点都有零个或者两个节点，则这样
牛客_重建二叉树
重建二叉树https://www.nowcoder.com/practice/8a19cbe657394eeaac2f6ea9b0f6fcf6importjava.util.*;/**publicclassTreeNode{*intval=0;*TreeNodeleft=null;*TreeNoderight=null;*publicTreeNode(intval){*this.val=val;*
代码随想录算法训练营第十三天天天开心(∩_∩) 算法
递归遍历二叉树的前，中，后序遍历题目链接前序遍历中序遍历后序遍历前序遍历题解classSolution{publicListpreorderTraversal(TreeNoderoot){Listlist=newArrayListlist,TreeNoderoot){if(root==null){return;}list.add(root.val);preorder(list,root.left)
day14 二叉树 part02 hwt819 算法 leetcode 数据结构
226.翻转二叉树classSolution{publicTreeNodeinvertTree(TreeNoderoot){if(root==null){returnroot;}TreeNodetemp=root.left;root.left=root.right;root.right=temp;invertTree(root.left);invertTree(root.right);return
第五章算法设计题
以二叉链表作为二叉树的存储结构，编写以下算法：（1）统计二叉树的叶结点个数。[题目分析]如果二叉树为空，返回0，如果二叉树不为空且左右子树为空，返回1，如果二叉树不为空，且左右子树不同时为空，返回左子树中叶子节点个数加上右子树中叶子节点个数。[算法描述]intLeafNodeCount(BiTreeT){if(T==NULL) return0;//如果是空树，则叶子结点个数为0elseif(T
算法堆与堆排序
堆的定义与分类堆是一种特殊的完全二叉树，通常分为两种类型：大顶堆（大根堆）：每个节点的值都大于或等于其子节点的值。小顶堆（小根堆）：每个节点的值都小于或等于其子节点的值。堆的性质结构性：堆是一棵完全二叉树，即除了最后一层外，其他层的节点都是满的，且最后一层的节点从左到右填充。有序性：堆中每个节点的值都满足特定的顺序关系（大于或小于子节点）。堆的存储数组索引0通常作为堆的根节点。对于索引为i的节点，
将有序数组转化为二叉树
本文参考代码随想录将一个按照升序排列的有序数组，转换为一棵高度平衡二叉搜索树。思路：寻找分割点，分割点作为当前节点，然后递归左区间和右区间。递归法取中间值为root，递归左区间成为root的左孩子，右区间成为root的右孩子，最后返回rootclassSolution{private:TreeNode*traversal(vector&nums,intleft,intright){//若数组为空则
零基础数据结构与算法—— 第三章：高级数据结构-总结 qqxhb 零基础数据结构与算法小学生编程算法数据结构算法树堆哈希表图
3.1树（上）3.1树（下）3.2堆（Heap）3.3哈希表（HashTable）3.4图（Graph）3.5高级树结构3.6本章小结在本章中，我们深入学习了几种重要的高级数据结构，这些数据结构在解决复杂问题时具有强大的能力。让我们回顾一下本章的主要内容：1.堆（Heap）堆是一种特殊的完全二叉树，具有堆序性质。我们学习了：最大堆和最小堆的概念和性质堆的基本操作（插入、删除堆顶、获取堆顶、构建堆）
二叉搜索树的概念及插入操作
一，二叉搜索树二叉搜索树也是在二叉树的基础上增加了一些约束，使得他成为后续平衡树、红黑树的基石，在工程上几乎用不到这棵树因为本身有很大问题，但后续树却都是他的变种。我们看看它增加了哪些约束使得他这么好用。a.如果他的左子树不空，则左子树上所有结点的值均小于它的根结点的值。b.若它的右子树不空，则右子树上所有结点的值均大于它的根结点的值。c.它的左、右树又分为二叉排序树。二叉树的插入操作通过上面约束
数据结构复习提纲 DeadPool loves Star 数据结构复习大纲
数据结构复习提纲算法的五个特征设计算法通常应考虑线性表线性表的特性广义表的结构特点树的有关术语二叉树特点满二叉树完全二叉树二叉树的性质二叉树的按层遍历算法等价二叉树等价二叉树树的表示方法Huffman树的相关概念内外节点的相关概念Huffman树的应用图的定义图的存储结构邻接表的特点生成树最小生成树拓扑排序有关概念拓扑排序特点关键路径有关概念事件的最早发生时间事件的最迟发生时间活动的最早开始时间活
java练习3
随机生成20个数字（随机种子）分别使用冒泡排序、二叉树排序、插入排序进行排序并输出最终结果以及三种排序使用的时间packagea01_第一次练习.a03_排序;importjava.time.Duration;importjava.time.LocalDateTime;importjava.util.TreeSet;publicclassTest{publicstaticvoidmain(Stri
2010暑期集训第一专题（数据结构）总结 dooder_daodao 求~道数据结构 2010 任务
一晃五六天就这么过去了~这一专题中，我们接触到了数据结构中的栈和队列、二叉树、哈夫曼树和字典树，以及数组中的字符匹配KMP和树的一种应用并查集，内容挺多的，看看这一大串的列举就知道了。总体上感觉：内容太多了，所以没有达到预期的效果，不过，从另一方面说，虽然学习本来就是一个循序渐进的过程，但是如果没有任务要求，这个渐进的速度也不会让人满意的。所以，内容多的另一方面是，这一专题至少让我们了解了很多的东
算法第17天|继续二叉树：二叉搜索树的最近公共祖先、二叉搜索树中的插入操作、删除二叉搜索树中的节点孟大本事要学习算法学习算法
今日总结1、删除二叉搜索树中的节点（需要着重复习）当一个二叉树题目中用到返回值时，一定要清楚返回值是什么？返回的东西是赋值给什么变量的，什么时候添加返回值，什么时候接收返回值。2、遇到二叉搜索树要思考的问题：当遇到二叉搜索树，需要明白递归的方式是从上到下，可以根据值的大小找到对应的递归路径（属于递归三部曲中的确定单层递归逻辑）3、二叉搜索树中的插入操作要理解二叉搜索树的插入操作其实是找到合适的一个
算法第16天|继续二叉树：二叉搜索树的最小绝对差、二叉搜索树中的众数、二叉树的最近公共祖先孟大本事要学习算法学习算法数据结构
今日总结：1、遇到二叉搜索树就要想到中序遍历是一个有序数组。2、递归的时候如果递归有返回值，一定要思考截止条件返回什么3、最近公共祖先问题：如果当前节点是要寻找的某个节点，可以直接返回：如果二叉树右边没有另一个节点，本身就是最近公共祖先；如果有另一个节点，再往下递归也找不到另一个节点。二叉搜索树的最小绝对差：题目链接：530.二叉搜索树的最小绝对差-力扣（LeetCode）整体思路：1、看到二叉搜
【回溯算法】|代码随想录算法训练营第19天|77. 组合、216.组合总和III、17.电话号码的字母组合小白糖的狗狗叫鸡蛋 15-数据结构与算法算法 redis 数据库
刷题神器代码随想录往期回顾>【二叉树】|代码随想录算法训练营第18天|669.修剪二叉搜索树、108.将有序数组转换为二叉搜索树、538.把二叉搜索树转换为累加树、【总结】题目理论基础文章：文章讲解视频：视频讲解回溯算法并不是一个高效算法，它的目的是穷举，替代多层for循环，回溯算法和递归算法相关纠缠，在递归的前后要进行回溯,回溯算法可以理解为树型结构，树的宽度就是for循环的范围，树的深度就是递
二叉树遍历
二叉树遍历非递归实现目录二叉树遍历非递归实现树节点定义：先序遍历：中序遍历：后序遍历：测试代码：先序遍历测试代码：中序遍历测试代码：后序遍历测试代码：树节点定义：publicclassTreeNode{intval;TreeNodeleft;TreeNoderight;TreeNode(){}TreeNode(intval){this.val=val;}TreeNode(intval,TreeNo
力扣 hot100 Day34 qq_51397044 Hot100 leetcode 算法
226.翻转二叉树给你一棵二叉树的根节点root，翻转这棵二叉树，并返回其根节点翻转的定义是，对于每个节点，交换它的左右子树//抄的classSolution{public:TreeNode*invertTree(TreeNode*root){if(root==nullptr)returnnullptr;TreeNode*left=invertTree(root->left);TreeNode*r
二叉搜索树的删除高斯林.神犇数据结构算法
一，二叉搜索树的删除首先，我们要删除二叉搜索树树中的节点必须保证逻辑完备性，也就是删除完后的二叉树性质不变(左小右大)，由于度不同的节点删除难度也不一样我们可以分类讨论a.度为0的节点：直接删除b.度为1的节点：把度为1的节点的子节点补上c.度为2的节点：转移矛盾，改为删除度为2节点左子树的最大值或右子树的最小值代码逻辑a.递归写法删除树中节点，传入参数，树、要删的值，定义内部函数用于删除节点，内
二叉树题解——将有序数组转换为二叉搜索树【LeetCode】传统解法潮_ 我的学习记录二叉树篇_刷题笔记算法 leetcode 数据结构 python
108.将有序数组转换为二叉搜索树方法一：中序遍历，总是选择中间位置左边的数字作为根节点选择中间位置左边的数字作为根节点，则根节点的下标为mid=(left+right)/2，此处的除法为整数除法。1.1核心思想分治法：将数组分成左右两部分，递归构建左子树和右子树。高度平衡：通过选择数组的中间元素作为根节点，确保左右子树的节点数尽可能相等，从而保证树的高度平衡。1.2具体步骤递归终止条件：如果左边
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa