In computer science, a B-tree is a tree data structure that keeps data sorted and allows searches, sequential access, insertions, and deletions in logarithmic time. The B-tree is a generalization of a binary search tree in that a node can have more than two children (Comer 1979, p. 123). Unlike self-balancing binary search trees, the B-tree is optimized for systems that read and write large blocks of data. It is commonly used in databases and filesystems.
在计算机科学中,B树在查找、访问、插入、删除操作上时间复杂度为O(log2~n)(2为底数 n为对数),与自平衡二叉查找树不同的是B树对大块数据读写的操作有更优的性能,其通常在数据库和文件系统中被使用。
一棵m阶的B树,或为空树,或为满足下列特征的m叉树:
①、树中每个结点至多有m棵子树;
②、若根结点不是终端结点,则至少有2棵子树;
③、除根之外,所有非终端结点至少有棵子树;
④、所有的非终端结点中包含下列信息数据:
[n, C0, K0, C1, K1, C2, K2, ...., Kn-1, Cn]
其中:Ki[i=0,1,...,n-1]为关键字,且Ki
根据m阶B树的性质,B树的相关结构定义如下:
/* B树结点结构 */
typedef struct _btree_node_t
{
int num; /* 关键字个数 */
int *key; /* 关键字:所占空间为(max+1) - 多出来的1个空间用于交换空间使用 */
struct _btree_node_t **child; /* 子结点:所占空间为(max+2)- 多出来的1个空间用于交换空间使用 */
struct _btree_node_t *parent; /* 父结点 */
}btree_node_t;
代码1 结点结构
/* B树结构 */
typedef struct
{
int max; /* 单个结点最大关键字个数 - 阶m=max+1 */
int min; /* 单个结点最小关键字个数 */
int sidx; /* 分裂索引 = (max+1)/2 */
btree_node_t *root; /* B树根结点地址 */
}btree_t;
代码2 B树结构
此过程主要是完成btree_t中最大关键字个数max、最小关键字个数min、分裂索引sidx的设置,并创建一颗空树,为后续的构造B树做好准备条件。
/******************************************************************************
**函数名称: btree_creat
**功 能: 创建B树
**输入参数:
** _btree: B树
** m: 阶 - 取值范围m>=3
**输出参数: NONE
**返 回: 0:成功 -1:失败
**实现描述:
**注意事项:
** 注意:参数max的值不能小于2.
**作 者: # Qifeng.zou # 2014.03.12 #
******************************************************************************/
int btree_creat(btree_t **_btree, int m)
{
btree_t *btree = NULL;
if(m < 3) {
fprintf(stderr, "[%s][%d] Parameter 'max' must geater than 2.\n", __FILE__, __LINE__);
return -1;
}
btree = (btree_t *)calloc(1, sizeof(btree_t));
if(NULL == btree) {
fprintf(stderr, "[%s][%d] errmsg:[%d] %s!\n", __FILE__, __LINE__, errno, strerror(errno));
return -1;
}
btree->max= m - 1;
btree->min = m/2;
if(0 != m%2) {
btree->min++;
}
btree->min--;
btree->sidx = m/2;
btree->root = NULL; /* 空树 */
*_btree = btree;
return 0;
}
3) 插入关键字90
在图2基础上,插入关键字90后,该结点关键字个数num=4超过max值,需要进行“分裂”处理。
当结点关键字个数num达到max时,则需要进行“分裂”处理,分割序号为num/2。图3中的[4| 24, 45, 53, 90]的分割序号为num/2 = 4/2 = 2,序号从0开始计数,因此关键字53为分割点,分裂过程如下:
->1) 以序列号idx=num/2为分割点,原结点分裂为2个结点A[2| 24, 45]和B[1| 90];
->2) 原结点无父结点,则新建一个结点P,并将关键字插入到新结点P中;
->3) 将结点A和B作为结点P的子结点,并遵循B树特征④;
->4) 因结点P的结点数未超过max,则分裂结束。
4) 插入关键字46和47
在图3右图的基础上,插入关键字46和47后,得到图4左图,此时结点[4| 24, 45, 46, 47]已经达到分裂条件。
图4 分裂处理
连续插入关键字46、47后,该结点[2| 24, 45]变为[4| 24, 45, 46, 47],因此其达到了“分裂”的条件,其分裂流程如下:
->1) 以序列号idx=num/2为分割点,结点[2| 24, 45, 46, 47]分裂为两个结点A[2| 24, 45]和B[1| 47];
->2) 分割点关键字46被插入到父结点P中,得到结点P[2| 46, 53]
->3) 新结点B[1| 47]加入到结点P[2| 46, 53]的子结点序列中 - 遵循特征④
->4) 因结点P[2| 46, 53]的关键字个数num为超过max,因为分裂结束。
5) 插入关键字15和18
在图4右图的基础上,插入关键字15和18后,得到图5左图,此时结点[4| 15, 18, 24, 45]已经达到分裂条件。其处理过程同4),在此不再赘述。
图5 分裂处理
6) 插入关键字48、49、50
在图5右图的基础上插入48、49、50,可得到图6左图,此时结点[1| 47, 48, 49, 50]已达到分裂条件。
图6 分裂处理
完成第一步分裂处理之后,父结点P[4| 24, 46, 49, 53]此时也达到了分裂条件。
图7 进一步分裂
通过对1) ~ 6)的插入操作过程的理解和分析,可使用如下代码实现:
/******************************************************************************
**函数名称: btree_insert
**功 能: 插入关键字(对外接口)
**输入参数:
** btree: B树
** key: 被插入的关键字
**输出参数: NONE
**返 回: 0:成功 -1:失败
**实现描述:
**注意事项:
**作 者: # Qifeng.zou # 2014.03.12 #
******************************************************************************/
int btree_insert(btree_t *btree, int key)
{
int idx = 0;
btree_node_t *node = btree->root;
/* 1. 构建第一个结点 */
if(NULL == node) {
node = btree_creat_node(btree);
if(NULL == node) {
fprintf(stderr, "[%s][%d] Create node failed!\n", __FILE__, __LINE__);
return -1;
}
node->num = 1;
node->key[0] = key;
node->parent = NULL;
btree->root = node;
return 0;
}
/* 2. 查找插入位置:在此当然也可以采用二分查找算法,有兴趣的可以自己去优化 */
while(NULL != node) {
for(idx=0; idxnum; idx++) {
if(key == node->key[idx]) {
fprintf(stderr, "[%s][%d] The node is exist!\n", __FILE__, __LINE__);
return 0;
}
else if(key < node->key[idx]) {
break;
}
}
if(NULL != node->child[idx]) {
node = node->child[idx];
}
else {
break;
}
}
/* 3. 执行插入操作 */
return _btree_insert(btree, node, key, idx);
}
/******************************************************************************
**函数名称: _btree_insert
**功 能: 插入关键字到指定结点
**输入参数:
** btree: B树
** node: 指定结点
** key: 被插入的关键字
** idx: 指定位置
**输出参数: NONE
**返 回: 0:成功 -1:失败
**实现描述:
**注意事项:
**作 者: # Qifeng.zou # 2014.03.12 #
******************************************************************************/
static int _btree_insert(btree_t *btree, btree_node_t *node, int key, int idx)
{
int i = 0;
/* 1. 移动关键字:首先在最底层的某个非终端结点上插入一个关键字,因此该结点无孩子结点,故不涉及孩子指针的移动操作 */
for(i=node->num; i>idx; i--) {
node->key[i] = node->key[i-1];
}
node->key[idx] = key; /* 插入 */
node->num++;
/* 2. 分裂处理 */
if(node->num > btree->max) {
return btree_split(btree, node);
}
return 0;
}
/******************************************************************************
**函数名称: btree_split
**功 能: 结点分裂处理
**输入参数:
** btree: B树
** node: 需要被分裂处理的结点
**输出参数: NONE
**返 回: 0:成功 -1:失败
**实现描述:
**注意事项:
**作 者: # Qifeng.zou # 2014.03.12 #
******************************************************************************/
static int btree_split(btree_t *btree, btree_node_t *node)
{
int idx = 0, total = 0, sidx = btree->sidx;
btree_node_t *parent = NULL, *node2 = NULL;
while(node->num > btree->max) {
/* Split node */
total = node->num;
node2 = btree_creat_node(btree);
if(NULL == node2) {
fprintf(stderr, "[%s][%d] Create node failed!\n", __FILE__, __LINE__);
return -1;
}
/* Copy data */
memcpy(node2->key, node->key + sidx + 1, (total-sidx-1) * sizeof(int));
memcpy(node2->child, node->child+sidx+1, (total-sidx) * sizeof(btree_node_t *));
node2->num = (total - sidx - 1);
node2->parent = node->parent;
node->num = sidx;
/* Insert into parent */
parent = node->parent;
if(NULL == parent) {
/* Split root node */
parent = btree_creat_node(btree);
if(NULL == parent) {
fprintf(stderr, "[%s][%d] Create root failed!", __FILE__, __LINE__);
return -1;
}
btree->root = parent;
parent->child[0] = node;
node->parent = parent;
node2->parent = parent;
parent->key[0] = node->key[sidx];
parent->child[1] = node2;
parent->num++;
}
else {
/* Insert into parent node */
for(idx=parent->num; idx>0; idx--) {
if(node->key[sidx] < parent->key[idx-1]) {
parent->key[idx] = parent->key[idx-1];
parent->child[idx+1] = parent->child[idx];
continue;
}
break;
}
parent->key[idx] = node->key[sidx];
parent->child[idx+1] = node2;
node2->parent = parent;
parent->num++;
}
memset(node->key+sidx, 0, (total - sidx) * sizeof(int));
memset(node->child+sidx+1, 0, (total - sidx) * sizeof(btree_node_t *));
/* Change node2's child->parent */
for(idx=0; idx<=node2->num; idx++) {
if(NULL != node2->child[idx]) {
node2->child[idx]->parent = node2;
}
}
node = parent;
}
return 0;
}
/******************************************************************************
**函数名称: btree_creat_node
**功 能: 新建结点
**输入参数:
** btree: B树
**输出参数: NONE
**返 回: 节点地址
**实现描述:
**注意事项:
**作 者: # Qifeng.zou # 2014.03.12 #
******************************************************************************/
static btree_node_t *btree_creat_node(btree_t *btree)
{
btree_node_t *node = NULL;
node = (btree_node_t *)calloc(1, sizeof(btree_node_t));
if(NULL == node) {
fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));
return NULL;
}
node->num = 0;
/* More than (max) is for move */
node->key = (int *)calloc(btree->max+1, sizeof(int));
if(NULL == node->key) {
free(node), node=NULL;
fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));
return NULL;
}
/* More than (max+1) is for move */
node->child = (btree_node_t **)calloc(btree->max+2, sizeof(btree_node_t *));
if(NULL == node->child) {
free(node->key);
free(node), node=NULL;
fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));
return NULL;
}
return node;
}