B-树

   B-tree树即B树,B即Balanced,平衡的意思。因为B树的原英文名称为B-tree,而国内很多人喜欢把B-tree译作B-树,其实,这是个非常不好的直译,很容易让人产生误解。如人们可能会以为B-树是一种树,而B树又是另一种树。而事实上是,B-tree就是指的B树。B-树(百度百科)是由R.Bayer和E.M.McCreight与1972提出的一种多路平衡查找树,当查找的文件较大且存放在直接存取设备中时,能够有效地减少查找过程对文件的读取次数,提高查找效率。

 定义:

B-树是一种多路平衡查找树,在文件系统中有所应用。主要用作文件的引索。

  一棵m阶的B-树,或为空树,或者满足一下性质。

(1)每棵树只有一个根结点,根结点的关键字的范围[1,m-1];

(2)根结点至少有两颗子树。

(3)每个节点最多有m棵子树。

(4)除根节点和叶子节点外的非终端结点,所有的节点至少有[m/2](向上取整)个子树。

(5)非叶子节点的关键字范围[[m/2]-1,m-1];

(6)所有的叶子节点位于同一层。

(7)节点的关键字个数比子树个数少一。

(8)所有非终端结点包含下列信息

   (n,A0,K1,A2,K2,....Kn,An)

其中Ki(i=1,2,3,...n)为关键字且Ki<Ki+1;Ai(i=0,1,2,...n)为指向子树的根结点的指针,Ki小于Ai所指子树的所有关键字值(换而言之Ki大于Ai-1的所有子树关键字的值)。                                                                                                      


下图是典型的3B-

 

B-树_第1张图片

B-树结构定义

typedef struct BTNode{
    int keynum;
    struct BTNode *parent;//父节点
    KeyType key[m+1];//关键字
    struct BTNode *ptr[m+1];//孩子节点
}BTNode,*BTree;
//辅助的result结构体

typedef struct{
    BTNode *pt;//指向要插入的节点
    int i;//插入的位置
    int tag;//1:查找成功;2:查找失败
}Result;
基本操作:

  主要讲解插入和删除操作,查找操作各大教材上面都有,就不在赘述:

1)B-树的插入操作(关键是判断m的关键字个数是否达到上限m-1)

  (a)利用查找算法找到插入的位置,若找得到,则说明该关键字,直接返回。否则返回将要插入的结点和位置。

  (b)判断该节点是否存在空位置,即判断该节点关键总数n<=m-1;如果满足,则说明该节点还有空位置,则将关键字直接插入该节点中适当的位置。若不满足,则说明该节点已经没有空位置了,需要将该节点分裂成两个。

   分裂方法:生成一新节点。将原点上的关键字和K(即要插入的关键字),然后从中间位置将关键字分成两个部分(不包含中间位置关键字),左部分所含关键字放在旧结点中,右部分所含的关键字放在新生成的结点当中,中间关键字连同新生成节点插入到父节点中。如果父节点关键字总数不满足n<=m-1,则重复上述操作,继续向上分裂.

注意:关键字的插入应该先在叶子节点上面操作。即找到合适的叶子节点进行插入操作,而不是在非终端结点上面直接插入。

B-树_第2张图片B-树_第3张图片B-树_第4张图片


   B-树的删除操作

 删除操作的重点是判断该节点的关键字总数是否满足n>=[m/2]-1(后面默认[m/2]表示m/2之后向上取整),根据性质4可得,B-树的删除也主要分为两步。

  (a)首先利用B-树的查找算法判断该节点是否为叶子节点。若为叶子节点则根据不同的情况进行相应的操作。

  (b)若该节点为非叶子节点,且该节点要删除的关键字为K[i],自在A[i]中找到最小的关键字Y替代K[i],然后在叶子节点中去掉Y;


在B-树的叶子节点中删除一个关键字的方法:

  首先将要删除的关键字在叶子节点中删除,然后根据不同的情况作相应的处理。

  a.若被删关键字所在节点总数n>=[m/2],则直接删除该节点。

  b.若被删关键字所在节点总数n=[m/2]-1,删除之后则不满足B-树的定义,需要对B-树进行调整

     

调整过程为:如果其左右兄弟结点中有“多余”的关键字,即与该结点相邻的右(左)兄弟结点中的关键字数目大于ceil(m/2)-1。则可将右(左)兄弟结点中最小(大)关键字上移至双亲结点。而将双亲结点中小(大)于该上移关键字的关键字下移至被删关键字所在结点中

   c.如果左右兄弟结点中没有“多余”的关键字,即与该结点相邻的右(左)兄弟结点中的关键字数目均等于ceil(m/2)-1。这种情况比较复杂。需把要删除关键字的结点与其左(或右)兄弟结点以及双亲结点中分割二者的关键字合并成一个结点,即在删除关键字后,该结点中剩余的关键字加指针,加上双亲结点中的关键字Ki一起合并到Ai(即双亲结点指向该删除关键字结点的左(右)兄弟结点的指针)所指的兄弟结点中去。如果因此使双亲结点中关键字个数小于ceil(m/2)-1,则对此双亲结点做同样处理。以致于可能直到对根结点做这样的处理而使整个树减少一层。

总之,设所删关键字为非终端结点中的Ki,则可以指针Ai所指子树中的最小关键字Y代替Ki,然后在相应结点中删除Y。对任意关键字的删除都可以转化为对最下层关键字的删除。


a被删关键字Ki所在结点的关键字数目不小于ceil(m/2),则只需从结点中删除Ki和相应指针Ai,树的其它部分不变

B-树_第5张图片

b、被删关键字Ki所在结点的关键字数目等于ceil(m/2)-1,则需调整。调整过程如上面所述。B-树_第6张图片

c、被删关键字Ki所在结点和其相邻兄弟结点中的的关键字数目均等于ceil(m/2)-1,假设该结点有右兄弟,且其右兄弟结点地址由其双亲结点指针Ai所指。则在删除关键字之后,它所在结点的剩余关键字和指针,加上双亲结点中的关键字Ki一起,合并到Ai所指兄弟结点中(若无右兄弟,则合并到左兄弟结点中)。如果因此使双亲结点中的关字数目少于ceil(m/2)-1依次类推.

 


#include<stdio.h>
#include<stdlib.h>

#define m 3
#define OK 1
#define ERROR 0
#define TRUE 1
#define FALSE 0

typedef  int Status;
typedef int KeyType;

int  Min =m/2+m%2;

typedef struct BTNode{
    int keynum;
    struct BTNode *parent;//父节点
    KeyType key[m+1];//关键字
    struct BTNode *ptr[m+1];//孩子节点
}BTNode,*BTree;

typedef struct{
    BTNode *pt;//指向找到的结点
    int i;//关键字序号
    int tag;//1:查找成功;2:查找失败
}Result;

Status InitBTree(BTree &bt);
int Search(BTree bt,KeyType K);
Result& SearchBTree(BTree T,KeyType K);
Status Insert(BTree &p,int i,KeyType K,BTree ap);
Status split(BTree &p,int s,BTree &ap);
Status NewRoot(BTree &T,BTree &q,KeyType K,BTree &ap);
Status InsertBTree(BTree &T,KeyType K,BTree q,int i);
Status CreateBTree(BTree &bt,KeyType *a,int N);
void Successor(BTree &p,int i,BTree &q);//
void Remove(BTree &p,int i);
void Restore(BTree &p,int i);
void MoveRight(BTree &p,int i);
void MoveLeft(BTree &p,int i);
void Combine(BTree &p,int i);
int RecDelete(BTree &p,KeyType K);
void DeleteBTree(BTree &p,KeyType K);
void PrintBTree(BTree);

int main()
{
    int N,a[20];
    BTree bt=NULL;
	KeyType K;
	Result r;
    printf("元素个数:");
    scanf("%d",&N);
    printf("输入元素序列:");
    for(int i=0;i<N;i++)
        scanf("%d",&a[i]);
    CreateBTree(bt,a,N);
	PrintBTree(bt);
	printf("输入删除关键字:");
	scanf("%d",&K);
	DeleteBTree(bt,K);
	PrintBTree(bt);

    return 0;
}

Status InitBTree(BTree &bt)
{
    bt->keynum=0;
    for(int i=0;i<=m;i++)
    {
        bt->key[i]=0;
        bt->ptr[i]=NULL;
    }
    bt->parent=NULL;
	return OK;
}

int Search(BTree bt,KeyType K)
{
	if(K<bt->key[1])
		return 0;
	if(K>=bt->key[bt->keynum])
		return bt->keynum;
    for(int i=1;i<=bt->keynum-1;i++)
        if(bt->key[i]<=K&&bt->key[i+1]>K)
			return i;
	if(bt->keynum==0)
		return 0;
}

Result& SearchBTree(BTree T,KeyType K)
{
    BTree p=T,q=NULL;
    Result result;
    int i=0,found=FALSE;
    while(p&&!found)
    {
        i=Search(p,K);
        if(i>0&&p->key[i]==K)
            found=TRUE;
        else
        {
            q=p;
            p=p->ptr[i];
        }
    }

    result.i=i;
    if(found==TRUE)
    {
        result.pt=p;
        result.tag=1;
    }else
    {
        result.pt=q;
        result.tag=0;
    }
    return result;
}

Status Insert(BTree &p,int i,KeyType K,BTree ap)
{
	if(i==p->keynum)
	{
		p->key[i+1]=K;
		p->ptr[i+1]=ap;
		if(ap)
			ap->parent=p;
		p->keynum++;
	}
	else
	{
		p->keynum++;
		for(int t=p->keynum;t>=i+2;t--)
		{
			p->key[t]=p->key[t-1];
			p->ptr[t]=p->ptr[t-1];
		}
		p->key[i+1]=K;
		p->ptr[i+1]=ap;
		if(ap)
			ap->parent=p;
	}

    return OK;
}

Status split(BTree &p,int s,BTree &ap)
{
    int t=0;
    ap=(BTree)malloc(sizeof(BTNode));
    if(!ap)
    {
        printf("malloc error");
        return ERROR;
    }
    InitBTree(ap);
    for(int i = s + 1; i <= p->keynum; i++)
    {
        ap->key[i - s] = p->key[i];
        ap->ptr[i - s] = p->ptr[i];
		if(ap->ptr[i-s])
			ap->ptr[i-s]->parent=ap;
    }
	ap->ptr[0]=p->ptr[s];
	if(ap->ptr[0])
		ap->ptr[0]->parent=ap;
	ap->keynum=p->keynum-s;
    //初始化前面的一段内容
	for(int j=s;j<=p->keynum;j++)
	{
		p->key[j]=0;
		p->ptr[j]=NULL;
	}	
	p->keynum=s-1;
    return OK;
}

Status NewRoot(BTree &T,BTree &q,KeyType K, BTree &ap)
{
    int s,i;
    if(!T)//当根节点为空的之后
    {
        T=(BTree)malloc(sizeof(BTNode));
        if(!T)return ERROR;
        InitBTree(T);
        T->key[1]=K;
		T->keynum++;
    }
    else//返回到最上面的顶点
    {
        s=T->keynum/2+T->keynum%2;
		q=(BTree)malloc(sizeof(BTNode));
		if(!q)return ERROR;
		InitBTree(q);
		q->key[1]=K;
		q->ptr[0]=T;
		q->ptr[1]=ap;
		q->keynum++;
		T->parent=q;
		if(ap)
			ap->parent=q;
		T=q;
    }
    return OK;
}

Status InsertBTree(BTree &T,KeyType K,BTree q,int i)
{
    KeyType x=K;
    BTree ap=NULL;
    int finished=FALSE;
    int s;

    while(q&&!finished)
    {
        Insert(q,i,x,ap);
        if(q->keynum<m)
            finished=TRUE;
        else
        {
            s=m/2+m%2;
			x=q->key[s];
            split(q,s,ap);
            q=q->parent;
            if(q)
                i=Search(q,x);
        }
    }
    if(!finished)//分裂到最高结点,或者T为空树
        NewRoot(T,q,x,ap);
    return OK;
}

//创建一个B-Tree
Status CreateBTree(BTree &bt,KeyType *a,int N)
{
    Result result;
    for(int i=0;i<N;i++)
    {
        result=SearchBTree(bt,a[i]);
        if(!result.tag)//B-Tree中没有该节点,插入
			InsertBTree(bt,a[i],result.pt,result.i);
    }
    return OK;
}

void PrintBTree(BTree bt)
{
    if(bt)
    {
        for(int i=1;i<=bt->keynum;i++)
            printf("%d ",bt->key[i]);
        printf("\n");
        for(int t=0;t<=bt->keynum;t++)
            PrintBTree(bt->ptr[t]);
    }
}

void DeleteBTree(BTree &bt,KeyType K)
{
    BTree p;
    if(RecDelete(bt,K)==0)
        printf("关键字%d不在B-树中\n",K);
    else
    {
		printf("删除成功!\n");
		if(bt->keynum==0)
		{
			p=bt;
			bt=bt->ptr[0];
			free(p);
		}		
    }
}

int RecDelete(BTree &p,KeyType K)
{
    int i,j,found;
    BTree q,t=NULL,s;
    Result r;
	KeyType P;
    if(p==NULL)
        return 0;
    else
    {
        r=SearchBTree(p,K);
        i=r.i;
        q=r.pt;
        if(r.tag==1)//找到了该节点
        {
            if(q->ptr[i-1])//该节点为非叶子节点
            {
                Successor(q,i,t);//将该节点删除后,从q.ptr[i]中将最小的位置给他
				P=t->key[1];
				Remove(t,1);
			    if(t->keynum<Min-1)
				{
				   j=Search(t->parent,P);
                   Restore(t->parent,j);
				}
				
            }
            else
            {
                t=q->parent;
                j=Search(t,K);
                Remove(q,i);//删除叶子节点中的关键字
                if(q->keynum<Min-1)
                    Restore(t,j);
            }
        }
    }
	return r.tag;
}

void Successor(BTree &p,int i,BTree &q)
{
	BTree t;
    for(q=p->ptr[i];q!=NULL;t=q,q=q->ptr[0])
		p->key[i]=q->key[1];
	q=t;
}

void Remove(BTree &p,int i)
{
    for(int j=i;j<=p->keynum;j++)
    {
        p->key[i]=p->key[i+1];
        p->ptr[i]=p->ptr[i+1];
    }
	p->key[p->keynum]=0;
	p->ptr[p->keynum]=NULL;
    --p->keynum;
}

void Restore(BTree &p,int i)
{
    //shan删除关键字后,调整整个B-
    if(i==0)
    {
        if(p->ptr[1]->keynum>Min-1)
            MoveLeft(p,i);
        else
            Combine(p,1);
    }
    else if(i==p->keynum)
    {
        if(p->ptr[p->keynum-1]->keynum>Min-1)
            MoveRight(p,i);
        else
            Combine(p,p->keynum);
    }
    else//其他情况即为既有左子树,又有右子树
    {
        if(p->ptr[i+1]->keynum>Min-1)
            MoveLeft(p,i);
        else if(p->ptr[i-1]->keynum>Min-1)
            MoveRight(p,i);
        else
            Combine(p,i);
    }

}

void MoveRight(BTree &p,int i)
{
    BTree q;
    q=p->ptr[i];
    q->keynum++;
    for(int t=q->keynum;t>=2;t--)
    {
        q->key[t]=q->key[t-1];
        q->ptr[t]=q=q->ptr[t-1];
    }
    q->ptr[1]=q->ptr[0];
    q->key[1]=p->key[i];
    q=p->ptr[i-1];
    p->key[i]=q->key[q->keynum];
    q->key[q->keynum]=0;
    q->ptr[q->keynum]=NULL;
    q->keynum--;
}

void MoveLeft(BTree &p,int i)
{
    BTree q;
    q=p->ptr[i];
    q->keynum++;
    q->key[q->keynum]=p->key[i+1];
    q=p->ptr[i+1];
    p->key[i+1]=q->key[1];
    for(int t=1;t<=q->keynum-1;t++)
    {
        q->key[t]=q->key[t+1];
        q->ptr[t]=q->ptr[t+1];
    }
    q->key[q->keynum]=0;
    q->keynum--;
}

void Combine(BTree &p,int i)
{
	int c;
    BTree q;
    BTree l;
	q=p->ptr[i];
	l=p->ptr[i-1];
	l->keynum++;
	l->key[l->keynum]=p->key[i];
	//合并两个叶子节点
	for(c=l->keynum+1;c<=l->keynum+q->keynum;c++)
		l->key[c]=q->key[c-l->keynum];
	l->keynum+=q->keynum;
	//删除父节点中分割的关键字
	for(c=i;c<=p->keynum-1;c++)
	{
		p->key[c]=p->key[c+1];
		p->ptr[c]=p->ptr[c+1];
	}
	p->key[p->keynum]=0;
	p->ptr[p->keynum]=NULL;
	p->keynum--;
    free(q);
}






  

  



你可能感兴趣的:(数据结构,算法,严蔚敏,平衡二叉树)