【高阶数据结构】B树

目录

1.B树

2.B+树和B树的不同

3.B*树


B树较于哈希红黑树的优势:外查找:读取磁盘数据   ; B树的高度更低,对磁盘的进行I/O操作的次数更少(磁盘的性能比内存差得多);

1.B树

1.1.B树的概念:

  1. 根节点至少有两个孩子       (空树除外)
  2. 每个分支节点都包含k-1个关键字和k个孩子,其中 ceil(m/2) ≤ k ≤ m ceil是向上取整函数     (分支节点都是依靠叶节点分裂得到,孩子依靠分裂得到)
  3. 每个叶子节点都包含k-1个关键字,其中 ceil(m/2) ≤ k ≤ m       (叶子节点没有孩子)
  4. 所有的叶子节点都在同一层   (因为分裂向上插入)
  5. 每个节点中的关键字从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域划分  ( 所有左孩子 <  关键字  < 所有右孩子 )
  6. 每个结点的结构为:(n,A0,K1,A1,K2,A2,… ,Kn,An)其中,Ki(1≤i≤n)为关键子,且Ki < Ki+1(1<= i <= n-1)  Ai(0≤i≤n)为指向子树根结点的指针。且Ai所指子树所有结点中的关键字均小于Ki+1。n为结点中关键字的个数,满足ceil(m/2)-1≤n≤m-1。

分裂:所有元素都是插入关键字,孩子是指向的节点指针;数组满了,分裂出brother(new出来)节点将【mid+1,r】拷贝给brother,如果父节点为空就,创建新的父节点,父节点的左边为原数组,有孩子为brother;

【高阶数据结构】B树_第1张图片

#pragma once
#include
#include

using namespace std;

template
class Node {

public:
	Node()
	{
		//孩子最多为N个,关键字比孩子少一个
		//需要多开辟一个,来判断数组元素满
		_key.resize(N);
		_children.resize(N+1, nullptr);
		_parent = nullptr;
		_size = 0;
	}
	~Node()
	{

	}
public:
	//关键字
	vector _key;
	//孩子数据
	vector*> _children;
	//父亲节点
	Node* _parent;
	//有效个数
	size_t _size;
};
template
class BTree {
public:
	typedef Node Node;
	//返回节点和下标
	pair Find(T val)
	{
		Node* parent = nullptr;
		Node* cur = _root;
		
		//找到合适位置,从左向右找 比当前元素大,判断是否有左孩子
		while (cur)
		{
			size_t i = 0;
			while (i < cur->_size)
			{
				//找到比我大的了
				if ( val < cur->_key[i] )
					break;
				else if ( val > cur->_key[i] )
					i++;
				else//元素存在了,退出
					return make_pair(cur, i);
			}
			//保存父亲
			parent = cur;
			cur = cur->_children[i];
		}
		//不存在,返回父亲和-1
		return make_pair(parent, -1);
	}
	void _Insert(T val, Node* parent, Node* child)
	{
		int end = parent->_size - 1;
		//从最后一个元素挪数据
		while (end >= 0)
		{
			//目标元素更小,挪
			if (val < parent->_key[end])
			{
				parent->_key[end + 1] = parent->_key[end];
				parent->_children[end + 2] = parent->_children[end + 1];//挪右孩子
				end--;
			}
			else
				break;
		}
		//合适的插入位置
		parent->_key[end + 1] = val;
		parent->_children[end + 2] = child;//右孩子

		if (child)//指向父亲
			child->_parent = parent;
		parent->_size++;
	}
	bool Insert(T val)
	{
		//第一个插入的元素
		if (_root == nullptr)
		{
			_root = new Node;
			_root->_key[0] = val;
			_root->_size++;
		}
		else
		{
			//查找是否存在
			pair pr = Find(val);
			if (pr.second >= 0)//元素已存在,不用在插入
				return false;

			//该插入的位置
			Node* parent = pr.first;
			Node* child = nullptr;
			_Insert(val, parent, child);
			
			while (true)
			{
				if (parent->_size < N)
					return true;
				else//数组满,分离
				{
					//分裂 [l, mid-1]   [mid+1, r]
					int mid = N / 2;
					size_t i = 0;
					size_t j = mid + 1;

					//分离兄弟节点
					Node* brother = new Node;
					for (; j < N; j++, i++)
					{
						brother->_key[i] = parent->_key[j];
						brother->_children[i] = parent->_children[j];
						//有孩子节点,brother做新父亲
						if (parent->_children[j])
							parent->_children[j]->_parent =  brother;

						//分裂给兄弟的关键字和孩子置空
						parent->_children[j] = nullptr;
						parent->_key[j] = T();
					}

					//还有一个右孩子给brother
					brother->_children[i] = parent->_children[j];
					if (parent->_children[j])
						parent->_children[j]->_parent = brother;
					parent->_children[j] = nullptr;

					//分裂完处理个数;
					brother->_size = i;
					parent->_size -= (i + 1);//减去兄弟和中间

					//中间值向上插入
					T midKey = parent->_key[mid];
					parent->_key[mid] = T();

					//头节点
					if (parent->_parent == nullptr)
					{
						_root = new Node;
						_root->_key[0] = midKey;
						_root->_children[0] = parent;
						_root->_children[1] = brother;
						_root->_size = 1;

						//孩子的父亲为头
						parent->_parent = _root;
						brother->_parent = _root;
						break;
					}
					else
					{
						//非头重新插入
						_Insert(midKey, parent->_parent, brother);
						//继续循环,看上一层是否满了
						parent = parent->_parent;

					}


				}
			}
				
		}
	}
public:
private:
	Node* _root = nullptr;
};

 测试代码:

#include"BTree.h"
void TestBtree()
{
	int a[] = { 53, 139, 75, 49, 145, 36, 101 };
	BTree t;
	for (auto e : a)
	{
		t.Insert(e);
	}
}
int main()
{
	TestBtree();
}

2.B+树和B树的不同

  1. 分支节点的子树指针与关键字个数相同
  2. 分支节点的子树指针p[i]指向关键字值大小在[k[i],k[i+1])区间之间
  3. 所有叶子节点增加一个链接指针链接在一起
  4. 所有关键字及其映射数据都在叶子节点出现

B+树的特性:

  1. 所有关键字都出现在叶子节点的链表中,且链表中的节点都是有序的。
  2. 不可能在分支节点中命中。 
  3. 分支节点相当于是叶子节点的索引,叶子节点才是存储数据的数据层。

【高阶数据结构】B树_第2张图片

3.B*树

B*树是B+树的变形,在B+树的非根和非叶子节点再增加指向兄弟节点的指针。

区别就是分裂方式不同:不同当前节点和下一个兄弟节点都满才分裂,都区1/3构成一个new节点,提高利用率, 最多3/1被浪费;

【高阶数据结构】B树_第3张图片

你可能感兴趣的:(数据结构,算法,c++,开发语言)