为学习 LLVM 的 ImmutableSet,其底层的实现选择为 AVL 树(平衡二叉搜索树),我不很熟悉该树,虽然大致知道但毕竟不精,因此还是先学习学习二叉搜索树吧。
二叉搜索树或叫做二叉查找树,可以用于实现Dictionary辞典,辞典是K,V 键值的对的集合。一般 Dictionary 不含重复的 K。一个 Dictionary 的抽象数据类型规范可定义为:
interface Dictionary<K extends Comparable<K>, V> { // 当且仅当辞典为空的时候返回真。 public boolean isEmpty(); // 如果存在键值为 k 的 <K,V> 对,则返回它们。 public Entry<K, V> get(K k); // 插入给出的 k,v 对,如果键值已经存在则更新相关元素 v。 public void insert(K k, V v); // 删除特定键值的 k,v 对。 public void remove(K k); }
二叉查找树的定义有4条,参见书即可。我们最需关注的是在二叉查找树中位于左子树的键小于根的键,右子树的键大于根的键。下面具体学习如何实现 isEmpty, get, insert, remove 等方法。
假设节点与树的结构如下(方法实现在 BSTree 类中):
// 表示一个树节点。 class TreeNode<K, V> { TreeNode left; // 左子树 TreeNode right; // 右子树 K key; // 键 V value; // 元素值 } // 表示一个二叉查找树。 class BSTree<K, V> implements Dictionary { TreeNode<K, V> root; // 根节点。 }
方法 isEmpty 比较简单,判断 root 是否为空即可。不用多探讨了。
方法 get 如下:
// 在 BSTree 类中. public TreeNode get(K k) { if (this.root == null) return null; // 没有任何节点 return this.root.find(k); } // 在 TreeNode 类中。 public TreeNode find(K k) { TreeNode<K, V> node = this; while (node != null) { int c = k.compareTo(node.getKey()); if (c < 0) node = node.getLeft(); // 查找左子树。 else if (c > 0) node = node.getRight(); // 查找右子树。 else return node; // 找到了。(c == 0) } return null; // 没有找到。 }
在这里使用了二叉查找树的核心性质,根据 compare 结果,如果 k 小于当前节点的键则查找左子树,大于则查找右子树,如果相等则就是自己。也可以使用递归方法写查找,但是效率上可能不如这样写好。
insert 方法实现如下:
public void insert(K k, V v) { if (k == null) throw new NullPointerException("k"); TreeNode<K, V> new_node = new TreeNode<K, V>(k, v); if (this.root == null) { // 特殊情况,没有任何节点的时候。 this.root = new_node; return; } // 在树中搜索 k 的节点 p, pp 表示 p 的父节点。 TreeNode<K, V> p = this.root, pp = null; while (p != null) { pp = p; // 如果 p 走向了子节点,则 pp 恰好是 p 的父节点。 int c = k.compareTo(p.getKey()); if (c < 0) // 走向左节点。 p = p.getLeft(); else if (c > 0) // 走向右节点。 p = p.getRight(); else { // p 的 key 就是 k,找到同键值的,则更新 v 返回。 p.setValue(v); return; } } // 如果走到这里,则 p == null, pp 是前一个节点,新的节点应插入到 pp 下面(左、右取决于键值的比较) if (k.compareTo(pp.getKey()) < 0) // k < pp.key 表示应插入到 pp 的左子树 pp.left = new_node; else pp.right = new_node; }
remove 实现如下:
private TreeNode<K, V> internal_remove(K k) { if (this.root == null) return null; // 没有任何节点的特殊情况。 TreeNode<K, V> p = this.root, pp = null; // 查找要删除的键值为 k 的节点 p,以及其父节点 pp。 // 如果 pp 为 null 表示 p 是根节点 root。 while (p != null) { int c = k.compareTo(p.getKey()); if (c == 0) break; pp = p; p = (c < 0) ? p.left : p.right; } if (p == null) return null; // 没有找到要删除的元素。 // 现在 p 是要删除的节点,pp 是其父节点(可能为 null)。 if (p.left == null || p.right == null) { // 这里 p 至多只有一个子树,则就用这一个子树替代 p 即可。 set_pp_child(pp, p, p.left != null ? p.left : p.right); } else { // p 有两个子树。可以用 left.max or right.min 来替代 p。我们选用右边的最左子树(min)。 TreeNode<K, V> pR = p.right; if (pR.left == null) { // 右边的子树没有左分支,则用 p_right 替代 p 即可。 pR.left = p.left; set_pp_child(pp, p, pR); return p; } // p 的右子树 pR 有左子树,则从中删除最左的节点 -- rmin。 TreeNode<K, V> rmin = internal_remove_rmin(pR); rmin.left = p.left; // 用 rmin 替代 p,因此设置 rmin.left, .right rmin.right = pR; set_pp_child(pp, p, rmin); } return p; } // 移除指定节点的最小子节点(pR.min),也即最左子节点。 private TreeNode<K, V> internal_remove_rmin(TreeNode<K, V> pR) { if (pR.left == null) throw new java.lang.RuntimeException("pR.left is null"); TreeNode<K, V> rmin = pR.left, rmin_pp = pR; // rmin_pp 是 rMin 的父节点。 while (rmin.left != null) { rmin_pp = rmin; rmin = rmin.left; // 向左走到最左子节点,其就是 pR.min。 } // 现在 rmin = pR.min, rmin_pp = rmin.parent。 assert (rmin.left == null); // 现在 rmin 必然没有左子树了。 rmin_pp.left = rmin.right; rmin.right = null; return rmin; } private void set_pp_child(TreeNode<K, V> pp, TreeNode<K, V> p, TreeNode<K, V> child) { if (pp == null) this.root = child; // 删除的就是根,设置根为 child else if (pp.left == p) pp.left = child; // p 是 pp 的左子树,替代为 child else pp.right = child; // p 是 pp 的右子树,替代为 child }
remove 方法的实现显得笨拙一些。
为了方便研究 binary search tree,我编写了一个 java 小程序,位于这里:http://vdisk.weibo.com/s/3dT-U/1331863473
该程序可以通过输入命令 find, insert, delete, dump 等构造和查看二叉查找树。帮助为 help, 退出为 exit。
下一步准备在二叉查找树的基础上实现/学习 AVL 树。