最基础的数据结构(转自程序员杂志)(选二)

 Hash表
   作为一种抽象数据结构,词典(Dictionary)被定义为键-值(Key-Value)对的集合。举例来说,在电话号码簿中,通过查找姓名,来找到电话号码,这个例子中姓名是key,电话号码是value。又比如,在学生花名册中,通过查找学号,来找到学生的姓名,这个例子中学号是key,学生的姓名是value。词典最常见的实现方式是Hash表。
   Hash表的实现思路如下:通过某种算法,在键-值对的存储地址和键-值对中的key之间,建立一种映射,使得每一个key,都有一个确定的存储地址与之对应。这种算法被封装在Hash函数中。在查找时,通过Hash函数,算出和key对应的存储地址,从而找到相应的键-值对。相对于通过遍历整个键-值对列表来进行查找,Hash表的查找效率要高得多,理想的情况下算法复杂度仅为O(1)(遍历查找的复杂度为O(n))。
  但是,由于通常情况下key的集合比键-值对存储地址的集合要大得多,所以有可能把不同的key映射到同一个存储地址上。这种情况称为冲突(collision)。一个好的Hash函数应该尽可能地把key映射到均匀的地址空间中,以减少冲突。Hash表的实现也应该提供解决冲突的方案。
  Hash表是一种相对复杂得多的数据结构,从底层完整地实现一个Hash表,也许超出了对一个普通程序员的要求。但是,由于它是如此重要,了解Hash表的概念和掌握使用它的接口,仍然是一项必不可少的技能。
   C语言中没有提供现成的Hash表,但是C++提供了优秀的Hash表实现容器hash_map。象STL中的其他容器一样,hash_map支持任何数据类型,支持内存自动管理,能够自动增长。特别地,hash_map通过模板机制,实现了和hash函数的剥离,也就是说,程序员可以定义自己的hash函数,交给hash_map去进行相应的工作。如下例:
  
  hash_map <string, int> hml; // 使用默认的Hash<string>函数
  hash_map <string, int, hfct> hml; // 使用自定义的hfct()作为hash函数
  hash_map <string, int, hfct, eql> hml; // 使用自定义的hfct()作为hash函数,并且使用自定义的eql()函数比较对象是否相等
  
   Java定义了Map接口,抽象了关于Map的各种操作。在实现了Map接口的类中,有两种是Hash表:HashMap和WeakHashMap(HashTable在Java 1.1以后已被废弃)。后者用于实现所谓“标准映射”(canonicalizing mappings),和本文讨论的内容关系不大。HashMap接受任何类型的对象作为键-值对的元素,支持快速的查找。如下例:
  
  HashMap hm = new HashMap();
  hm.put("akey", "this is a word"); // 使用两个字符串作为键-值对
  String str = (String) hm.get("akey");
  System.out.println(str);
  
  HashMap和hash函数也是剥离的,但使用了另一种思路。在Java中,根类型Object定义了hashCode()和equals()方法,由于任何类型的对象都派生自Object,所以它们都自动继承了这两个方法。用户自定义的类应该重载这两个方法,以实现自己的hash函数和比较函数。如果这两个函数没有被重载,Java会使用Object的hashCode()和equals()方法,它们的默认实现分别是返回对象的地址,以及比较两个对象的地址是否相等。
  在PHP中,数组和Hash表合而为一了。从语法上看,PHP中并没有Hash表这样的容器,而只支持数组。不同的是,PHP中的数组不但支持使用数字下标进行索引,而且支持使用字符串下标进行索引。换句话说,PHP中的数组支持使用键-值对作为数组的元素,并且可以使用键来进行索引(键必须为integer类型或string类型)。而且,PHP中的数组支持自动增长和嵌套。如下例:
  
  $arr = array(1 => 12, "akey" => "this is a word");
  echo $arr[1]; // 得到12
  echo $arr["akey"]; // 得到"this is a word"
  
   PHP没有提供自定义hash函数的接口。由于它不接受integer和string以外的类型作为键,这一点事实上也没有必要。
  
  结束语
   当接受这篇文章的约稿时,我认为这是一项比较简单的工作。因为这三种数据结构实在是太基础了,所以我甚至怀疑是否能够写出足够长的篇幅。很快我就发现了自己的错误。光是字符串就够写一本书的。
   在撰写本文的过程,我回顾了学习过的大部分编程语言,重温了许多经典书籍中的相关章节,启动了各种IDE编写测试用例。我接触到了大量未知的领域,至今我仍然在猜测许多问题的实现细节。这从另外一个方面说明了基本数据结构的重要性:即使在我们最熟悉的事物中,也隐藏着极为深刻的原理

你可能感兴趣的:(数据结构,编程,算法,PHP,ide)