散列的价值在于速度: 散列使得查询快速,由于瓶颈位于键的查找速度,
因此解决方案之一就是保持键的排序状态,然后使用Collections.binarySearch()
进行查询.
散列更进一步,它将键保存在某处,以便能够很快找到。存储一组元素最快
的数据结构是数组,所以使用它来表示键的信息(这里说的是键的信息,而不是键本身)。
但是因为数组不能够调整容量,因此就有一个问题:我们希望在Map中保存数量不确定
的值,但是如果键的数量被数组的容量限制了,该怎么办?
答案是:数组并不保存键本身,而是通过键对象生成一个数字,将其作为数组
下标。这个数字就是散列码。由定义在Object中的,切可能由你的类覆盖的hashCode()
方法。
为解决数组容量被固定的问题,不同的键可以产生相同的下标。也就是说,可能会有
冲突。因此数组多大就不重要了,任何键总能在数组中找到它的位置。
于是查询一个值的过程首先就是计算散列码,然后使用散列码查询数组。如果
能够保证没有冲突,那可就有一个完美的散列函数,但是这种情况只是特例。
通常冲突由外部链接处理:数组并不直接保存值,而是保存值的list。在后对list中的
值使用equals()方法进行线性的查询。这部分的查询自然会比较慢,但是,如果散列
函数好的话,数组的每个位置就只有较少的值。因此,不是查询整个list,而是快速
地跳到数组的某个位置,只对很少的元素进行比较。