本文是《Java核心技术 卷1》中第13章的读书总结。
Java集合类库中除了前面几节中介绍的8个类之外,还有6个专用集与专用映射表,4个Java一开始就存在的类。这节将简单介绍一下这些集合类。
WeakHashMap类是为了解决一个有趣的问题。如果有一个值,对应的键已经不再使用了,将会出现什么情况呢?假定对某个键的最后一次引用已经消亡,不再有任何途径引用这个值的对象了。但是,由于程序中的任何部分没有再出现这个键,所以这个键值对无法从映射表中删除。为什么垃圾回收器不能删除它呢?难道删除无用的对象不是垃圾回收器的工作么?
遗憾的是,事情没有这么简单。垃圾回收器跟踪活动的对象。只要映射表对象是活动的,其中的所有桶也是活动的,它们不能被回收。因此,需要由程序负责从长期存活的映射表中删除无用的值。或者使用WeakHashMap完成这件事。当对键的唯一引用来自散列表条目时,这一数据结构将与垃圾回收器协调工作一起删除键值对。
下面是这个机制的内部运行情况。WeakHashMap使用弱引用(weak reference)保存键。WeakReference对象将引用保存到另外一个对象中,在这里,就是散列表键。对于这种类型的对象,垃圾回收器用一种特有的方式进行处理。通常,如果垃圾回收器发现某个特定的对象已经没有他人引用了,就将其收回。然而,如果某个对象这能由WeakReference引用,垃圾回收器仍然回收它,但要将引用这个对象的弱引用放入队列中。WeakHashMap将周期性的检查队列,以便找出新添加的弱引用。一个弱引用进入队列意味着这个键不再被他人使用,并且已经被收集起来。于是,WeakHashMap将删除对应的条目。
Java SE 1.4 增加了两个类:LinkedHashSet和LinkedHashMap,用来记住插入元素的顺序。这样就可以避免在散列表中的项从表面上看是随机排列的。当条目插入到表中时,就会并入到双向链表中。如下图:
链接散列映射表将用访问顺序,而不是插入顺序对映射表元素进行迭代。每次调用get或put,受到影响的元素将从当前位置删除,并放到元素链表的尾部(只有元素在链表中的位置受影响,而散列表中的桶不会受影响。一个元素总位于与键散列码对应的桶中)。
EnumSet是一个枚举类型元素集的高效实现。由于枚举类型只有有限个实例,所以EnumSet内部用位序列实现。如果对应的值在集中,则相应的位被置为1.
EnumSet类没有公共的构造器,可以使用静态工厂方法构造这个集:
enum Weekday={MONDAY,TUESDAY,WEDNESDAY,THURISDAY,FRIDAY,SATURDAY,SUNDAY}; EnumSet<Weekday> always=EnumSet.allOf(Weekday.class); EnumSet<Weekday> never=EnumSet.noneOf(Weekday.class); EnumSet<Weekday> workday=EnumSet.range(Weekday.MONDAY,Weekday.FRIDAY); EnumSet<Weekday> mwf=EnumSet.of(Weekday.MONDAY,Weekday.WEDNESDAY,Weekday.FRIDAY);可以使用Set接口的常用方法来修改EnumSet。
EnumMap是一个键类型为枚举类型的映射表。它可以直接且高效的用一个值数组实现。在使用时,需要在构造器中指定键类型:
EnumMap<Weekday,Employee> personInCharge=new EnumMap<>(Weekday.class);
Java SE 1.4 中还增加了一个特殊的类IdentityHashMap。在这个类中,键的散列值不是用hashCode方法计算的,而是用System.identityHashCode方法计算的。这是Object.hashCode方法根据对象的内存地址来计算散列码时所使用的方式。而且,在对两个对象进行比较时,IdentityHashMap类使用==,而不是equals。
也就是说,不同的键对象,即使内容相同,也被视为不同的对象。在实现对象遍历算法(如对象序列化)时,这个类非常有用,可以用来跟踪每个对象的遍历状况。
以上就是Java集合类库中的专用集合类。接下来的是Java集合类库中的遗留类。
Hashtable和HashMap类的作用一样,实际上,这两个类拥有相同的接口。与Vector类一样,Hashtable的方法也是同步的,这是与HashMap不同的地方。如果对同步性或与遗留代码的兼容性没有任何要求,就应该使用HashMap。
遗留集合使用Enumeration接口对元素进行遍历。Enumeration接口有两个方法,即hashMoreElements和nextElement。这两个方法与Iterator接口的hashNext和next方法十分类似。
例如,Hashtable类的elements方法将产生一个用于描述表中各个枚举值的对象:
Enumeration<Employee> e=staff.elements(); while(e.hasMoreElements()) { Employee em=e.nextElements(); ... }
Properties类是一个属性映射表,是一个非常特殊的映射表结构。它有下面三个特性:
属性映射表通常用于程序的特殊配置选项。
BitSet类用于存放一个位序列。如果需要高效的存储位序列(比如标志)就可以使用BitSet。由于位集包装在字节里,所以使用位集要比使用Boolean对象的ArrayList更加高效。
BitSet类提供了一个便于读取、设置或清除各个位的接口。使用这个接口可以避免屏蔽和其它麻烦的位操作。如果将这些位存储在int或long变量中就必须进行这些繁琐的操作。
例如,对于一个名为bucketOfBits的BitSet:
bucketOfBits.get(i);如果第i位处于“开”的状态,就返回true,否则返回false。
同样:
bucketOfBits.set(i);将第i位设置为“开”状态。最后:
bucketOfBits.clear(i);
将第i位置为“关”状态。
从1.0版开始,标准类库中就包含了Stack类,其中有熟悉的push和pop操作。但是,Stack类扩展为Vector类,从理论角度看,Vector类并不令人满意,它可以让栈使用不属于栈操作的insert和remove方法,即可以在任何地方进行插入或删除操作,而不仅仅是栈顶。