Java的数据结构相关的类实现原理

List接口


List是有序的Collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在

List中的位置,类似于数组下标)来访问List中的元素,这类似于Java的数组。和下面要提到的Set不同,List允许有相同的元素。

除了具有Collection接口必备的iterator()方法外,List还提供一个listIterator()方法,返回一个ListIterator接口,和标准的Iterator

接口相比,ListIterator多了一些add()之类的方法,允许添加,删除,设定元素,还能向前或向后遍历。

实现List接口的常用类有LinkedList,ArrayList,Vector和Stack。



LinkedList


List 接口的链接列表实现。实现所有可选的列表操作,并且允许所有元素(包括null)。除了实现

 List接口外,LinkedList 类还为在列表的开头及结尾get、remove 和insert 元素提供了统一的命名方法。
 
 这些操作允许将链接列表用作堆栈、队列或双端队列。此类实现

 Deque 接口,为add、poll 提供先进先出队列操作,以及其他堆栈和双端队列操作。

 所有操作都是按照双重链接列表的需要执行的。在列表中编索引的操作将从开头或结尾遍历列表(从靠近指定索

引的一端)。注意,此实现不是同步的。如果多个线程同时访问一个链接列表,而其中至少一个线程从结构上修改了该列表,

则它必须保持外部同步。(结构修改指添加或删除一个或多个元素的任何操作;仅设置元素的值不是结构修改。)这一

般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象,则应该使

用Collections.synchronizedList 方法来“包装”该列表。最好在创建时完成这一操作,以防止对列表进行意外的不同步访

问,如下所示:
                  
List list = Collections.synchronizedList(new LinkedList(...));

此类的iterator 和listIterator 方法返回的迭代器是快速失败的:在迭代器创建之后,如果从结构上对列表进行修

改,除非通过迭代器自身的remove 或add 方法,其他任何时间任何方式的修改,迭代器都将抛

出ConcurrentModificationException。因此,面对并发的修改,迭代器很快就会完全失败,而不冒将来不确定的时间任

意发生不确定行为的风险。注意,迭代器的快速失败行为不能得到保证,一般来说,存在不同步的并发修改时,不可能作出任何硬性保证。快速失

败迭代器尽最大努力抛出ConcurrentModificationException。因此,编写依赖于此异常的程序的方式是错误的,正确做

法是:迭代器的快速失败行为应该仅用于检测程序错误。


ArrayList


是List接口的可变数组的实现。实现了所有可选列表操作,并允许包括

null 在内的所有元素。除了实现List 接口外,此类还提供一些方法来操作内部用来存储列表的数组的大小。
 
每个ArrayList实例都有一个容量,该容量是指用来存储列表元素的数组的大小。它总是至少等于列表的大小。随着

向ArrayList中不断添加元素,其容量也自动增长。自动增长会带来数据向新数组的重新拷贝,因此,如果可预知数据

量的多少,可在构造ArrayList时指定其容量。在添加大量元素前,应用程序也可以使用ensureCapacity操作来增加

ArrayList实例的容量,这可以减少递增式再分配的数量。

注意,此实现不是同步的。如果多个线程同时访问一个ArrayList实例,而其中至少一个线程从结构上修改了列表,

那么它必须保持外部同步。



HashMap


HashMap是基于哈希表的Map接口的非同步实现。此实现提供所有可选的映射操作,并允许使用null值和null键。

此类不保证映射的顺序,特别是它不保证该顺序恒久不变。HashMap也不例外。

HashMap实际上是一个“链表的数组”的数据结构,每个元素存放链表头结点的数组,即数组和链表的结合体。

HashMap底层就是一个数组结构,数组中的每一项又是一个链表。当新建一个HashMap的时候,就会初始化一个数组。

当我们往HashMap中put元素的时候,先根据key的hashCode重新计算hash值,根据hash值得到这个元素在数

组中的位置(即下标),如果数组该位置上已经存放有其他元素了,那么在这个位置上的元素将以链表的形式存放,新

加入的放在链头,最先加入的放在链尾。如果数组该位置上没有元素,就直接将该元素放到此数组中的该位置上。

当系统决定存储HashMap中的key-value对时,完全没有考虑Entry中的value,仅仅只是根据

key来计算并决定每个Entry的存储位置。我们完全可以把Map 集合中的value 当成key 的附属,当系统决定了key

的存储位置之后,value 随之保存在那里即可。

 

在HashMap中要找到某个元素,需要根据key的hash值来求得对应数组中的位置。如何计算这个位置就是

hash算法。前面说过HashMap的数据结构是数组和链表的结合,所以我们当然希望这个HashMap里面的

元素位置尽量的分布均匀些,尽量使得每个位置上的元素数量只有一个,那么当我们用hash算法求得这个位置的时候,马上就可以知道

对应位置的元素就是我们要的,而不用再去遍历链表,这样就大大优化了查询的效率。

 

归纳起来简单地说,HashMap 在底层将 key-value 当成一个整体进行处理,这个整体就是一个 Entry 对象。

HashMap 底层采用一个Entry[] 数组来保存所有的 key-value 对,当需要存储一个Entry 对象时,会根据

hash算法来决定其在数组中的存储位置,在根据 equals方法决定其在该数组位置上的链表中的存储位置;当需要取出一个

Entry 时,也会根据hash算法找到其在数组中的存储位置,再根据equals方法从该位置上的链表中取出该Entry。



HashSet


HashSet实现Set接口,由哈希表(实际上是一个HashMap实例)支持。它不保证set 的迭代顺序;特别是它不保证

该顺序恒久不变。此类允许使用null元素。

HashSet中不允许有重复元素,这是因为HashSet是基于HashMap实现的,HashSet中的元素都存放在HashMap的key

上面,而value中的值都是统一的一个private static final Object PRESENT = new Object();。

HashSet跟HashMap一样,都是一个存放链表的数组。


HashSet中add方法调用的是底层HashMap中的put()方法,而如果是在HashMap中调用put,首先会判断key是否存在,如果

key存在则修改value值,如果key不存在这插入这个key-value。而在set中,因为value值没有用,也就不存在修改value

值的说法,因此往HashSet中添加元素,首先判断元素(也就是key)是否存在,如果不存在这插入,如果存在着不插入,这样

HashSet中就不存在重复值。


问题总结


HashMap是不是有序的?


HashSet和Hashmap分别是Set接口和Map接口的实现类,

运用哈希算法来存取元素,也就是它们中的对象不按特定方式排序;

 


有没有有顺序的Map实现类?


TreeMap和LinkedHashMap

 

你觉得它们两个哪个的有序实现比较好?


LinkedHashMap

保存了记录的插入顺序,在用Iterator遍历LinkedHashMap时,先得到的记录肯定是先插入的.

也可以在构造时用带参数,按照应用次数排序。在遍历的时候会比HashMap慢,不过有种情况例外,

当HashMap容量很大,实际数据较少时,遍历起来可能会比LinkedHashMap慢,因为LinkedHashMap

的遍历速度只和实际数据有关,和容量无关,而HashMap的遍历速度和他的容量有关。
 

TreeMap

s实现SortMap接口,能够把它保存的记录根据键排序,默认是按键值的升序排序,也可以指定排序的比较器,

当用Iterator 遍历TreeMap时,得到的记录是排过序的。TreeMap取出来的是排序后的键值对。但如果您要

按自然顺序或自定义顺序遍历键,那么TreeMap会更好。
 

LinkedHashMap是HashMap的一个子类,如果需要输出的顺序和输入的相同,那么用LinkedHashMap可以实现,

它还可以按读取顺序来排列,像连接池中可以应用。

你可能感兴趣的:(Java数据结构)