JAVA集合之ArrayList、 LinkList、 HashMap

ArrayList

看ArrayList先看一下他的名字,Array和List拼成的

  • Array
    Array就是数组的意思,是基于索引(index)的数据结构,底层是一块连续的内存空间,它使用索引在数组中搜索和读取数据是很快的。Array获取数据的时间复杂度是O(1),但是要删除数据却是开销很大,因为这需要重排数组中的所有数据, (因为删除数据以后, 需要把后面所有的数据前移),这也是ArrayList的问题
  • List
    List—是一个有序的集合,可以包含重复的元素,提供了按索引访问的方式,它继承自Collection。List有两个重要的实现类:ArrayList和LinkedList
    image.png
  • ArrayList
    可以看出ArrayList底层是基于数组Array的方式实现的,他和数组不同之处是大小动态增加,这就决定了他查找起来很快,但是增删就比较慢,除非直接追加到队尾,否则就要把数据重排(通过arraycopy实现的重排)。需要注意的是ArrayList是线程不安全的


LinkList

LinkList看一下他的名字,Link和List拼成的,List上边说了是JAVA中的集合,我们看下Link

  • Link
    链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针连接次序实现的。每一个链表都包含多个节点,节点又包含两个部分,一个是数据域(储存节点含有的信息),一个是引用域(储存下一个节点或者上一个节点的地址)。
    一个节点类,其中节点类包含两个部分,第一个是数据域(你到时候要往节点里面储存的信息),第二个是引用域(相当于指针,单向链表有一个指针,指向下一个节点;双向链表有两个指针,分别指向下一个和上一个节点)。
    链表的特性就是查询慢一些(比较数组),但是增删会特别快,指定节点断开,插入重连即可完成增加。
  //单向链表
public class Node {
    public Object data;
    public Node next;

    public Node(Object e){
        this.data = e;
    }
}
//双向链表
public class Node {
    public Object e;
    public Node next;
    public Node pre;
    public Node(){

    }
    public Node(Object e){
        this.e = e;
        next = null;
        pre = null;
    }
}
image.png

看下数组和链表的对比


image.png
  • LinkList
    LinkList以双向链表实现,链表无容量限制,但双向链表本身使用了更多空间,每插入一个元素都要构造一个额外的Node对象,也需要额外的链表指针操作。在添加和删除元素时具有比ArrayList更好的性能.但在get与set方面弱于ArrayList.当然,这些对比都是指数据量很大或者操作很频繁。允许元素为null,线程不安全。
HashMap

HashMap是结合了数组和链表的一种实现方式,new的时候会初始化一个数组,table = new Entry[capacity](这个容量capacity需要注意,根据源码里的roundUpToPowerOf2方法,最好为2的次幂); 创建一个Entry数组,也就是下面的table ,这个Entry结构就是static的包含key value 还有一个next的指针,指向下一个元素的引用,也就构成了链表。线程不安全,HashTable线程安全性能低(全锁),ConcurrentHashMap性能安全比前者高效(分段锁,链表或红黑树)

public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);

    // Find a power of 2 >= initialCapacity
    int capacity = 1;
    while (capacity < initialCapacity)
        capacity <<= 1;

    this.loadFactor = loadFactor;
    threshold = (int)Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
    table = new Entry[capacity];
    useAltHashing = sun.misc.VM.isBooted() &&
            (capacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD);
    init();
}

数组中存储的每个元素Entry是key-value模式的

static class Entry implements Map.Entry {
    final K key;
    V value;
    Entry next;
    final int hash;
    ……
}

看下put方法,会根据元素对应key的hash值(主要看后四位)去计算下标,然后根据不同下标放入数组中,需要注意的是当hash值计算的下标相同的时候,如果key相同,则替换当前位置的值,如果key不同,则追加到当前角标元素对应的头部,此时这两个元素以链表形式存储。为了避免hash冲突,HashMap的默认长度为16(length-1二进制为1111),其作用是相当于以16取模,能均匀分散到每个bucket中,避免出现单链表(即所有远程都追加到一个角标上)情况。解决hash冲突的方式一般分为链地址法,再Hash法,开放地址发,建立公共溢出区(hashmap 的解决方式为链地址法或拉链法)
装载因子0.75,当超过(默认长度)16*0.75这个阈值后会出发扩容

public V put(K key, V value) {
    //其允许存放null的key和null的value,当其key为null时,调用putForNullKey方法,放入到table[0]的这个位置
    if (key == null)
        return putForNullKey(value);
    //通过调用hash方法对key进行哈希,得到哈希之后的数值。该方法实现可以通过看源码,其目的是为了尽可能的让键值对可以分不到不同的桶中
    int hash = hash(key);
    //根据上一步骤中求出的hash得到在数组中是索引i
    int i = indexFor(hash, table.length);
    //如果i处的Entry不为null,则通过其next指针不断遍历e元素的下一个元素。
    for (Entry e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    addEntry(hash, key, value, i);
    return null;
}

Java8中的Hashmap底层结构有一定的变化,还是使用的数组,但是数组的对象以前是Entry对,现在换成了Node对象(可以理解是Entry对,结构一样,存储时也会存key/value键值对、前一个和后一个Node的地址),以前所有的Entry向下延伸都是链表,Java8变成链表和红黑树的组合,数据少量存入的时候优先还是链表,当链表长度大于8,且总数据量大于64的时候,链表就会转化成红黑树,所以你会看到Java8的Hashmap的数据存储是链表+红黑树的组合,如果数据量小于64则只有链表(此时如果某一下标链表超过8,会触发扩容,不会树化),如果数据量大于64,且某一个数组下标数据量大于8,那么该处即为红黑树。所以触发树化条件是两个:大于64且某一个数组下标链表数据量大于8
链表转红黑树是链表长度达到阈值是8,红黑树转链表阈值为6(反树化)。因为经过计算,在hash函数设计合理的情况下,发生hash碰撞8次的几率为百万分之6,用概率证明。因为8够用了,至于为什么转回来是6,中间有个差值7可以防止链表和树之间频繁的转换,因为如果hash碰撞次数在8附近徘徊,会一直发生链表和红黑树的互相转化,为了预防这种情况的发生,设置为6

image.png

红黑树的节点查找的优先级从O(n)变成了O(logn),如下图寻找48,只需要4此即可查到,比链表高效。


image.png

你可能感兴趣的:(JAVA集合之ArrayList、 LinkList、 HashMap)