LinkedHashMap为何有序？详解源码及底层原理

更多文章请关注公号（ID：CodeReading）

简介

在开发中最常用到的Map就是HashMap，多线程并发的情况并不多。有时我们需要保证Map的插入顺序和访问顺序一致，这时可能需要用到LinkedHashMap。它是HashMap的子类，大部分特征与HashMap一致，比如非线程安全，默认容量是16，扩展因子是0.75，容量必须是2的幂次方等。这些特征在 HashMap的工作原理一文中有详细介绍，本文不做赘述。本文主要通过讲解LinkedHashMap重新和新增的方法，来揭秘LinkedHashMap的特点。如无特殊说明，源码出至jdk1.8。

何谓有序

LinkedHashMap的有序其实包括2种

插入顺序：很好理解，就是按插入顺序储存。
访问顺序，下文详解。

源码解析

我们以不带参的构造函数作为研究源码的入口。

 /**
   * Constructs an empty insertion-ordered LinkedHashMap instance
   * with the default initial capacity (16) and load factor (0.75).
   * 没有参数的构造方法，
   * 调用父类构造函数，初始容量16，负载因子0.75
   * 按插入顺序排序
   */
  public LinkedHashMap() {
      super();
      //按插入顺序排序
      accessOrder = false;
  }

 /**
   * The iteration ordering method for this linked hash map: true
   * for access-order, false for insertion-order.
   * 排序方式，true：访问顺序；false：插入顺序，默认
   * @serial
   */
  final boolean accessOrder;

put方法，LinkedHashMap并没有重写put() ，但是提供了put方法调用的newNode(int hash, K key, V value, Node e), 我们来看一下相关方法。

   /**
     * HashMap.Node subclass for normal LinkedHashMap entries.
     * 有自己的Entry，继承HashMap.Node，新增before和after。其实就是双向链表
     */
    static class Entry extends HashMap.Node {
        Entry before, after;
        Entry(int hash, K key, V value, Node next) {
            super(hash, key, value, next);
        }
    }

    /**
     * The head (eldest) of the doubly linked list.
     * 双向链表的头部
     */
    transient LinkedHashMap.Entry head;

    /**
     * The tail (youngest) of the doubly linked list.
     * 双向链表的尾部
     */
    transient LinkedHashMap.Entry tail;
 
    /**
    * putVal调用
    */
    Node newNode(int hash, K key, V value, Node e) {
        LinkedHashMap.Entry p =
            new LinkedHashMap.Entry(hash, key, value, e);
        linkNodeLast(p);
        return p;
    }
  
    /**
    * link at the end of list
    */ 
    private void linkNodeLast(LinkedHashMap.Entry p) {
        LinkedHashMap.Entry last = tail;
        tail = p;
        if (last == null)
            head = p;
        else {
            p.before = last;
            last.after = p;
        }
    }

源码比较简单，关键部分也加了注释，有不明白的同学可以留言。从源码可以得知，LinkedHashMap的数据结构就是Linked + HashMap，即双向链表+HashMap（数组+链表+红黑树）。保证LinkedHashMap顺序的是Linked，其他和key相关的操作还是和HashMap相关。

遍历，既然是Linked保证了元素的顺序，那遍历也一定是和Linked相关，这里注意，不管是Linked，还是HashMap，存的都是元素的内存地址，真正对象还是在内存中。看一下LinkedHashMap遍历的过程。

public static void main(String[] args) {

        LinkedHashMap linkedHashMap = new LinkedHashMap();

        linkedHashMap.put("key1", "v1");
        linkedHashMap.put("key2", "v2");
        linkedHashMap.put("key3", "v3");

        System.out.println("插入顺序");

        Set> set = linkedHashMap.entrySet();
        Iterator> iterator = set.iterator();
        while(iterator.hasNext()) {
            Map.Entry entry = iterator.next();
            String key = (String) entry.getKey();
            String value = (String) entry.getValue();
            System.out.println("key:" + key + ",value:" + value);
        }

    }
 //LinkedHashMap 类
 1. 获取到Set，返回new LinkedEntrySet()
   public Set> entrySet() {
        Set> es;
        return (es = entrySet) == null ? (entrySet = new LinkedEntrySet()) : es;
   }
 2. 调用LinkedEntrySet.iterator(),返回LinkedEntryIterator
  final class LinkedEntrySet extends AbstractSet> {
        public final int size()                 { return size; }
        public final void clear()               { LinkedHashMap.this.clear(); }
        public final Iterator> iterator() {
            return new LinkedEntryIterator();
        }
        /**省略无关代码....**/
    }
 3. LinkedEntryIterator.next(),调用父类LinkedHashIterator.nextNode()返回LinkedHashMap.Entry
  final class LinkedEntryIterator extends LinkedHashIterator
        implements Iterator> {
        public final Map.Entry next() { return nextNode(); }
  }
  // Iterators
  abstract class LinkedHashIterator {
        LinkedHashMap.Entry next;
        LinkedHashMap.Entry current;
        int expectedModCount;

        LinkedHashIterator() {
            next = head;
            expectedModCount = modCount;
            current = null;
        }

        public final boolean hasNext() {
            return next != null;
        }

        final LinkedHashMap.Entry nextNode() {
            //第一次遍历next=head，在构造方法中提现
            LinkedHashMap.Entry e = next;
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            if (e == null)
                throw new NoSuchElementException();
            current = e;
            //next指向下一节点
            next = e.after;
            return e;
        }
    }

源码中可以看出，遍历Linked就是从head属性开始，一致next()，直到next==null。

按访问顺序排序是什么鬼？访问顺序也就是get(key)方法的执行顺序。我们先搞个测试用例，把accessOrder设置成true，看输出结果。

  测试调用LinkedHashMap的构造函数是：
  public LinkedHashMap(int initialCapacity,
                         float loadFactor,
                         boolean accessOrder)
    
    
  public static void main(String[] args) {
        accessOrderKey("key1");
        accessOrderKey("key2");
        accessOrderKey("key3");
  }

  private static void accessOrderKey(String key) {

        LinkedHashMap linkedHashMap = new LinkedHashMap(16, 0.75f, true);
        linkedHashMap.put("key1", "v1");
        linkedHashMap.put("key2", "v2");
        linkedHashMap.put("key3", "v3");
        linkedHashMap.put("key4", "v4");
        linkedHashMap.put("key5", "v5");
        
      linkedHashMap.get(key);
        System.out.println("访问" + key + "后的顺序：");
        Set> set = linkedHashMap.entrySet();
        Iterator> iterator = set.iterator();
        while (iterator.hasNext()) {
            Map.Entry entry = iterator.next();
            System.out.println("key:" + entry.getKey());
        }
    }
//执行结果
访问key1后的顺序：
key:key2
key:key3
key:key4
key:key5
key:key1
访问key2后的顺序：
key:key1
key:key3
key:key4
key:key5
key:key2
访问key3后的顺序：
key:key1
key:key2
key:key4
key:key5
key:key3

从测试的结果来看，貌似刚被访问完的元素放在linked的尾端，再看get()搞了什么鬼？

public V get(Object key) {
        Node e;
        if ((e = getNode(hash(key), key)) == null)
            return null;
        //accessOrder = true,调整Linked顺序
        if (accessOrder)
            afterNodeAccess(e);
        return e.value;
}
// move node to last
void afterNodeAccess(Node e) {
        LinkedHashMap.Entry last;
        //accessOrder=true e不是最末尾
        if (accessOrder && (last = tail) != e) {
            //当e.key == key1时,下面应key1代表其对应的node。
            LinkedHashMap.Entry p =(LinkedHashMap.Entry)e, //key1
            b = p.before, //null
            a = p.after; //key2
            p.after = null;
            if (b == null)//条件成立，head=a，也就是head=key2
                head = a;
            else
                b.after = a;
          
            if (a != null)//a.before = null
                a.before = b;
            else
                last = b;
          
            if (last == null)
                head = p;
            else {
                //此时last=key5，
                //p.before=last=key5，key5.after=p 双向链表
                p.before = last;
                last.after = p;
            }
            //p赋值给链表末尾，也就是把key1放到了链表的末尾
            tail = p;
            ++modCount;
        }
    }

果然和我们预料的一样，最新访问的元素放到链表的最末端。afterNodeAccess()的注释也说的很清楚：move node to last。这时注释的重要性就体现出来了。

总结

我们从LinkedHashMap源码的角度分析了LinkedHashMap的结构与原理，在此基础上也分析出它的有序性和如何做到有序性。它的结构正如其名Linked+HashMap，Linked负责顺序，HashMap复制检索。

LinkedHashMap的2种顺序说明

Linked按插入顺序储存：源码中当accessOrder = false时。
Linked按访问顺序储存：即最被访问的元素放到Linked的尾端，其他元素顺序不变。源码中当accessOrder = true。

什么是学习：每天进步一点点。哪怕是只多知道了LinkedHashMap如何实现排序。

本人水平一般，能力有限，谬误之处还请大家指出来。原创不易，记得点赞哦。

LinkedHashMap为何有序？详解源码及底层原理

简介

何谓有序

源码解析

总结

你可能感兴趣的:(LinkedHashMap为何有序？详解源码及底层原理)