List接口下的集合源码分析——LinkedList

源码版本JDK1.8

今天带来的是List的另一种实现——LinkedList,这是一种基于双向链表实现的列表。接下来让我们通过源码来分析一下它吧。

关于源码中的一些小改动

在JDK1.6及之前,LinkedList底层是一个双向循环链表,容器中的元素都是静态内部类Entry的对象,列表中必有一个空头结点;
在JDK1.7及之后,LinkedList底层是一个双向非循环链表,容器中的元素都是静态内部类Node的对象。
基于这些小差别,笔者分享下自己的见解:

  • 使用非循环链表后,可以少一个空的头结点,在头尾加入元素时可以少一些引用操作(对于循环链表来说,由于首尾相连,还是需要处理两头的前驱和后继引用。而非循环链表只需要处理一边first.previous/last.next,所以理论上非循环链表更高效。恰恰在两头(链头/链尾) 操作是最普遍的)
  • 对于Entry改变成Node,本质上是没有差别的。可能大家对Entry的印象是Map中实现的一个内部类,用来存储键值对,而在LinkedList中是要存储,不便于凸显Entry存储键值对的特性吧,容易造成混淆。(这只是个人的猜测,若有不同见解可以交流)
    补充:不论是Entry还是Node,都是外部类LinkedList实现的一个静态内部类,这么做是把一个类相关的类型放到内部,提高类的高内聚,而且通常情况下只有该外部类会调用其内部类,如果把Entry或者Node放到外部,明显就提高了耦合性,对于其他集合类型的内部实现来说都是不利的。
    再有一个,内部类会随着外部类的加载而产生。
    传送门:关于静态内部类
    List接口下的集合源码分析——LinkedList_第1张图片
    双向循环链表结构

    List接口下的集合源码分析——LinkedList_第2张图片
    双向非循环链表结构

一、LinkedList概述

在源码中对LinkedList是这么描述的:

  • 双向链表实现 ListDeque接口。实现所有可选的列表操作,并允许所有元素null。
  • 所有操作的执行方式与双向链表都是一样的。索引到列表中的操作将从开始或结束遍历列表,无论哪个更接近指定的索引。
  • 此实现未同步。
    *此类的 iterator和listIterator方法返回的迭代器:如果在创建迭代器之后的任何时间对结构进行修改,除了通过迭代器自己的remove}或{@code add方法,迭代器将抛出一个ConcurrentModificationException。因此,面对并发修改,迭代器快速而干净地失败,而不是在将来的未确定时间冒任意的,非确定性行为的风险。

二、LinkedList的继承、实现关系

public class LinkedList
    extends AbstractSequentialList
    implements List, Deque, Cloneable, java.io.Serializable
  • 继承自AbstractSequentialList,而AbstractSequentialList父类为AbstractListAbstractSequentialList 实现了get(int index)、set(int index, E element)、add(int index, E element) 和 remove(int index)这些骨干性函数。
  • 实现List接口,能对它进行队列操作。
  • 实现Deque接口,而DequeQueue的子接口。Queue是一种队列形式,而Deque则是双向队列,它支持从两个端点方向检索和插入元素,因此Deque既可以支持LIFO形式也可以支持LIFO形式。Deque接口是一种比StackVector更为丰富的抽象数据形式,因为它同时实现了以上两者。传送门:Deque双端队列
  • 实现了Cloneable接口,即覆盖了函数clone(),能克隆。
  • 实现java.io.Serializable接口,这意味着LinkedList支持序列化,能通过序列化去传输
    List接口下的集合源码分析——LinkedList_第3张图片
    继承实现关系.jpg

三、LinkedList属性声明及构造函数

transient int size = 0;
transient Node first;//指向第一个节点的指针
transient Node last;//指向最后一个节点的指针
//构造一个空列表
public LinkedList() {
    }
//按照集合的迭代器返回的顺序构造包含指定集合的​​元素的列表
public LinkedList(Collection c) {
        this();
        addAll(c);
    }

—addAll()方法

public boolean addAll(Collection c) {
        return addAll(size, c);
    }

public boolean addAll(int index, Collection c) {
        checkPositionIndex(index);

        Object[] a = c.toArray();
        int numNew = a.length;
        if (numNew == 0)
            return false;

        Node pred, succ;
        if (index == size) {
            succ = null;
            pred = last;
        } else {
            succ = node(index);
            pred = succ.prev;
        }

        for (Object o : a) {
            @SuppressWarnings("unchecked") E e = (E) o;
            Node newNode = new Node<>(pred, e, null);
            if (pred == null)
                first = newNode;
            else
                pred.next = newNode;
            pred = newNode;
        }

        if (succ == null) {
            last = pred;
        } else {
            pred.next = succ;
            succ.prev = pred;
        }

        size += numNew;
        modCount++;
        return true;
    }

带Collection值的构造方法的执行逻辑:
1)使用this()调用默认的无参构造函数;
2)调用addAll()方法,传入当前的节点个数size,此时size为0,并将collection对象传递进去;
3)检查index有没有数组越界的嫌疑;
4)将collection转换成数组对象a;
5)循环遍历a数组,然后将a数组里面的元素创建成拥有前后连接的节点,然后一个个按照顺序连起来;
6)修改当前的节点个数size的值;
7)操作次数modCount自增1。

四、LinkedList的方法

(一)添加元素

—在头部添加元素

//在此列表的开头插入指定的元素
public void addFirst(E e) {
        linkFirst(e);
    }

private void linkFirst(E e) {
        final Node f = first;
        final Node newNode = new Node<>(null, e, f);
        first = newNode;
        if (f == null)
            last = newNode;
        else
            f.prev = newNode;
        size++;
        modCount++;
    }

linkFirst(E e)是一个私有方法,所以无法在外部程序中调用(当然,这是一般情况,你可以通过反射上面的还是能调用到的)。
linkFirst(E e)首先构造一个变量结点f = first,再 new一个newNode(为要添加进来的节点),其前驱引用previous为null,后继引用为f,再另头结点指向新的节点newNode。
判断,如果f == null,即列表为空,则头尾节点指向同一个节点newNode;如果不为空,原来头结点的前驱引用指向新节点newNode。
—在尾部添加元素

//将指定的元素追加到此列表的末尾
public void addLast(E e) {
        linkLast(e);
    }
void linkLast(E e) {
        final Node l = last;
        final Node newNode = new Node<>(l, e, null);
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }

原理与在头部添加元素类似,可参照上面进行解读。
—在任意位置添加元素

// 在此列表中指定的位置插入指定的元素。将当前在该位置的元素(如果有)和任何后续元素向右移(将一个添加到它们的索引)
public void add(int index, E element) {
        checkPositionIndex(index);
        if (index == size)
            linkLast(element);
        else
            linkBefore(element, node(index));
    }
//在非空节点succ之前插入元素e
void linkBefore(E e, Node succ) {
        // assert succ != null;
        final Node pred = succ.prev;
        final Node newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        size++;
        modCount++;
    }

从源码中看出,若索引index==size,便直接在尾部添加元素;若不是,则调用linkBefore(E e, Node succ)函数。
linkBefore(E e, Node succ)首先构造一个变量结点pred = succ.prev,再 new一个newNode(为要添加进来的节点),其前驱引用previous为pred ,后继引用为succ,再另结点succ的前驱指向新的节点newNode。
判断,如果pred == null,即列表为空,则头尾节点指向同一个节点newNode;如果不为空,原来pred结点的后继引用指向新节点newNode。

(二)查看元素

查看元素使用get方法。getFirst()、getLast()分别返回头结点和尾节点。下面主要看看返回指定索引的方法get(int index)。

//返回此列表中指定位置的元素
public E get(int index) {
        checkElementIndex(index);
        return node(index).item;
    }
private void checkElementIndex(int index) {
        if (!isElementIndex(index))
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
 private boolean isElementIndex(int index) {
        return index >= 0 && index < size;
    }
//返回指定元素索引处的(非空)节点
Node node(int index) {
        // assert isElementIndex(index);
        if (index < (size >> 1)) {
            Node x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {
            Node x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

get(int index)首先判断给定索引是否存在,若存在执行node(index).item;其中item为元素的内容。
node(int index)方法返回的是一个节点Node,代码中使用了类似二分法的查找方法来遍历元素。若index < (size >> 1),即索引在前半部分,则从前向后依次查找;否则索引就在后半部分,从后向前依次查找。
此段代码能够有效的提高遍历效率,也反映了双向链表的优点——双向链表增加了一点点的空间消耗(每个Node里面还要维护它的前置Node的引用),同时也增加了一定的编程复杂度,却大大提升了遍历效率(体现在可以双向遍历)。

(三)删除元素

removeFirst(),removeLast()分别用来删除头结点和尾结点,public E remove()方法删除的也是列表的第一个元素,但是列表为空时使用不会抛出异常(removeFirst()会抛出异常)。
ArrayList一样,LinkedList支持按元素删除和按下标删除,下面我们主要介绍public E remove(int index),public boolean remove(Object o)

//删除此列表中指定位置的元素。将任何后续元素向左移(从它们的索引中减去一个)。返回从列表中删除的元素
public E remove(int index) {
        checkElementIndex(index);
        return unlink(node(index));
    }
//取消链接非空节点x
E unlink(Node x) {
        // assert x != null;
        final E element = x.item;
        final Node next = x.next;
        final Node prev = x.prev;
        if (prev == null) {
            first = next;
        } else {
            prev.next = next;
            x.prev = null;
        }
        if (next == null) {
            last = prev;
        } else {
            next.prev = prev;
            x.next = null;
        }
        x.item = null;
        size--;
        modCount++;
        return element;
    }

按索引删除remove(int index):
首先通过遍历node(index)得到指定索引的节点,后通过unlink()方法进行删除。
(1)x.prev = null;//前驱设置为null
(2)x.next = null;//后继设置为null
(3)x.item = null;//内容设置为null
至此节点x为空节点,最后交给虚拟机gc完成回收,删除操作结束。

//从列表中删除指定元素的第一次出现(如果存在)。如果此列表不包含元素,则不会更改。
public boolean remove(Object o) {
        if (o == null) {
            for (Node x = first; x != null; x = x.next) {
                if (x.item == null) {
                    unlink(x);
                    return true;
                }
            }
        } else {
            for (Node x = first; x != null; x = x.next) {
                if (o.equals(x.item)) {
                    unlink(x);
                    return true;
                }
            }
        }
        return false;
    }

按元素删除内容remove(Object o):
不论元素内容为空还是不为空,均通过节点的遍历,依次查找,若找到与指定内容一致的节点则删除并返回。
注意:该方法从列表中删除第一次出现的指定元素。


LinkedList的方法比较简单,没有扩容环节,翻阅源码基本能懂,不存在什么大问题。由于LinkedList实现了Deque接口,该接口比List提供了更多的方法,包括 offer(),peek(),poll()等。

//检索,但不删除此列表的头(第一个元素)
public E peek() {
        final Node f = first;
        return (f == null) ? null : f.item;
    }
//检索并删除此列表的头(第一个元素)
public E poll() {
        final Node f = first;
        return (f == null) ? null : unlinkFirst(f);
    }
//检索但不删除此列表的第一个元素,如果此列表为空,则返回null
public E peekFirst() {
        final Node f = first;
        return (f == null) ? null : f.item;
     }
//检索但不删除此列表的最后一个元素,如果此列表为空,则返回null
public E peekLast() {
        final Node l = last;
        return (l == null) ? null : l.item;
    }
//检索并删除此列表的第一个元素,如果此列表为空,则返回null
public E pollFirst() {
        final Node f = first;
        return (f == null) ? null : unlinkFirst(f);
    }
//检索并删除此列表的最后一个元素,如果此列表为空,则返回null
public E pollLast() {
        final Node l = last;
        return (l == null) ? null : unlinkLast(l);
    }
//将指定的元素添加为此列表的尾部(最后一个元素)
public boolean offer(E e) {
        return add(e);
    }
//在此列表的前面插入指定的元素
public boolean offerFirst(E e) {
        addFirst(e);
        return true;
    }
//在此列表的结尾插入指定的元素
public boolean offerLast(E e) {
        addLast(e);
        return true;
    }
//将元素推送到此列表所表示的堆栈。换句话说,将元素插入此列表的前面,此方法等效于addFirst
public void push(E e) {
        addFirst(e);
    }
//此列表所表示的堆栈中弹出一个元素。换句话说,删除并返回此列表的第一个元素,此方法等效于removeFirst()
public E pop() {
        return removeFirst();
    }

五、ArrayListLinkedList的区别

(一)从插入、删除元素分析

对于两者的插入、删除操作不能片面的盖棺定论,应视情况而定,下面以插入操作做分析(删除操作的分析类似)
顺序插入:

  • ArrayList在不扩容的情况下顺序插入速度较快,因为在构造ArrayList之前已经分配好空间,顺序插入元素只是往指定内存空间补个元素;在需要扩容的情况下,ArrayList的顺序插入则显得比较慢,因为底层需要执行copy操作,既耗时又耗空间。
  • LinkedList顺序添加元素会教慢点,因为每添加一个元素都要新new一个节点对象,并且还有执行其他的引用赋值操作。

中间插入:

  • ArrayList在执行中间插入的过程中耗时的是索引后面的元素copy移动,若果插入的位置越靠前则越慢,反之越快。
  • LinkedList在任何位置插入的效率基本上是一致的,耗时的部分主要是定位索引(寻址),赋值部分只需修改引用。

综合以上所述:
(1)LinkedList做插入、删除的时候,慢在寻址,快在只需要改变前后Node的引用地址。
(2)ArrayList做插入、删除的时候,慢在数组元素的批量copy,快在寻址。

所以,如果待插入、删除的元素是在数据结构的前半段尤其是非常靠前的位置的时候,LinkedList的效率将大大快过ArrayList,因为ArrayList将批量copy大量的元素;越往后,对于LinkedList来说,因为它是双向链表,所以在第2个元素后面插入一个数据和在倒数第2个元素后面插入一个元素在效率上基本没有差别,但是ArrayList由于要批量copy的元素越来越少,操作速度必然追上乃至超过LinkedList

(二)从遍历列表分析

未完待续。。。

你可能感兴趣的:(List接口下的集合源码分析——LinkedList)