SELECT_BIN

Java集合框架整理

声明：此系列文章整理自陈树义；

集合系列开篇：为什么要学集合？

集合可以说是学习 Java 中最重要的一块知识点了，无论做任何业务系统，集合总是最为基础的那块 API。我第一次接触集合，是在我大三的时候，那时候去面试，面试官问我：你了解过集合吗？可惜那时候没什么项目经验，所以基本没有了解过，因此也错失了机会。

到了现在，我已经工作了5年了，也做过了大大小小十几个项目。这些项目中有简单的 SSH 项目，也有分布式高并发的复杂项目。无论在哪个项目中，关于集合的时候是必不可少的。但我现在慢慢回顾过去做的项目，我发现自己使用到的集合还是比较少，基本上只有：ArrayList、HashSet、HashMap 这几个。

但当我开始深入去了解 JDK 集合的整个体系时，我发现之前的我了解得确实非常浅显。例如关于 List 的实现有 ArrayList、LinkedList、Vector、Stack 这四种实现，但我们很多时候只是直接使用 ArrayList，而不是根据场景去选择。

1.学习集合源码，能够让我们使用得更加准确。

当我们深入学习了源码之后，我们就能够了解其特性，从而能够根据我们的使用场景去做出更好的选择，从而让我们的代码运行效率更高。

我们举一个最简单的例子 —— ArrayList 和 LinkedList。它们两者底层采用了完全不同的实现方式，ArrayList 使用数组实现，而 LinkedList 则使用链表实现。这使得 ArrayList 的读取效率高，而 LinkedList 的读取效率低。但因为 LinkedList 采用链表实现，所以其增加和删除比较方便，而 ArrayList 则比较麻烦。所以 ArrayList 比较适合用于读场合较多的情况，而 LinkedList 比较适合用于增加、删除较多的场景。

我们来看另外一个例子 —— HashMap 和 TreeMap。乍看之下，他们都是 Map 集合的实现，但是它们内部有着截然不同的实现。HashMap 是 Map 接口的哈希实现，其内部使用了链表和红黑树实现。而 TreeMap 是 Map 接口的有序实现，其内部使用了红黑树实现。所以 HashMap 一般用来存储 key、value 的实现，而 TreeMap 常用存储需要排序的元素。

除了我们举的这两个例子之外，还有许多这样的例子，比如：HashMap 与 LinkedHashMap 的区别，HashMap 与 WeakHashMap 的区别，LinkedList 与 ArrayDeque 的区别。

2.学习集合源码，让我们学习经典的设计方式。

在集合的整个架构设计中，其类继承体系非常简单，但是却很经典。例如：Collection 接口设计了集合通用的操作，每个集合类型都有对应的接口（List、Set、Map），每个集合类型都有对应的抽象实现（AbstractList、AbstractSet、AbstractMap）等。

当我们阅读这些源码的时候，这种设计方式都会潜移默化地影响我们。当我们之后自己设计一个框架的时候，我们就会不知不觉地用上去。所有的创新都是从模仿开始的，所以阅读优秀的集合源码很重要。

3.帮助通过面试，获得更高的薪酬。

现在关于集合的原理是 Java 工程师面试的家常菜，几乎每一个企业的面试都会问到。如果你连这块东西都没搞清楚，那么你就不需要聊其他了，直接被干掉。而如果你能将整个 Java 集合体系清晰地说出去，并且举一反三地对比，那么你就比其他人优秀了。

4.学习经典的数据结构。

还记得大学在学习数据结构的时候，我们都是从理论上去记忆。但是当我看完集合源码之后，我忽然发现——JDK集合源码简直就是数据结构的最佳实践呀！

数据结构中最为基础的几个结构为：顺序表、单链表、双向链表、队列、栈、二叉堆、红黑树、哈希表。这些所有的实现都能在 JDK 集合的实现中找到。例如：ArrayList 就是顺序表的实现，LinkedList 就是双向链表的实现，Stack 就是栈的实现，HashMap 就是哈希表的实现，TreeMap 就是红黑树的实现，PriorityQueue 就是二叉堆的实现。

5.所有技术的基础

集合源码可以说是 JDK 所有源码中最为简单的一块了，而且也是其他所有源码的基础。例如线程池的源码中也大量使用了阻塞队列，如果你连集合源码都搞不懂，那么线程池的源码你也肯定看不懂的。而如果线程池源码看不懂，那么你 netty 的源码也看不懂的。netty 源码看不懂，那么 dubbo 的源码也是看不懂的。

看明白了么？这些技术都是一换扣着一换的。如果你想要后续学习更加快速，那么你就必须把最基础的东西学明白了。如果连最基础的东西都没学明白，就直接去学其他更复杂的东西，最后只会越来越难，最终逃脱不了放弃的命运。

读到了这里，我相信你也对集合的重要性有了不一样的认识。那么接下来一段时间，就让我和你一起来深入学学集合源码吧。如果觉得读了有用，那么请给我一个赞吧。你们的赞是我继续写下去的动力！

集合系列（一）：集合框架概述

Java 集合是 Java API 用得最频繁的一类，了解其及继承结构，掌握其实现原理非常有必要。总的来说，Java 容器可以划分为 4 个部分：

List 集合
Set 集合
Queue 集合
Map 集合

除了上面 4 种集合之外，还有一个专门的工具类：

工具类（Iterator 迭代器、Enumeration 枚举类、Arrays 和 Collections）

在开始聊具体的集合体系之前，我想先介绍一下 Collection 框架的基本类结构。因为无论是 List 集合、Set 集合还是 Map 集合都以这个为基础。

首先，最顶层的是 Collection 接口。

可以看到 Collection 接口定义了最最基本的集合操作，例如：判断集合大小、判断集合是否为空等。List、Set、Queue 都继承了该接口。

接着，AbstractCollection 也继承了 Collection 接口。

从这个类名可以看出，其是一个抽象类。AbstractCollection 对 Collection 接口中一些通用的方法做了实现。例如：判断是否为空的方法、判断是否包含某个元素的方法等。

通过继承 AbstractCollection 接口，可以少写许多不必要的代码，这是代码抽象设计最常用的思想。AbstractCollection 是最为基础的类，其他所有集合的实现都继承了这个抽象类。

List 集合

List 集合存储的是有序的数据集合，其数据结构特点是：读取快，修改慢，适合于读取多、写入修改少的场景。List 集合的类继承结构如下：

我们可以看到除了 Collection 和 AbstractCollection 之外，我们还有 List 接口和 AbstractList 抽象类。其中 List 接口是 List 集合的最上层抽象，其继承了 Collection 接口，表示其实一个集合。而 AbstractList 则是 List 集合的抽象实现，实现了许多公用的操作。

整个 List 集合的实现可以分为红、黄、绿三大块。其中红色部分是 List 集合的列表实现，绿色部分是 List 结合的链表实现，而黄色部分则是 List 集合列表实现的线程安全版本。

列表实现

ArrayList 类是很常用的 List 实现，其底层是用数组实现的。其读取元素的时间复杂度是 O（1），修改写入元素的时间复杂度是 O（N）。我们将会在下面的章节中详细介绍，这里不做深入。

列表安全实现

Vector 类也是很常用的 List 实现，其数据结构与 ArrayList 非常类似。但其与 ArrayList 的一个最大的不同是：Vector 是线程安全的，而 ArrayList 则不是线程安全的。

Stack 类则是在 Vector 的基础上，又实现了一个双向队列。所以其除了是线程安全的之外，其还是一个先进后出的 List 实现。

最后我们总结一下，List 集合最为关键的几个实现类是：

ArrayList：列表集合经典实现。
Vector：列表集合经典实现，线程安全，与 ArrayList 对应。
Stack：栈结构的经典实现，先进后出的数据结构。继承了 Vector，线程安全。
LinkedList：链表结构的经典实现。

链表实现

LinkedList 是一个经典的链表实现。LinkedList 继承了 AbstractSequentialList 抽象类。AbstractSequentialList 抽象类从字面上理解是抽象连续列表。这里的重点是 sequential 这个词，表示其数据结构是连续的（链表）。从其源码注释也可以看出这个意思。

This class provides a skeletal implementation of the List interface to minimize the effort required to implement this interface backed by a "sequential access" data store (such as a linked list). （意译）如果你想要实现一个连续存储（链表）的 List，那么这个抽象类可以让你减少不少工作量。

其实从命名就可以看出，AbstractSequentialList 其实是连续列表（链表）的一个抽象实现。AbstractSequentialList 抽象类做了许多工作，使得后续的链表实现更加简单。从 AbstractSequentialList 的注释可以看到，如果要实现一个链表，那么只需要实现 listIterator 方法和 size 方法就可以了。

Set 集合

Set 集合中存储的元素是不重复的，但是其存储顺序是无序的。下面是 Set 集合的类继承结构图：

与 List 集合类似，都是一个 Set 接口继承了 Collection 接口。一个 AbstractSet 抽象类实现了 Set 接口、继承了 AbstractCollection 抽象类。这部分完全和 List 相同。

Set 集合的实现可以分为两大块，一块是 Set 集合的有序实现（红色部分），另一块是 Set 集合的哈希实现（黄色部分）。

有序实现（TreeSet）

SortedSet 接口继承了 Set 接口，TreeSet 实现了 SortedSet。

我们知道 Set 集合中的元素是无序的，而 SortedSet 接口则是定义了有序 Set 集合的接口。而 TreeSet 则是 SortedSet 的具体实现。

哈希实现（HashSet、LinkedHashSet）

HashSet 是 Set 接口的经典哈希实现。但 Set 集合中的元素是无序的，为了维护 Set 集合的插入顺序，人们创造出了 LinkedHashSet。LinkedHashSet 是在 HashSet 的基础上用链表维护元素的插入顺序。

到这里我们总结一下 Set 集合的所有实现：

TreeSet：Set 集合的有序实现。
HashSet：Set 集合的哈希实现。
LinkedHashSet：Set 集合的哈希实现，维护了元素插入顺序。

Queue 集合

队列是一个特殊的线性表，其数据结构特点是先进先出。Queue 类结构体系如下图所示：

首先，Queue 接口继承了 Collection 接口。Queue 接口在拥有基本集合操作的基础上，定义了队列这种数据结构的基本操作。可以看到 offer、poll 等方法都是队列独有的操作。

接着，AbstractQueue 是对 Queue 接口的抽象实现。针对队列这种数据结构，其添加、删除元素的动作都不一样。在 AbstractQueue 抽象类里将队列的基本操作都实现了一遍。例如 AbstractQueue 中的 add 方法就和 AbstractList 中的 add 方法有着不同的实现。

如上图所示，Queue 的类结构整体可以分为黄色、红色两个部分。红色部分是 Queue 接口的有序实现，有 PriorityQueue 这个实现类。黄色部分是 Deque（双向队列）的实现，有 LinkedList 和 ArrayDeque 两个实现类。

有序实现

PriorityQueue 是 AbstractQueue 抽象类的具体实现。

PriorityQueue 表示优先级队列，其按照队列元素的大小进行重新排序。当调用 peek() 或 pool() 方法取出队列中头部的元素时，并不是取出最先进入队列的元素，而是取出队列的最小元素。

双向实现

首先，我们会看到 Deque 接口。

Deque（double ended queue）是双向队列的意思，它能在头部或尾部进行元素操作。

最后，我们看到 LinkedList 和 ArrayDeque 都是 Deque 接口的具体实现。

LinkedList 我们之前说过了，是一个链表，但它还是一个双向队列。因此 LinkedList 具有 List 和 Queue 的双重特性。ArrayDeque 是一个双向循环队列，其底层是用数组实现。更多内容，我们将在队列章节讲解。

最后我们总结 Queue 体系的几个常见实现类：

PriorityQueue：优先级队列
LinkedList：双向队列实现
ArrayDeque：双向循环队列实现

Map 集合

Map 集合与 List、Set、Queue 有较大不同，其实类似于 key/value 的数据结构。

首先，Map 接口是最顶层的接口。

与 List、Set、Queue 类似，Map 接口定义的是哈希表数据结构的操作。例如我们常用的 put、get、keySet 等。

接着，有 AbstractMap 抽象类。

和 List 等类似，AbstractMap 是 Map 接口的抽象实现。如上图所示，Map 集合的整个类结构可以分为红、黄、绿三块。

哈希实现

红色部分可以看成是 Map 的哈希实现。

AbstractMap 有具体的实现类 HashMap。

HashMap 是 AbstractMap 基于哈希算法的具体实现。

接着，LinkedHashMap 和 WeakedHashMap 继承了 HashMap。

LinkedHashMap 是 HashMap 的进一步实现，其用链表保存了插入 HashMap 中的元素顺序。WeakedHashMap 是 HashMap 的进一步实现，与 HashMap不同的是：WeakedHashMap 中的引用是弱引用，如果太久没用，则会被自动回收。

有序实现

黄色部分可以看成是 Map 集合的有序实现。

首先，SortedMap 接口继承了 Map 接口。

与 Set 一样，Map 中的元素是没有顺序的，SortedMap 就是有序 Map 的接口定义。

接着，NavigableMap 继承了 SortedMap 接口。

NavigableMap 接口定义了一些查找逻辑，方便后续实现。

最后，TreeMap 则是 NavigableMap 接口的具体实现。

其实 TreeMap 是基于红黑树的 Map 实现。

看到了这里，Map 整个类结构看完了一半。而另外一半则是以 Dictionary 为主的实现（绿色部分）。但实际上 Dictionary 是老旧的 Map 实现，现在已经废弃了。我们从源码的注释中可以看到相关的提示。

NOTE: This class is obsolete（废弃的）. New implementations should implement the Map interface, rather than extending this class. 这个类已经被废弃，新的实现应该实现 Map 接口，而不是扩展这个类。

所以针对于 Dictionary 的实现，我们并不打算深入讲解。

到这里我们总结一下 Map 集合的所有实现类：

HashMap：Map 集合的经典哈希实现。
LinkedHashMap：在 HashMap 的基础上，增加了对插入元素的链表维护。
WeakedHashMap：在 HashMap 的基础上，使强引用变为弱引用。
TreeMap：Map 集合的有序实现。

工具类

集合的工具类有：Iterator 迭代器、ListIterator 迭代器、Enumeration 枚举类、Arrays 和 Collections 类。

Iterator 迭代器

Iterator 迭代器是一个用来遍历并选择序列中的对象。Java 的 Iterator 只能单向移动。可以看到在 ArrayList、WeakHashMap 等集合类都实现了该接口，从而实现不同类型集合的遍历。

ListIterator 迭代器

ListIterator 继承了 Iterator 接口，所以其有更强大的功能，即它能够实现双向移动。但从其名字也可以看出，其只能适用于 List 集合的遍历。

Enumeration 枚举类

它是 JDK 1.0引入的接口。作用和Iterator一样，也是遍历集合。但是Enumeration的功能要比Iterator少。Enumeration只能在Hashtable, Vector, Stack中使用。这种传统接口已被迭代器取代，虽然 Enumeration 还未被遗弃，但在代码中已经被很少使用了。

官方也在文档中推荐使用 Iterator 接口来替代 Enumeration 接口。

Arrays

Java.util.Arrays类能方便地操作数组，它提供的所有方法都是静态的。

Collections

java.util.Collections 是一个包含各种有关集合操作的静态多态方法的工具类，服务于 Java 的 Collection 框架。

总结

我们花费了大量的篇幅讲解了 List 集合、Set 集合、Map 集合、Queue 集合以及 Iterator 等工具类。我们对这集合的类结构进行了详细的解析，从而更加了解他们之间的关系。

有时候我们会想，了解这么多有啥用呢。我有个朋友只用了常见的 ArrayList、HashMap 就可以了啊。对于这个问题，我想分享几个收获。

第一，让你更加熟悉类之间的差异。 如果我们只会用一两个类，那么我们就不知道在什么时候用什么类。例如：什么时候用 HashMap，什么时候用 Hashtable？Iterator 接口有什么作用？JDK源码的命名有什么特点？

第二，方便对源码进行扩展。 当我们深入研究了集合的实现之后，我们知道了原来 List 接口就是 List 这种数据类型的定义，而 AbstractList 是 List 的抽象实现。那么如果我们要实现一个自定义的 List 结构，那么我们就可以直接继承 AbstractList 类，从而达到快速实现的目的。但如果你没有深入研究呢？你或许只能从头写起，这样得浪费多大的精力啊。你学会了这种方式，那么对于你扩展 Spring 源码也是有很好的帮助的。

在接下来的文章里，我们将深入介绍每一个集合的具体实现。

集合系列 List（二）：ArrayList

ArrayList 是 List 集合的列表经典实现，其底层采用定长数组实现，可以根据集合大小进行自动扩容。

public class ArrayList extends AbstractList
        implements List, RandomAccess, Cloneable, java.io.Serializable

原理

为了深入理解 ArrayList 的原理，我们将从类成员变量、构造方法、核心方法两个方面逐一介绍。

类成员变量

// 默认初始化大小
private static final int DEFAULT_CAPACITY = 10;
// 空列表数据。初始化时如果没有指定大小，则将此值赋予elementData
private static final Object[] EMPTY_ELEMENTDATA = {};
// 默认空列表数据。如果没有指定大小，那么将此值赋予elementData
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
// 列表数据
transient Object[] elementData;
// 列表大小
private int size;

构造方法

ArrayList 一共有 3 个构造方法：

// 空构造方法
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
// 指定大小
public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}
// 指定初始集合
public ArrayList(Collection c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // replace with empty array.
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

从第一个构造方法可以看到，如果没有指定大小，那么就将 elementData 赋值为 DEFAULTCAPACITY_EMPTY_ELEMENTDATA。而从第二个构造方法可以看到，如果指定了大小为 0，那么就将 elementData 赋值为 EMPTY_ELEMENTDATA。

核心方法

在 ArrayList 中最为核心的是获取、插入、删除、扩容这几个方法。

获取

获取的源码非常简单，只需对 index 做有效性校验。如果参数合法，那么直接返回对应数组下标的数据。

public E get(int index) {
    rangeCheck(index);
    return elementData(index);
}

插入

插入一共有两种实现方式，第一种是直接插入列表尾部，另一种是插入某个位置。

// 直接插入尾部
public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}
// 插入某个位置
public void add(int index, E element) {
    rangeCheckForAdd(index);

    ensureCapacityInternal(size + 1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;
}

如果是直接插入尾部的话，那么只需调用 ensureCapacityInternal 方法做容量检测。如果空间足够，那么就插入，空间不够就扩容后插入。

如果是插入的是某个位置，那么就需要将 index 之后的所有元素后移一位，之后再将元素插入至 index 处。

删除

ArrayList 的删除方法有两个，分别是：

删除某个位置的元素：remove(int index)
删除某个具体的元素：remove(Object o)

我们先来看第一个删除方法：删除某个位置的元素。

// 删除某个位置的元素
public E remove(int index) {
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work

    return oldValue;
}

上述代码的逻辑大致是这样的：首先做参数范围检查，接着将 index 位置后的所有元素都往前挪一位，最后减少列表大小。

我们继续看第二个删除方法：删除某个特定的元素。

public boolean remove(Object o) {
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

上述代码的逻辑大致是：首先，遍历列表的所有元素，找到需要删除的元素索引，最后调用 fastRemove 方法删除该元素。我们继续看看 fastRemove 方法的实现。

/*
 * 用私有的方法 fastRemove 方法跳过边界检查，不返回删除值。
 */
private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work
}

这里会有一个疑问，那就是为什么不直接复用 remove(int index) 方法，而要新写一个方法呢？答案在 fastRemove 方法的注释中已经写了，就是为了跳过边界检查，提高效率。

扩容

扩容是 ArrayList 的核心方法，当插入的时候容量不足，便会触发扩容。我们可以看到在插入的两个方法中都调用了扩容方法——ensureCapacityInternal。

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

ensureCapacityInternal 方法直接调用 ensureExplicitCapacity 实现。

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

ensureExplicitCapacity 方法首先判断容量是否足够，如果不够就调用 grow 方法扩容。

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

grow 方法的大致逻辑为：将原有列表容量扩大为原来的 1.5 倍。如果还是不够，那么直接扩大为最小容量（minCapacity）。

总结

经过上面的分析，我们可以知道 ArrayList 有如下特点：

底层基于数组实现，读取速度快，修改速度慢（读取时间复杂度O(1)，修改时间复杂度O(N)）。
非线程安全。
ArrayList 每次默认扩容为原来的 1.5 倍。

集合系列 List（三）：Vector

Vector 的底层实现以及结构与 ArrayList 完全相同，只是在某一些细节上会有所不同。这些细节主要有：

线程安全
扩容大小

线程安全

我们知道 ArrayList 是线程不安全的，只能在单线程环境下使用。而 Vector 则是线程安全的，那么其实怎么实现的呢？

其实 Vector 的实现很简单，就是在每一个可能发生线程安全的方法加上 synchronized 关键字。这样就使得任何时候只有一个线程能够进行读写，这样就保证了线程安全。

public synchronized E get(int index) {
    if (index >= elementCount)
        throw new ArrayIndexOutOfBoundsException(index);

    return elementData(index);
}
public synchronized boolean add(E e) {
    modCount++;
    ensureCapacityHelper(elementCount + 1);
    elementData[elementCount++] = e;
    return true;
}

扩容大小

与 ArrayList 类似，Vector 在插入元素时也会检查容量并扩容。在 Vector 中这个方法是：ensureCapacityHelper。

private void ensureCapacityHelper(int minCapacity) {
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}
private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                     capacityIncrement : oldCapacity);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);
}

其实上述扩容的思路与 ArrayList 是相同，唯一的区别是 Vector 的扩容大小。

int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                     capacityIncrement : oldCapacity);

从上面的代码可以看到：如果 capacityIncrement 大于 0，那么就按照 capacityIncrement 去扩容，否则扩大为原来的 2倍。而 ArrayList 则是扩大为原来的 1.5 倍。

总结

Vector 与 ArrayList 在实现方式上是完全一致的，但是它们在某些方法有些许不同：

第一，Vector 是线程安全的，而 ArrayList 是线程不安全的。Vector 直接使用 synchronize 关键字实现同步。
第二，Vector 默认扩容为原来的 2 被，而 ArrayList 默认扩容为原来的 1.5 倍

集合系列 List（四）：LinkedList

LinkedList 是链表的经典实现，其底层采用链表节点的方式实现。

public class LinkedList
    extends AbstractSequentialList
    implements List, Deque, Cloneable, java.io.Serializable

从类继承结构图可以看到，LinkedList 不仅实现了 List 接口，还实现了 Deque 双向队列接口。

原理

为了深入理解 LinkedList 的原理，我们将从类成员变量、构造方法、核心方法两个方面逐一介绍。

类成员变量

// 链表大小
transient int size = 0;
// 首节点
transient Node first;
// 尾节点
transient Node last;
// Node节点
private static class Node {
    E item;
    Node next;
    Node prev;

    Node(Node prev, E element, Node next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

其采用了链表节点的方式实现，并且每个节点都有前驱和后继节点。

构造方法

LinkedList 总共有 2 个构造方法：

public LinkedList() {
}
public LinkedList(Collection c) {
    this();
    addAll(c);
}

构造方法比较简单，这里不深入介绍。

核心方法

在 LinkedList 中最为核心的是查找、插入、删除、扩容这几个方法。

查找

LinkedList 底层基于链表结构，无法向 ArrayList 那样随机访问指定位置的元素。LinkedList 查找过程要稍麻烦一些，需要从链表头结点（或尾节点）向后查找，时间复杂度为 O(N)。相关源码如下：

public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}

Node node(int index) {
    /*
     * 如果获取的元素小于容量的一般，则从头结点开始查找，否则从尾节点开始查找。
     */
    if (index < (size >> 1)) {
        Node x = first;
        // 循环向后查找，直至 i == index
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

上面的代码比较简单，主要是通过遍历的方式定位目标位置的节点。获取到节点后，取出节点存储的值返回即可。这里面有个小优化，即通过比较 index 与节点数量 size/2 的大小，决定从头结点还是尾节点进行查找。

插入

LinkedList 除了实现了 List 接口相关方法，还实现了 Deque 接口的很多方法，例如：addFirst、addLast、offerFirst、offerLast 等。但这些方法的实现思路大致都是一样的，所以我只讲 add 方法的实现。

add 方法有两个方法，一个是直接插入队尾，一个是插入指定位置。

我们先来看第一个add方法：直接插入队列。

public boolean add(E e) {
    linkLast(e);
    return true;
}

可以看到其直接调用了 linkLast 方法，其实它就是 Deque 接口的一个方法。

void linkLast(E e) {
    final Node l = last;
    final Node newNode = new Node<>(l, e, null);
    last = newNode;
    if (l == null)
        first = newNode;
    else
        l.next = newNode;
    size++;
    modCount++;
}

上述代码进行了节点的创建以及引用的变化，最后增加链表的大小。

我们继续看第二个add方法：插入指定位置。

public void add(int index, E element) {
    checkPositionIndex(index);

    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}

如果我们插入的位置还是链表尾部，那么还是会调用 linkLast 方法。否则调用 node 方法取出插入位置的节点，否则调用 linkBefore 方法插入。

void linkBefore(E e, Node succ) {
    // assert succ != null;
    final Node pred = succ.prev;
    final Node newNode = new Node<>(pred, e, succ);
    succ.prev = newNode;
    if (pred == null)
        first = newNode;
    else
        pred.next = newNode;
    size++;
    modCount++;
}

上述代码进行了节点的创建以及引用的变化，最后增加链表的大小。

删除

删除节点有两个方法，第一个是移除特定的元素，第二个是移除某个位置的元素。

我们先看第一个删除方法：移除特定的元素。

public boolean remove(Object o) {
    if (o == null) {
        for (Node x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;
}

上述代码的大致思路为：遍历找到删除的节点，之后调用 unlink() 方法解除引用。我们继续看看 unlink() 方法的代码。

E unlink(Node x) {
    // assert x != null;
    final E element = x.item;
    final Node next = x.next;
    final Node prev = x.prev;

    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }

    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }

    x.item = null;
    size--;
    modCount++;
    return element;
}

unlink() 代码里就是做了一系列的引用修改操作。下面的步骤图非常详细地解释了整个删除过程。

本文部分图片来源于田小波的博客

总结

经过上面的分析，我们可以知道 LinkedList 有如下特点：

底层基于链表实现，修改速度快，读取速度慢（读取时间复杂度O(N)，修改时间复杂度O(N)，因为要查找元素，所以修改也是O(N)）。
非线程安全。
与 ArrayList 不同，LinkedList 没有容量限制，所以也没有扩容机制。

集合系列 List（五）：Stack

Stack 是先进后出的栈结构，其并不直接实现具体的逻辑，而是通过继承 Vector 类，调用 Vector 类的方法实现。

public
class Stack extends Vector

核心方法

Stack 类代码非常简单，其有 3 个核心方法：push、pop、peek。

push

public E push(E item) {
    addElement(item);

    return item;
}

可以看到 push 方法直接调用 Vector 的 addElement 方法将元素插入数组尾部。

pop

public synchronized E pop() {
    E       obj;
    int     len = size();

    obj = peek();
    removeElementAt(len - 1);

    return obj;
}

pop 方法调用 Vector 的 removeElementAt 方法，删除了一个元素。要注意的是，其删除的是数组最后一个元素，而不是第一个元素。

peek

public synchronized E peek() {
    int     len = size();

    if (len == 0)
        throw new EmptyStackException();
    return elementAt(len - 1);
}

peek 方法直接返回列表最后一个元素。

总结

Stack 方法代码真的是非常简单，其利用 Vector 实现了一个线程安全的栈结构。总的来说，其有以下特点:

底层采用 Vector 实现，因此其也是采用数组实现，也是线程安全的。
先进后出的栈结构

集合系列 Set（六）：HashSet

HashSet 是 Set 集合的哈希实现，其继承了 AbstractSet 抽象类，并实现了 Set 接口。

public class HashSet
    extends AbstractSet
    implements Set, Cloneable, java.io.Serializable

原理

为了深入理解 HashSet 的原理，我们将从类成员变量、构造方法、核心方法两个方面逐一介绍。

类成员变量

// HashSet内部使用HashMap存储
private transient HashMap map;
// 存储在value上的值
private static final Object PRESENT = new Object();

从类成员变量我们可以知道，HashSet 内部使用 HashMap 存储，而 PRESENT 则是存储在所有 key 上的 value。因此对于 HashSet 来说，其所有 key 的 value 都相同。

构造方法

HashSet 一共有 5 个构造方法。

public HashSet() {
    map = new HashMap<>();
}

public HashSet(Collection c) {
    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
}

public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}

public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}
    
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

可以看到构造方法传入的参数其实就是用于初始化 HashMap 对象，主要有：initialCapacity（初始大小）、loadFactor（扩容因子）。这几个构造参数内容并不复杂，这里就不细讲了。

这里有一个关键的细节，即第 5 个方法使用 LinkedHashMap 实现的，而不是用 HashMap 实现的。而我们后面要讲到的 LinkedHashSet 其实就是使用 LinkedHashMap 实现的，其保存了插入元素的顺序。

核心方法

对于 HashSet 来说，其核心的方法有：add、remove。

我们先看 add 方法。

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

可以看到 add 方法直接调用了 HashMap 对象的 put 方法。如果 Set 集合插入成功，那么就返回 true，否则返回 false。

接着我们看看 remove 方法。

public boolean remove(Object o) {
    return map.remove(o)==PRESENT;
}

可以看到 remove 方法直接调用了 HashMap 对象的 remove 方法。如果删除成功，就返回 true，否则返回 false。

总结

HashSet 的源码也是非常简单了，其直接借用了 HashMap 的实现。所以如果你弄懂了 HashMap，那么 HashSet 自然不在话下了。

集合系列 Set（七）：LinkedHashSet

LinkedHashSet 继承了 HashSet，在此基础上维护了元素的插入顺序。

public class LinkedHashSet
    extends HashSet
    implements Set, Cloneable, java.io.Serializable

原理

LinkedHashSet 的源码非常简单，只有简单的 4 个构造方法。

public LinkedHashSet(int initialCapacity, float loadFactor) {
    super(initialCapacity, loadFactor, true);
}
    
public LinkedHashSet(int initialCapacity) {
    super(initialCapacity, .75f, true);
}
    
public LinkedHashSet() {
    super(16, .75f, true);
}
    
public LinkedHashSet(Collection c) {
    super(Math.max(2*c.size(), 11), .75f, true);
    addAll(c);
}

但我们不是说 HashSet 还维护了元素的插入顺序么？那这部分代码写在哪里呢？

这里我们要注意一个细节，即 LinkedHashSet 调用的都是 HashSet 的三个参数构造方法，即 HashSet 的这个方法。

HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

从上面的代码我们知道，LinkedHashSet 虽然继承的是 HashSet，但是其却使用 LinkedHashMap 做为实现类。而 LinkedHashMap 则本身维护了元素的插入顺序，这在我们接下来解析 LinkedHashMap 源码的时候会讲到。

总结

LinkedHashSet 是在 HashSet 的基础上，维护了元素的插入顺序。虽然 LinkedHashSet 使用了 HashSet 的实现，但其却调用了 LinkedHashMap 作为最终实现，从而实现了对插入元素顺序的维护。

集合系列 Set（八）：TreeSet

TreeSet 是 Set 集合的红黑树实现，但其内部并没有具体的逻辑，而是直接使用 TreeMap 对象实现。我们先来看看 TreeSet 的定义。

public class TreeSet extends AbstractSet
    implements NavigableSet, Cloneable, java.io.Serializable

可以看到 TreeSet 实现了 NavigableSet 接口，而 NavigableSet 接口又继承了接口。SortedSet 接口又继承了 Set 接口。

public interface NavigableSet extends SortedSet

public interface SortedSet extends Set

TreeSet 的类继承关系如下图所示。

原理

我们还是通过类成员变量、构造方法、核心方法来解析 TreeSet 的实现。

类成员变量

// 具体的实现类
private transient NavigableMap m;
// Map的value
private static final Object PRESENT = new Object();

构造方法

TreeSet 一共有 5 个构造方法，如下所示：

// 默认采用TreeMap实现
public TreeSet() {
    this(new TreeMap());
}
// 指定实现类型
TreeSet(NavigableMap m) {
    this.m = m;
}
// 指定TreeMap的比较器
public TreeSet(Comparator comparator) {
    this(new TreeMap<>(comparator));
}
// 指定初始集合
public TreeSet(Collection c) {
    this();
    addAll(c);
}
// 指定比较器以及初始集合
public TreeSet(SortedSet s) {
    this(s.comparator());
    addAll(s);
}

可以看到，如果我们没有指定传入的 Map 类型，TreeSet 将自动采用 TreeMap 来实现。而如果你传入了 NavigableMap 类型的对象，那么就按照你传入的对象类型来实现。

核心方法

TreeSet 的核心方法实现直接采用了 TreeMap 的实现，无论是 add 还是 remove 方法。

public boolean add(E e) {
    return m.put(e, PRESENT)==null;
}
    
public boolean remove(Object o) {
    return m.remove(o)==PRESENT;
}

总结

TreeSet 的实现与 HashSet 类似，都是直接采用了 TreeMap 的方法实现。所以如果理解了 TreeMap，那么 TreeSet 就很简单了。同样的，我们将在 TreeMap 中深入讲解其实现。

集合系列 Queue（九）：PriorityQueue

PriorityQueue 是一个优先级队列，其底层原理采用二叉堆实现。我们先来看看它的类声明：

public class PriorityQueue extends AbstractQueue
    implements java.io.Serializable

PriorityQueue 继承了 AbstractQueue 抽象类，具有队列的基本特性。

二叉堆

由于 PriorityQueue 底层采用二叉堆来实现，所以我们有必要先介绍下二叉堆。

二叉堆从结构上来看其实就是一个完全二叉树或者近似完全二叉树。二叉堆的每个左子树和右子树都是一个二叉堆。当父节点总是大于或等于一个子节点的键值时称其为「最大堆」，当父节点总是小于或等于任何一个子节点的键值时称其为「最小堆」。

        最小堆                               最大堆
             1                                11
         /        \                        /        \
       2           3                    9           10
    /     \      /     \             /     \      /     \
   4      5     6       7           5      6     7      8
  / \     / \                      / \     / \
 8  9 10 11                       1   2   3   4

在二叉堆上常见的操作有：插入、删除，我们下面将详细介绍这两种操作。

插入

在二叉堆上插入节点的思路为：在数组的末尾插入新节点，然后不断上浮与父节点比较，直到找到合适的位置，使当前子树符合二叉堆的性质。二叉堆的插入操作最坏情况下需要从叶子上移到根节点，所以其时间复杂度为 O(logN)。

例如我们有下面这个最小堆，当我们插入一个值为 6 的节点，其调整过程如下：

        最小堆
             1
         /        \
       5           7
    /     \      /     \
   8      10   48     55
  / \     / \
 11 9   15

在数组末尾插入新节点 6。

        最小堆
             1
         /        \
       5           7
    /     \      /     \
   8      10   48     55
  / \     / \
 11 9   15   6

做上浮操作不断与父节点比较，直到其大于等于父节点。首先，6 < 10，所以交换位置。

        最小堆
             1
         /        \
       5           7
    /     \      /     \
   8     → 6   48     55
  / \     / \
 11 9   15   10

继续与父节点比较，6 > 5 符合二叉树的性质，结束。

删除

二叉堆删除节点的思路为：

首先，如果删除的是末尾节点，那么直接删除即可，不需要调整。
接着，将删除节点与末尾节点交换数据，之后删除末尾节点，接着对删除节点不断做下沉操作。
最后，继续对删除节点做上浮操作。

例如我们有下面这个最小堆，当我们删除一个值为 7 的节点，其调整过程如下：

             1
         /        \
       5           7
    /     \      /     \
   8      10   48     55
  / \     / \   / \
 11 9   15  16 50 52

首先，将删除节点与末尾节点交换数据，并删除末尾节点。

             1
         /        \
       5           52
    /     \      /   \
   8      10   48     55
  / \     / \   / \
 11 9   15  16 50

接着，对删除节点（52）不断做下沉操作。首先比较 52 与 48 和 55 的大小，将 52 与 48 交换。接着比较 52 与 50 的大小，将 52 与 50 交换。结果为：

             1
         /        \
       5           48
    /     \      /   \
   8      10    50     55
  / \     / \   / \
 11 9   15  16 52

最后，对删除节点（15）不断做上浮操作，结果为：

             1
         /        \
       5          15
    /     \      /     \
   8      10   48     55
  / \     / \
 11 9

这里有一个细节，为什么做下沉操作之后，还需要做一次上浮操作呢？这是因为我们无法确定末尾节点的值与删除节点的父节点的大小关系。

在上面的例子中，我们删除的节点是 7，删除节点的父节点为1，末尾节点是 52。因为末尾节点和删除节点在同一个子树上，所以我们能够确定删除节点的父节点一定小于末尾节点，即 1 一定小于 52。所以我们不需要做上浮操作。

但是如果末尾节点与删除节点并不是在一颗子树上呢？此时我们无法判断末尾节点与删除节点父节点之间的大小关系，此时可能出现下面这种情况：

             1
         /        \
       5           230
    /     \      /   \
   8      10   240     255
  / \     / \   / \      / \
 11 9   15  16 241 242 256 260
/ \
27 33

此时如果我们删除 255 节点，那么删除节点的父节点为 230，末尾节点为 33。此时末尾节点就小于删除节点的父节点，需要做上浮操作。

原理

了解完二叉树的插入、删除原理，我们再来看看 PriorityQueue 的源码就很简单了。

类成员变量

// 队列数据
transient Object[] queue;
// 大小
private int size = 0;
// 比较器
private final Comparator comparator;

从类成员变量我们可以知道 PriorityQueue 底层采用数组存储数据，comparator 的实现决定了其实一个最大堆还是最小堆。默认情况下 PriorityQueue 是个最小堆。

构造方法

PriorityQueue 一共有 7 个构造方法。

public PriorityQueue() {
    this(DEFAULT_INITIAL_CAPACITY, null);
}
    
public PriorityQueue(int initialCapacity) {
    this(initialCapacity, null);
}
    
public PriorityQueue(Comparator comparator) {
    this(DEFAULT_INITIAL_CAPACITY, comparator);
}
    
public PriorityQueue(int initialCapacity,
                     Comparator comparator) {
    if (initialCapacity < 1)
        throw new IllegalArgumentException();
    this.queue = new Object[initialCapacity];
    this.comparator = comparator;
}
// 传入集合初始值
public PriorityQueue(Collection c) {
    if (c instanceof SortedSet) {
        SortedSet ss = (SortedSet) c;
        this.comparator = (Comparator) ss.comparator();
        initElementsFromCollection(ss);
    }
    else if (c instanceof PriorityQueue) {
        PriorityQueue pq = (PriorityQueue) c;
        this.comparator = (Comparator) pq.comparator();
        initFromPriorityQueue(pq);
    }
    else {
        this.comparator = null;
        initFromCollection(c);
    }
}
// 传入PriorityQueue初始值
public PriorityQueue(PriorityQueue c) {
    this.comparator = (Comparator) c.comparator();
    initFromPriorityQueue(c);
}
// 传入SortedSet初始值
public PriorityQueue(SortedSet c) {
    this.comparator = (Comparator) c.comparator();
    initElementsFromCollection(c);
}

PriorityQueue 的构造方法比较多，但其功能都类似。如果传入的是普通集合，那么会将其数据复制，最后调用 heapify 方法进行二叉堆的初始化操作。但如果传入的数据是 SortedSet 或 PriorityQueue 这些已经有序的数据，那么就直接按照顺序复制数据即可。

核心方法

对于 PriorityQueue 来说，其核心方法有：获取、插入、删除、扩容。

获取

PriorityQueue 没有查询方法，取而代之的是获取数据的 peek 方法。

public E peek() {
    return (size == 0) ? null : (E) queue[0];
}

如果队列为空，那么返回 null 值，否则返回队列的第一个元素（即最大或最小值）。

插入

PriorityQueue 的数据插入过程，其实就是往二叉堆插入数据的过程。

public boolean add(E e) {
    return offer(e);
}
    
public boolean offer(E e) {
    if (e == null)
        throw new NullPointerException();
    modCount++;
    int i = size;
    // 1.容量不够，进行扩容
    if (i >= queue.length)
        grow(i + 1);
    size = i + 1;
    // 2.如果队列为空那么直接插入第一个节点
    // 否则插入末尾节点后进行上浮操作
    if (i == 0)
        queue[0] = e;
    else
        siftUp(i, e);
    return true;
}

private void siftUp(int k, E x) {
    if (comparator != null)
        siftUpUsingComparator(k, x);
    else
        // 3.采用默认的比较器
        siftUpComparable(k, x);
}
    
private void siftUpComparable(int k, E x) {
    Comparable key = (Comparable) x;
    while (k > 0) {
        // 4.将插入节点与父节点比较
        // 如果插入节点大于等于父节点，那么说明符合最小堆性质
        // 否则交换插入节点与父节点的值，一直到堆顶
        int parent = (k - 1) >>> 1;
        Object e = queue[parent];
        if (key.compareTo((E) e) >= 0)
            break;
        queue[k] = e;
        k = parent;
    }
    queue[k] = key;
}

插入的代码最终的逻辑是在 siftUpComparable 方法中，而该方法其实就是我们上面所说二叉堆插入逻辑的实现。

删除

PriorityQueue 的数据删除过程，其实就是将数据从二叉堆中删除的过程。

public boolean remove(Object o) {
    int i = indexOf(o);
    if (i == -1)
        return false;
    else {
        removeAt(i);
        return true;
    }
}
    
private E removeAt(int i) {
    // assert i >= 0 && i < size;
    modCount++;
    int s = --size;
    // 1.删除的是末尾节点，那么直接删除即可
    if (s == i) // removed last element
        queue[i] = null;
    else {
        E moved = (E) queue[s];
        queue[s] = null;
        // 2.对删除节点做下沉操作
        siftDown(i, moved);
        if (queue[i] == moved) {
            // 3.queue[i] == moved 表示删除节点根本没下沉
            // 意思是其就是该子树最小的节点
            // 这种情况下就需要进行上浮操作
            // 因为可能出现删除节点父节点大于删除节点的情况
            siftUp(i, moved);
            if (queue[i] != moved)
                return moved;
        }
    }
    return null;
}
    
private void siftDown(int k, E x) {
    if (comparator != null)
        siftDownUsingComparator(k, x);
    else
        siftDownComparable(k, x);
}
    
private void siftDownComparable(int k, E x) {
    Comparable key = (Comparable)x;
    int half = size >>> 1;        // loop while a non-leaf
    while (k < half) {
        int child = (k << 1) + 1; // assume left child is least
        Object c = queue[child];
        int right = child + 1;
        if (right < size &&
            ((Comparable) c).compareTo((E) queue[right]) > 0)
            c = queue[child = right];
        if (key.compareTo((E) c) <= 0)
            break;
        queue[k] = c;
        k = child;
    }
    queue[k] = key;
}

PriorityQueue 的删除操作需要注意的点是其下沉之后，还需要根据条件做一次上浮操作。关于为什么要做上浮操作，上面讲解二叉堆的时候已经提到了。

offer

因为 PriorityQueue 是队列，所以有 offer 操作。

对于 offer 操作来说，其实就是相当于往数组未插入数据，其逻辑细节我们在插入 add 方法中已经说到。

poll

因为 PriorityQueue 是队列，同样会有 poll 操作。而 poll 操作其实就是弹出队列头结点，相当于删除头结点。

public E poll() {
    if (size == 0)
        return null;
    int s = --size;
    modCount++;
    // 弹出头结点
    E result = (E) queue[0];
    E x = (E) queue[s];
    queue[s] = null;
    // 做下沉操作
    if (s != 0)
        siftDown(0, x);
    return result;
}

之前我们说过删除节点的逻辑，即拿末尾节点值替代删除节点，然后做下沉操作。但是这里因为删除节点是根节点了，所以不需要做上浮操作。

扩容

当往队列插入数据时，如果队列容量不够则会进行扩容操作。

private void grow(int minCapacity) {
    int oldCapacity = queue.length;
    // Double size if small; else grow by 50%
    int newCapacity = oldCapacity + ((oldCapacity < 64) ?
                                     (oldCapacity + 2) :
                                     (oldCapacity >> 1));
    // overflow-conscious code
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    queue = Arrays.copyOf(queue, newCapacity);
}

PriorityQueue 的扩容非常简单。如果原来的容量小于 64，那么扩容为原来的两倍，否则扩容为原来的 1.5 倍。

总结

PriorityQueue 的实现是建立在二叉堆之上的，所以弄懂二叉堆就相当于弄懂了 PriorityQueue。PriorityQueue 默认情况下是最小堆，我们可以改变传入的比较器，使其成为最大堆。

集合系列 Queue（十）：LinkedList

我们之前在说到 List 集合的时候已经说过 LinkedList 了。但 LinkedList 不仅仅是一个 List 集合实现，其还是一个双向队列实现。

public class LinkedList
    extends AbstractSequentialList
    implements List, Deque, Cloneable, java.io.Serializable

LinkedList 不仅实现了 List 接口，还实现了 Deque 接口。所以这一节我们来聊聊 LinkedList 的双向队列特性。

原理

为了深入理解 LinkedList 的原理，我们将从类成员变量、构造方法、核心方法两个方面逐一介绍。

类成员变量

// 链表大小
transient int size = 0;
// 首节点
transient Node first;
// 尾节点
transient Node last;
// Node节点
private static class Node {
    E item;
    Node next;
    Node prev;

    Node(Node prev, E element, Node next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

可以看到 LinkedList 采用了链表节点的方式实现，并且每个节点都有前驱和后继节点。

构造方法

LinkedList 总共有 2 个构造方法：

public LinkedList() {
}
public LinkedList(Collection c) {
    this();
    addAll(c);
}

构造方法比较简单，这里不深入介绍。

核心方法

LinkedList 中与双向队列相关的几个方法为：offerFirst、offerLast、pollFirst、pollLast。

offerFirst

public boolean offerFirst(E e) {
    addFirst(e);
    return true;
}
    
    public void addFirst(E e) {
    linkFirst(e);
}

// 将e节点作为头结点插入
private void linkFirst(E e) {
    final Node f = first;
    final Node newNode = new Node<>(null, e, f);
    first = newNode;
    if (f == null)
        last = newNode;
    else
        f.prev = newNode;
    size++;
    modCount++;
}

offerLast

public boolean offerLast(E e) {
    addLast(e);
    return true;
}
    
public void addLast(E e) {
    linkLast(e);
}
// 将e节点作为末尾节点插入
void linkLast(E e) {
    final Node l = last;
    final Node newNode = new Node<>(l, e, null);
    last = newNode;
    if (l == null)
        first = newNode;
    else
        l.next = newNode;
    size++;
    modCount++;
}

pollFirst

public E pollFirst() {
    final Node f = first;
    return (f == null) ? null : unlinkFirst(f);
}
// 删除头结点
private E unlinkFirst(Node f) {
    // assert f == first && f != null;
    final E element = f.item;
    final Node next = f.next;
    f.item = null;
    f.next = null; // help GC
    first = next;
    if (next == null)
        last = null;
    else
        next.prev = null;
    size--;
    modCount++;
    return element;
}

pollLast

public E pollLast() {
    final Node l = last;
    return (l == null) ? null : unlinkLast(l);
}
// 删除尾节点
private E unlinkLast(Node l) {
    // assert l == last && l != null;
    final E element = l.item;
    final Node prev = l.prev;
    l.item = null;
    l.prev = null; // help GC
    last = prev;
    if (prev == null)
        first = null;
    else
        prev.next = null;
    size--;
    modCount++;
    return element;
}

可以看出无论是插入还是删除，poll 和 offer 操作都相对简单，重点在于引用的修改和维护。

总结

LinkedList 不仅是一个简单的 List 实现，其也是一个双向队列实现。

集合系列 Queue（十一）：ArrayDeque

从名字我们可以看出，其实一个双向队列实现，而且底层采用数组实现。

public class ArrayDeque extends AbstractCollection
                           implements Deque, Cloneable, Serializable

从定义可以看出，其实现了 Deque 接口。

原理

为了深入理解 ArrayDeque 的原理，我们将从类成员变量、构造方法、核心方法两个方面逐一介绍。

类成员变量

// 数据数组
transient Object[] elements;
// 头结点
transient int head;
// 尾节点
transient int tail;

从类成员变量我们就可以知道，其底层确实使用数组存储。

构造方法

ArrayDeque 一共有 3 个构造方法：

public ArrayDeque() {
    elements = new Object[16];
}

public ArrayDeque(int numElements) {
    allocateElements(numElements);
}

public ArrayDeque(Collection c) {
    allocateElements(c.size());
    addAll(c);
}

从第一个构造方法可以看到，其构造方法直接指定了 ArrayDeque 的初始大小为 16。

核心方法

对于双向队列来说，其关键的方法是：offer、poll、offerFirst、offerLast、pollFirst、pollLast。但其实这些方法的内容都类似，所以我们只分析 offer 和 poll 方法。

offer

public boolean offer(E e) {
    return offerLast(e);
}
    
public boolean offerLast(E e) {
    addLast(e);
    return true;
}
    
public void addLast(E e) {
    if (e == null)
        throw new NullPointerException();
    elements[tail] = e;
    // 当 tail 和 head 相遇时，表示队列已满，需要扩容
    if ( (tail = (tail + 1) & (elements.length - 1)) == head)
        doubleCapacity();
}

这里比较难懂的地方是这个判断：

if ( (tail = (tail + 1) & (elements.length - 1)) == head)
    doubleCapacity();

因为 ArrayDeque 初始容量是 16，而每次扩容都是扩为原来的两倍，所以 ArrayDeque 的容量总是 2 的幂次方。所以上面的判断其实在队列未满时，相当于将 tail 进行加一操作。

if ( (tail = (tail + 1)) == head)
    doubleCapacity();

而做这样一个与操作的目的就是在 tail 到达数组末尾时可以自动切换为 0。我们可以假设此数组大小为 16，而此时 tail 指向了 15，即末尾节点。那么此时执行 offer 操作，我们在计算 (tail + 1) & (elements.length - 1) 就会如下图所示：

10000   // tail + 1 = 15 + 1 = 16
01111   // element.length - 1 = 16 -1 =15
00000   // 结果为0

计算出的结果为 0，也就是说 tail 指针指向了 0 这个位置。

poll

public E poll() {
    return pollFirst();
}
    
public E pollFirst() {
    int h = head;
    @SuppressWarnings("unchecked")
    E result = (E) elements[h];
    // Element is null if deque empty
    if (result == null)
        return null;
    elements[h] = null;     // Must null out slot
    // 等价于 head = h + 1
    // 当处于队列末尾时，会切到队列头
    head = (h + 1) & (elements.length - 1);
    return result;
}

poll 方法也与 offer 方法类似，在最终对 head 节点加一时也用了同样的方法。

总结

看完 ArrayDeque 类的实现，我们不由得会想起 LinkedList 的实现，因为它们两个都是双向队列的实现，但是一个采用数组实现，一个采用链表实现。那么它们有什么异同呢？

通过查询一些资料发现，其实它们两个在功能和效率上并没有太大不同。如果你需要用到双向队列，那么 ArrayDeque 相对于 LinkedList 要更好。因为 ArrayDeque 相对于 LinkedList 直接采用数组存储，而 LinkedList 则需要采用节点存储。所以 LinkedList 相对于 ArrayDeque 需要消耗更多内存。

本身数组与链表的差异在于查询和修改的差异，但是对于队列来说，其都是在头和尾进行操作。所以数组与链表的差异在队列身上没有任何体现。而查阅 ArrayDeque 和 LinkedList 的发布时间，我们会发现 ArrayDeque 发布于 JDK 1.6，而 LinkedList 发布于 JDK 1.2。所以从这一点来看，我们有理由相信 ArrayDeque 其实是 LinkedList 的优化版本。

你可能感兴趣的:(面试宝典)

一文看尽LLM对齐技术：RLHF、RLAIF、PPO、DPO…… Python算法实战大模型理论与实战算法深度学习人工智能 transformer 大模型 RLHF ppo
最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。《大模型面试宝典》(2024版)正式发布喜欢本文记得收藏、关注、点赞。更多实战和面试交流，文末加入我们为了对齐LLM，各路研究者妙招连连。LLM很强大了，但
【面试系列】C++ 高频面试题野老杂谈全网最全IT公司面试宝典 c++面试编程语言
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️全流程数据技术实战指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台和数据仓库的核心技术和方法。文章目录C++初级面试题及其详细解答1.解释C
JAVA面试宝典 -《性能优化实战：从代码到架构的调优》
文章目录《性能优化实战：从代码到架构的调优》引言：性能优化是系统的“生命线”第一部分：代码级优化（微观层面）1️⃣常见性能“坑”2️⃣GC调优入门3️⃣性能分析工具推荐️第二部分：数据库性能优化1️⃣SQL优化策略2️⃣利用缓存“兜底”3️⃣MyBatisPlus实例优化第三部分：服务层调优（中观层面）1️⃣接口耗时分析2️⃣异步与线程池优化3️⃣限流与熔断️第四部分：架构级优化（宏观层面）1️⃣
大模型算法工程师面试宝典：精选面试题及参考答案全解析，助你备战AI算法工程师岗位！大模型入门学习人工智能产品经理大数据机器学习程序员大模型大模型学习
大模型应该算是目前当之无愧的最有影响力的AI技术。它正在革新各个行业，包括自然语言处理、机器翻译、内容创作和客户服务等，正成为未来商业环境的重要组成部分。截至目前大模型已超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关面试也是越来越卷。我今天给大家分享一篇大模型的面试题总结，内容较长，喜欢记得收藏、关注、点赞。ii.为什么会出现LLMs复读机问题？出现LLMs复读机问题可能
FlatBuffers（概念、原理及优势、在TS中的使用）前端杂货铺 TodoList 100个小知识 FlatBuffers JSON 序列化反序列化
个人简介个人主页：前端杂货铺‍♂️学习方向：主攻前端方向，正逐渐往全干发展个人状态：研发工程师，现效力于中国工业软件事业人生格言：积跬步至千里，积小流成江海推荐学习：前端面试宝典100个小功能Vue2Vue3Vue2/3项目实战Node.js实战Three.js个人推广：每篇文章最下方都有加入方式，旨在交流学习&资源分享，快加入进来吧文章目录介绍在Vue中使用FlatBuffersFlatBuff
【面试宝典】39道UniApp高频题库整理(附答案背诵版) 想念@思恋 java 前端面试宝典面试 uni-app 职场和发展
1.简述什么是uniApp？uniApp是一个使用Vue.js开发所有前端应用的框架，它允许开发者用一套代码同时发布到iOS、Android、Web（包括PC和移动端浏览器）、以及各种小程序（微信、支付宝、百度、字节跳动、QQ等）和快应用等多个平台。简而言之，uniApp的宗旨是“一次开发，多处运行”。使用uniApp，开发者可以享受到Vue.js的开发体验，包括组件化开发、Vue插件支持、Vue
面试宝典：深入理解这110道python面试题，AI和大数据向你招手喜欢打酱油的老鸟 Python
https://www.toutiao.com/a6672867099800502795/1、一行代码实现1--100之和利用sum()函数求和2、如何在一个函数内部修改全局变量函数内部global声明修改全局变量3、列出5个python标准库os：提供了不少与操作系统相关联的函数sys:通常用于命令行参数re:正则匹配math:数学运算datetime:处理日期时间4、字典如何删除键和合并两个字
【面试宝典】【大模型入门】【模型微调】曾小文人工智能深度学习机器学习
面试热点科普：监督微调vs无监督微调，有啥不一样？在大模型时代（比如BERT、GPT）里，我们经常听到“预训练+微调”的范式。但你可能会疑惑——监督微调、无监督微调，到底有啥区别？用的场景一样吗？今天这篇，带你5分钟搞懂这对“孪生兄弟”的异同✅1.术语定义名称定义说明预训练（Pretraining）在大规模通用数据上训练模型，学习“通用知识”，比如语言规律、语义表示。微调（Fine-tuning）
【大模型】【机器学习】【面试宝典】曾小文机器学习面试人工智能
面试热点科普：BatchNorm和LayerNorm有什么区别？在深度学习面试中，经常会被问到模型训练稳定性相关的问题。其中两个关键词BatchNorm和LayerNorm绝对是高频词！今天就带大家快速梳理两者的核心区别，用最通俗的方式掌握它们的原理和应用场景，面试不再含糊！1.什么是归一化（Normalization）？归一化是神经网络训练过程中的一项重要技巧，目的是：缓解梯度爆炸/消失加快收敛
【面试系列】云计算工程师高频面试题及详细解答野老杂谈全网最全IT公司面试宝典面试云计算职场和发展
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️全流程数据技术实战指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台和数据仓库的核心技术和方法。文章目录常见的初级面试题1.什么是云计算？2.
ATT 协议探秘：如何通过属性协议实现数据交互（面试宝典版） byte轻骑兵蓝牙面试通关指南：高频考点 +大厂真题 +实战解析面试职场和发展
在低功耗蓝牙（BLE）的江湖中，ATT（AttributeProtocol）协议堪称数据交互的"灵魂摆渡人"。它像一位训练有素的快递员，在设备间精准投递着一个个"数据包裹"。本文深入剖ATT协议的技术细节，结合面试高频考点和历年真题。助你轻松应对蓝牙开发面试。一、ATT协议基础：数据交互的底层逻辑1.1什么是ATT协议？ATT（AttributeProtocol，属性协议）是低功耗蓝牙（BLE）协
蓝牙 5.0 新特性全解析：传输距离与速度提升的底层逻辑（面试宝典版） byte轻骑兵蓝牙面试通关指南：高频考点 +大厂真题 +实战解析面试职场和发展
蓝牙技术自1994年诞生以来，已经经历了多次重大升级。作为当前主流的无线通信标准之一，蓝牙5.0在2016年发布后，凭借其显著的性能提升成为了物联网（IoT）、智能家居、可穿戴设备等领域的核心技术。本文将深入解析蓝牙5.0在传输距离和速度上的底层技术逻辑，并结合面试高频考点和历年真题进行详细分析，快速掌握这一关键技术。一、蓝牙5.0核心技术解析1.1传输距离提升的底层逻辑①链路预算优化蓝牙5.0通
【面试宝典】15道Kubernetes高频题库整理(附答案背诵版) 想念@思恋面试宝典面试 kubernetes 职场和发展
简述ETCD及其特点?ETCD是etcd的简称，是一个开源的分布式键值存储系统，常用于存储分布式系统中的关键数据。它由CoreOS团队开发并开源，具有以下特点：简单：ETCD提供了简单易用的HTTPAPI，使用起来非常方便。存储：数据以分层的形式存储在文件目录中，类似于我们日常使用的文件系统。Watch机制：可以Watch指定的键或前缀目录的更改，并对更改时间进行通知。安全通信：支持SSL证书验证
【面试系列】Swift 高频面试题及详细解答野老杂谈全网最全IT公司面试宝典面试 swift 职场和发展编程语言
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️全流程数据技术实战指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台和数据仓库的核心技术和方法。文章目录Swift初级面试题及详细解答1.什么
Python面试宝典：虚拟环境概念以及虚拟环境管理面试题（1000加python面试题助你轻松捕获大厂Offer）脑洞笔记 python全栈面试宝典 python 面试开发语言
Python面试宝典：1000加python面试题助你轻松捕获大厂Offer【第一部分：Python基础：第九章：Python虚拟环境：第一节：虚拟环境概念以及虚拟环境管理】第九章：Python虚拟环境第一节：虚拟环境概念以及虚拟环境管理1.1、为什么需要虚拟环境？1.2、虚拟环境管理工具1.1.1.venv1.1.2.virtualenv1.1.3.conda1.3、使用虚拟环境1.4、pyth
前端面试宝典---事件循环面试题 Attacking-Coder 面试 js 浏览器工作原理前端面试职场和发展
浏览器进程模型与JavaScript执行机制现代浏览器采用多进程架构，包含浏览器进程、渲染进程、网络进程等多个核心进程。每个标签页会独立创建一个渲染进程，负责页面内容的解析、渲染和执行脚本代码。JavaScript的单线程特性JavaScript采用单线程执行模型，其主线程同时承担两个关键职责：GUI渲染线程：处理HTML/CSS解析、样式计算、布局绘制（每秒60帧渲染）JS引擎线程：执行全局代码
测试面试宝典（二十五）—— 测试报告里都包含哪些内容？海姐软件测试软件测试面试通关秘籍面试职场和发展笔记其他经验分享
一般来说，一份完整的测试报告主要包含以下几个部分：第一部分是项目概述，其中会说明项目的背景、目标、测试范围，以及参与测试的相关人员和测试的时间周期等基本信息，让阅读报告的人对测试项目有一个整体的了解。第二部分是测试环境，详细描述测试过程中所使用的硬件、软件、网络环境等，包括操作系统、浏览器、服务器配置等，确保测试结果的可重现性和可靠性。第三部分是测试用例执行情况，总结测试用例的总数、执行的数量、通
【面试宝典】41道Django高频题库整理(附答案背诵版)
解释一下Django和Tornado的关系？Django和Tornado都是Python的web框架，但它们的设计哲学和应用场景有所不同。Django是一个高级的PythonWeb框架，鼓励快速开发和干净、实用的设计。它遵循MVC设计，并强调代码复用。Django有许多功能强大的第三方插件，具有很强的可扩展性。其主要目标是简便、快速的开发数据库驱动的网站。Django注重的是高效开发，它最出名的是
【面试宝典】70道Hive高频题库整理(附答案背诵版) 想念@思恋数据仓库面试宝典面试 hive 职场和发展
简述什么是Hive？Hive是一个基于Hadoop的数据仓库工具，它可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。Hive定义了简单的SQL查询语言称为HiveQL，该语言允许熟悉SQL的用户查询数据。同时，Hive提供了一个元数据存储，存储了所有表的元数据信息。应用场景举例：假设我们有一个电商网站，每天都会产生大量的交
DDD面试宝典：从谢飞机的搞笑回答到架构高手的成长之路 wujie10 Java后端场景面试宝典
DDD面试宝典：从谢飞机的搞笑回答到架构高手的成长之路面试场景：互联网大厂Java工程师岗位面试官：欢迎来到我们今天的面试环节，请简单介绍一下自己。谢飞机：您好，我叫谢飞机，本科毕业，三年工作经验，做过电商、支付、社交等多个项目，对DDD有一定了解，但可能不是特别深入。面试官：很好，今天我们主要会围绕DDD相关知识进行提问，希望你能结合实际业务场景来回答问题。第一轮：基础概念与应用场景面试官：首先
软件测试面试宝典2025版程序员勋勋软件测试面试面试职场和发展软件测试
1测试理论1.1测试基础1.1.1什么是软件测试？为了发现程序中的错误而执行程序的过程1.1.2软件测试的目的？首先，测试并不仅仅是为了要找出错误。通过分析错误产生的原因和错误的分布特征，可以帮助项目管理者发现当前所采用的软件过程的缺陷，以便改进。同时，这种分析也能帮助我们设计出有针对性地检测方法，改善测试的有效性。其次，没有发现错误的测试也是有价值的，完整的测试是评定测试质量的一种方法。详细而严
使用redis进行缓存加速极客李华 redis 缓存 redis 数据库
作者简介：一名后端开发人员，每天分享后端开发以及人工智能相关技术，行业前沿信息，面试宝典。座右铭：未来是不可确定的，慢慢来是最快的。个人主页：极客李华-CSDN博客合作方式：私聊+这个专栏内容：BAT等大厂常见后端java开发面试题详细讲解，更新数目100道常见大厂java后端开发面试题。我的CSDN社区：https://bbs.csdn.net/forums/99eb3042821a443286
【面试宝典】47道ES67高频题库整理(附答案背诵版) 想念@思恋面试宝典前端面试 es6 职场和发展
1.ES5、ES6（ES2015）有什么区别?ES5（ECMAScript5）和ES6（也称为ECMAScript2015）是JavaScript语言的两个版本，它们之间有一些重要的区别和改进：let和const关键字：ES6引入了let和const关键字来声明变量，以替代ES5中仅有的var。let允许声明块级作用域变量，而const是用于声明块级作用域的常量，这些都是ES5中不具备的特性。例子
Java面试宝典——Java基础知识总结 AI天才研究院 Java实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Java（发音：/dʒɑːvə/）是一种静态面向对象编程语言，最初由SunMicrosystems公司于1995年推出，并于1996年发布Java1.0版本，并在随后的几年里不断更新迭代，至今已经成为当代计算机通用编程语言中的首选。它拥有跨平台特性、安全性高、简单易用等特点，被广泛应用于开发Web应用、移动应用程序、分布式系统、嵌入式系统等领域。相对于其他语言，
Elasticsearch 性能优化面试宝典真实的菜 es elasticsearch 性能优化面试
Elasticsearch性能优化面试宝典目录设计调优️写入调优⚡查询调优综合设计总结设计调优️面试题1：索引设计优化题目：假设需要设计一个电商商品索引，日增数据量1TB，要求支持多维度查询（名称、分类、价格区间）。请说明索引设计的关键优化点。点击查看答案核心优化策略：分片策略按时间滚动分片（如products-2023-10），单分片控制在30-50GB冷热数据分离：热数据存SSD节点，冷数据存
Python面试宝典：1000加python面试题助你轻松捕获大厂Offer 脑洞笔记 python全栈面试宝典 python 面试开发语言
Python面试宝典：1000加python面试题助你轻松捕获大厂OfferPython面试宝典：1000加python面试题助你轻松捕获大厂Offer前言本书目录第一部分：Python基础第二部分：Python高级特性第三部分：实战模拟附录索引致谢Python面试宝典：1000加python面试题助你轻松捕获大厂Offer前言本书介绍在这个快速发展的技术世界中，Python已经成为了最受欢迎和最
一文细数大模型 RAG 十二大痛点及解决方案大模型与自然语言处理 NLP与大模型大模型深度学习人工智能自然语言处理算法 RAG 面试题
暑期实习基本结束了，校招即将开启。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。总结链接如下：《大模型面试宝典》(2024版)发布！喜欢本文记得收藏、关注、点赞。更多实战和面试交流，文末加入我们检索增强式生成（RAG）是一种使用检索提升语言模型的技术。具体
【信息化人员必备知识&面试宝典】一次完整的HTTP请求是怎样的？ DTcode7 IT信息技术相关 #信息化技能面试宝典技术常识前端面试宝典 IT信息化网络
【信息化人员必备知识&面试宝典】一次完整的HTTP请求是怎样的？HTTP请求基础什么是HTTP？请求与响应模型一次完整的HTTP请求流程步骤一：建立TCP连接步骤二：发送HTTP请求步骤三：服务器处理请求步骤四：发送HTTP响应步骤五：关闭连接或持续连接实战代码示例案例一：使用Python发起GET请求案例二：使用Node.js发起POST请求安全性与性能优化遇到问题的排查与解决结语在信息化的浪潮
【面试宝典】100道Spark高频题库整理(附答案背诵版) 想念@思恋面试宝典面试 spark 职场和发展
简述什么是Spark？Spark是一个开源的大数据处理框架，它被设计来进行高速度、通用性和易用性的大规模数据处理。Spark最初由加州大学伯克利分校的AMPLab开发，后来成为Apache软件基金会的顶级项目。Spark的主要特点包括：快速性：Spark使用了内存计算技术，相较于Hadoop的MapReduce，它能更快地处理大规模数据集。这是因为MapReduce在数据处理过程中频繁地将中间结果
CI/CD实战面试宝典：从构建到高可用性的全面解析 Mr.zat #面试 ci/cd 面试职场和发展
实战部署与配置请描述你设计和实现的一个CI/CDpipeline的完整流程，包括构建、测试、部署各个阶段。我设计的CI/CDpipeline通常包括以下几个阶段：代码提交：开发人员将代码提交到Git仓库，触发CI/CD流程。代码检查：运行静态代码分析工具（如SonarQube），检查代码质量和潜在问题。构建：使用构建工具（如Maven、Gradle）编译代码，打包生成可部署的工件（如Docker镜
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod