容器类框架分析(3)(java)List 容器源码分析的补充--Vector 和 Stack

移步数据结构--容器汇总(java & Android)
内容:

  1. Vector 介绍及与 ArrayList 的区别
  2. ArrayList 与 LinkedList 的区别
  3. Stack 类的介绍及实现一个简单的 Stack
  4. SynchronizedList 与 Vector的区别


    容器类框架分析(3)(java)List 容器源码分析的补充--Vector 和 Stack_第1张图片
    image

1 Vector

  • Vector 是一个相当古老的 Java 容器类,始于 JDK 1.0,并在 JDK 1.2 时代对其进行修改,使其实现了 List 和 Collection 。从作用上来看,Vector 和 ArrayList 很相似,都是内部维护了一个可以动态变换长度的数组。
  • 但是他们的扩容机制却不相同。对于 Vector 的源码大部分都和 ArrayList 差不多,这里简单看下 Vector 的构造函数,以及 Vector 的扩容机制。
    Java容器类框架分析(1)ArrayList源码分析

1.1 构造函数

  • Vector 的构造函数可以指定内部数组的初始容量和扩容系数,如果不指定初始容量默认初始容量为 10,但是不同于 ArrayList 的是它在创建的时候就分配了容量为10的内存空间,而 ArrayList 则是在第一次调用 add 的时候才生成一个容量为 10 数组。
public Vector() {
   this(10);//创建一个容量为 10 的数组。
}
    
public Vector(int initialCapacity) {
   this(initialCapacity, 0);
}

public Vector(int initialCapacity, int capacityIncrement) {
   super();
   if (initialCapacity < 0)
       throw new IllegalArgumentException("Illegal Capacity: "+
                                          initialCapacity);
   this.elementData = new Object[initialCapacity];
   this.capacityIncrement = capacityIncrement;
}

// 此方法在 JDK 1.2 后添加
public Vector(Collection c) {
   elementData = c.toArray();//创建与参数集合长度相同的数组
   elementCount = elementData.length;
   // c.toArray might (incorrectly) not return Object[] (see 6260652)
   if (elementData.getClass() != Object[].class)
       elementData = Arrays.copyOf(elementData, elementCount, Object[].class);
}

1..2 扩容机制

private void grow(int minCapacity) {
   // overflow-conscious code
   int oldCapacity = elementData.length;
   // 如果我们没有指定扩容系数,那么 newCapacity = 2 * oldCapacity 
   // 如果我们指定了扩容系数,那么每次增加指定的容量
   int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                    capacityIncrement : oldCapacity);
   if (newCapacity - minCapacity < 0)
       newCapacity = minCapacity;
   if (newCapacity - MAX_ARRAY_SIZE > 0)
       newCapacity = hugeCapacity(minCapacity);
   elementData = Arrays.copyOf(elementData, newCapacity);
}
  • 由上边的方法结合我们的构造函数,我们便可知道 Vector 的需要扩容的时候,首先会判断 capacityIncrement 即在构造的 Vector 的时候时候指定了扩容系数,如果指定了则按照指定的系数来扩大容量,扩大后新的容量为 oldCapacity + capacityIncrement,如果没有指定capacityIncrement的大小,则默认扩大原来容量的一倍,这点不同于 ArrayList 的 0.5 倍长度
  • 对于 Vector 与 ArrayList 的区别最重要的一点是 Vector所有的访问内部数组的方法都带有synchronized,这意味着 Vector 是线程安全的,而ArrayList 并没有这样的特性。

1.3 elements()

  • 对于 Vector 而言,除了 for 循环,高级 for 循环,迭代的迭代方法外,还可以调用 elements() 返回一个 Enumeration 。
  • Enumeration 是一个接口,其内部只有两个方法hasMoreElements 和 nextElement,看上去和迭代器很相似,但是并没迭代器的 add remove,只能作用于遍历
public interface Enumeration {
    boolean hasMoreElements();
    E nextElement();
}
// Vector 的 elements 方法。
public Enumeration elements() {
   return new Enumeration() {
       int count = 0;

       public boolean hasMoreElements() {
           return count < elementCount;
       }

       public E nextElement() {
           synchronized (Vector.this) {
               if (count < elementCount) {
                   return elementData(count++);
               }
           }
           throw new NoSuchElementException("Vector Enumeration");
       }
   };
}
    

使用方法

Vector vector = new Vector<>();
vector.add("1");
vector.add("2");
vector.add("3");

Enumeration elements = vector.elements();

while (elements.hasMoreElements()){
  System.out.print(elements.nextElement() + " ");
}

事实上,这个接口也是很古老的一个接口,JDK 为了适配老版本,我们可以调用类似 Enumeration enumeration = Collections.enumeration(list); 来返回一个Enumeration 。其原理就是调用对应的迭代器的方法。

// Collections.enumeration 方法
public static  Enumeration enumeration(final Collection c) {
   return new Enumeration() {
        // 构造对应的集合的迭代器
       private final Iterator i = c.iterator();
        // 调用迭代器的 hasNext
       public boolean hasMoreElements() {
           return i.hasNext();
       }
       // 调用迭代器的 next
       public T nextElement() {
           return i.next();
       }
   };
}

1.4 Vector 与 ArrayList 的比较

  1. Vector 与 ArrayList 底层都是数组数据结构,都维护着一个动态长度的数组。
  2. Vector 对扩容机制在没有通过构造指定扩大系数的时候,默认增长现有数组长度的一倍。而 ArrayList 则是扩大现有数组长度的一半长度。
  3. Vector 是线程安全的, 而 ArrayList 不是线程安全的,在不涉及多线程操作的时候 ArrayList 要比 Vector 效率高
  4. 对于 Vector 而言,除了 for 循环,高级 for 循环,迭代器的迭代方法外,还可以调用 elements() 返回一个 Enumeration 来遍历内部元素。

2 Stack 介绍

由开始的继承体系可以知道 Stack 继承自 Vector,也就是 Stack 拥有 Vector 所有的增删改查方法。
我们先来看下栈的定义:

栈(stack)又名堆栈,它是一种运算受限的线性表。其限制是仅允许在表的一端进行插入和删除运算。这一端被称为栈顶,相对地,把另一端称为栈底。向一个栈插入新元素又称作进栈、入栈或压栈,它是把新元素放到栈顶元素的上面,使之成为新的栈顶元素;从一个栈删除元素又称作出栈或退栈,它是把栈顶元素删除掉,使其相邻的元素成为新的栈顶元素。

简单来说,栈这种数据结构有一个约定,就是向栈中添加元素和从栈中取出元素只允许在栈顶进行,而且先入栈的元素总是后取出。 我们可以用数组和链表来实现栈的这种数据结构的操作。

一般来说对于栈有一下几种操作:

  1. push 入栈
  2. pop 出栈
  3. peek 查询栈顶
  4. empty 栈是否为空

Java 中的 Stack 容器是以数组为底层结构来实现栈的操作的,通过调用 Vector 对应的添加删除方法来实现入栈出站操作。

// 入栈
public E push(E item) {
   addElement(item);//调用 Vector 定义的 addElement 方法

   return item;
}
// 出栈
public synchronized E pop() {
   E       obj;
   int     len = size();

   obj = peek();
   removeElementAt(len - 1);//调用 Vector 定义的 removeElementAt 数组末尾的元素的方法 

   return obj;
}
// 查询栈顶元素
public synchronized E peek() {
   int     len = size();

   if (len == 0)
       throw new EmptyStackException();
   return elementAt(len - 1);//查询数组最后一个元素。
}

上边简单介绍了 Java 容器中的 Stack 实现,但是事实上官方并不推荐在使用这些陈旧的集合容器类。对于栈从数据结构上而言,相对于线性表,其实现也存在,顺序存储(数组),非连续存储(链表)的实现方法。而我们文章最后看到的 Java容器类框架分析(2)LinkedList源码分析是可以取代 Stack来进行栈操作的。

public class SimpleStack {
    //默认容量
    private static final int DEFAULT_CAPACITY = 10;
    //栈中存放元素的数组
    private Object[] elements;
    //栈中元素的个数
    private int size = 0;
    //栈顶指针
    private int top;


    public SimpleStack() {
        this(DEFAULT_CAPACITY);
    }

    public SimpleStack(int initialCapacity) {
        elements = new Object[initialCapacity];
        top = -1;
    }

    public boolean isEmpty() {
        return size == 0;
    }

    public int size() {
        return size;
    }

    @SuppressWarnings("unchecked")
    public E pop() throws Exception {
        if (isEmpty()) {
            throw new EmptyStackException();
        }

        E element = (E) elements[top];
        elements[top--] = null;
        size--;
        return element;
    }

    @SuppressWarnings("unchecked")
    public E peek() throws Exception {
        if (isEmpty()) {
            throw new Exception("当前栈为空");
        }
        return (E) elements[top];
    }

    public void push(E element) throws Exception {
        //添加之前确保容量是否满足条件
        ensureCapacity(size + 1);
        elements[size++] = element;
        top++;
    }

    private void ensureCapacity(int minSize) {
        if (minSize - elements.length > 0) {
            grow();
        }
    }

    private void grow() {
        int oldLength = elements.length;
        // 更新容量操作 扩充为原来的1.5倍 这里也可以选择其他方案
        int newLength = oldLength + (oldLength >> 1);
        elements = Arrays.copyOf(elements, newLength);
    }
}

3 同步 vs 非同步

  • 对于 Vector 和 Stack 从源码上他们在对应的增删改查方法上都使用 synchronized关键字修饰了方法,这也就代表这个方法是同步方法,线程安全的。
  • 不过我们在介绍 ArrayList 和 LinkedList 的时候提及到了我们可以使用Collections 的静态方法,将一个 List 转化为线程同步的 List:
List synchronizedArrayList = Collections.synchronizedList(arrayList);
List synchronizedLinkedList = Collections.synchronizedList(linkedList);

那么这里又有一道面试题是这样问的:

请简述一下 Vector 和 SynchronizedList 区别,

SynchronizedList 即Collections.synchronizedList(arrayList); 后生成的List 类型,它本身是 Collections 一个内部类。

static class SynchronizedList
        extends SynchronizedCollection
        implements List {
   private static final long serialVersionUID = -7754090372962971524L;

   final List list;

   SynchronizedList(List list) {
       super(list);
       this.list = list;
   }
   SynchronizedList(List list, Object mutex) {
       super(list, mutex);
       this.list = list;
   }
   
   .....
}

对于 SynchronizedList 构造可以看到有一个 Object 的参数,但是看到 mutex 这个单词应该就明白了这个参数的含义了,就是同步锁,其实我们点击 super 方法可以看到,单个参数的构造函数锁就是其对象自身。

SynchronizedCollection(Collection c) {
       this.c = Objects.requireNonNull(c);
       mutex = this;
   }

SynchronizedCollection(Collection c, Object mutex) {
  this.c = Objects.requireNonNull(c);
  this.mutex = Objects.requireNonNull(mutex);
}

接下来我们看看增删改查方法吧:

   public E get(int index) {
       synchronized (mutex) {return list.get(index);}
   }
   public E set(int index, E element) {
       synchronized (mutex) {return list.set(index, element);}
   }
   public void add(int index, E element) {
       synchronized (mutex) {list.add(index, element);}
   }
   public E remove(int index) {
       synchronized (mutex) {return list.remove(index);}
   }

   public int indexOf(Object o) {
       synchronized (mutex) {return list.indexOf(o);}
   }
   public int lastIndexOf(Object o) {
       synchronized (mutex) {return list.lastIndexOf(o);}
   }

   public boolean addAll(int index, Collection c) {
       synchronized (mutex) {return list.addAll(index, c);}
   }
   //注意这里没加 synchronized(mutex)
   public ListIterator listIterator() {
       return list.listIterator(); // Must be manually synched by user
   }

   public ListIterator listIterator(int index) {
       return list.listIterator(index); // Must be manually synched by user
   }

可以很清楚的看到,让一个集合变成线程安全的,Collocations 只是包装了参数集合的增删改查方法,加了同步的限制。与 Vector 相比可以看出来,两者第一个区别在于是同步方法还是同步代码块,对于这两个区别如下:

  1. 同步代码块在锁定的范围上可能比同步方法要小,一般来说锁的范围大小和性能是成反比的。
  2. 同步块可以更加精确的控制锁的作用域(锁的作用域就是从锁被获取到其被释放的时间),同步方法的锁的作用域就是整个方法。

由上述两个方法看出来,``Collections.synchronizedList(arrayList);生成的同步集合看起来更高效一些,其实这种差异在 Vector 和 ArrayList上体现的很不明显,因为其 add 方法内部实现大致相同。而从构造参数上来看Vector不能像SynchronizedList` 一样指定加锁对象。

而我们也看到了 SynchronizedList 并没有给迭代器进行加锁,但是翻看 Vector 的迭代器方法确实枷锁的,所以我们在使用SynchronizedList的的迭代器的时候需要手动做同步处理:

  synchronized (list) {
    Iterator i = list.iterator(); // Must be in synchronized block
    while (i.hasNext())
        foo(i.next());
 }

至此我们可以总结出 SynchronizedList与 Vector的三点差异:

  1. SynchronizedList 作为一个包装类,有很好的扩展和兼容功能。可以将所有的 List 的子类转成线程安全的类。
  2. 使用 SynchronizedList 的获取迭代器,进行遍历时要手动进行同步处理,而 Vector 不需要。
  3. SynchronizedList 可以通过参数指定锁定的对象,而 Vector 只能是对象本身。

参考

Java List 容器源码分析的补充

你可能感兴趣的:(容器类框架分析(3)(java)List 容器源码分析的补充--Vector 和 Stack)