深入Java基础(三)--集合(1)集合父类以及父接口源码及理解

这个系列的三将开启集合源码阅读,以及总结java集合api注意点和使用建议。好,废话不多说,开始吧。

本系列以前的文章:

(1) 深入Java基础(一)——基本数据类型及其包装类

(2)深入Java基础(二)——字符串家族


文章结构:(1)集合整体概述;(2)分析Collection继承树;(3)注意点(包括迭代器的使用细节)


一、集合整体概述

深入Java基础(三)--集合(1)集合父类以及父接口源码及理解_第1张图片
这里写图片描述

补充map的继承树,它依赖于collection接口

深入Java基础(三)--集合(1)集合父类以及父接口源码及理解_第2张图片
这里写图片描述

Collection是一个接口,是高度抽象出来的集合,它包含了集合的基本操作和属性。

可以看出 Collection包含了List、Set、Queue三大分支

(1)List:1.代表有序、重复的集合。2.像一个数组,可以记住每次添加元素的顺序(要以对象的形式来理解),且长度是可变的。3.访问的时候根据元素的索引值来访问。

(2)Set:1.代表无序、不可重复的集合。2.就像一个罐子,但元素单独存在。访问元素只能根据元素本身来访问。3.元素不可以重复

(3)Queue:1.代表队列集合。2.直接对应数据结构的队列。3.LinkedList类实现了Queue接口,因此我们可以把LinkedList当成Queue来用。

(4)Map:1.是一个映射接口,即key-value键值对。Map中的每一个元素包含“一个key”和“key对应的value”。2.AbstractMap是个抽象类,它实现了Map接口中的大部分API。而HashMap,TreeMap,WeakHashMap都是继承于AbstractMap。3. Hashtable虽然继承于Dictionary,但它实现了Map接口。


二、分析Collection继承树:

(1)先来大致看下标记是可遍历的接口:Iterable

Iterable此接口的目的:实现了这个接口的集合对象支持迭代,是可迭代的。而Iterator则是迭代器,它就是提供迭代机制的对象,具体如何迭代,都是Iterator接口规范的。Spliterator就是一个并行遍历的接口。

public interface Iterable {
//这个目的是:返回传来的T类型的元素上的一个迭代器
    Iterator iterator();
    //这个是Java8的新特性:Default方法是指,在接口内部包含了一些默认的方法实现(也就是接口中可以包含方法体,这打破了Java之前版本对接口的语法限制),从而使得接口在进行扩展的时候,不会破坏与接口相关的实现类代码
     /** 
     翻译哦:
     * 对这个Iterable的每一个元素执行给定的动作,直到所有元素都被处理或者动作抛出一个异常 
     * 为止。除非被实现类指定,动作将以迭代的顺序执行(如果一个迭代的顺序被指定)。被动作 
     * 抛出的异常将被传递给调用者 
     */  
    default void forEach(Consumer action) {
        Objects.requireNonNull(action);
        for (T t : this) {
            action.accept(t);
        }
    }
    /** 
    直译了,再往上的Spliterator接口也就是跟Iterator差不多,不过它是并行遍历的。
    Spliterator: https://segmentfault.com/q/1010000007087438
     * 创建一个被这个Iterable接口描述的元素上Spliterator。 
     *  
     * 默认实现从iterable的Iterator中创建一个早期绑定的spliterator。这个spliterator 
     * 继承iterable的iterator的fail-fast性质。 
     *  
     * 默认实现应该总是被重写。被默认实现返回的spliterator拥有不好分解能力,是不依据指定 
     * 大小定制的,而且不报告任何spliterator的性质。实现类差不多总是能提供更好的实现。 
     */  
    default Spliterator spliterator() {
        return Spliterators.spliteratorUnknownSize(iterator(), 0);
    }
}
//这个就是迭代器啦
public interface Iterator {
    boolean hasNext();//每次next之前,先调用此方法探测是否迭代到终点,判断是否要去下一个
    E next(); //返回当前迭代元素 ,同时,迭代游标后移
    //删除最近一次已近迭代出出去的那个元素。只有当next执行完后,才能调用remove函数。比如你要删除第一个元素,不能直接调用 remove()而要先next一下( );在没有先调用next 就调用remove方法是会抛出异常的。
    default void remove() {
        throw new UnsupportedOperationException("remove");
    }
    //也是1.8后的特性,支持lamdba表达式,主要是遍历游标后面的数据,按照所给的action去呈现,遍历。
     default void forEachRemaining(Consumer action) {
        Objects.requireNonNull(action);
        while (hasNext())
            action.accept(next());
    }
}

(2)跟着继承树往下看就是Collection接口啦:

可以看出:一个高度抽象出来的集合,包含了集合的基本操作:添加、删除、清空、遍历、是否为空、获取大小等。Collection接口的所有子类(直接子类和间接子类)都必须实现2种构造函数:不带参数的构造函数和参数为Collection的构造函数。带参数的构造函数可以用来转换Collection的类型。

//这是接口,不是实现的地方,所以是一系列的规范
public interface Collection extends Iterable {
    int size();//返回大小的方法
    boolean isEmpty();//判空方法
    boolean contains(Object o);//判是否存在方法
    Iterator iterator();//迭代器
    Object[] toArray();//把集合转成数组
     T[] toArray(T[] a); //*返回包含此 collection 中所有元素的数组;返回数组的运行时类型与指定数组的运行时类型相同。
    boolean add(E e);//加入元素,返回决定失败还是成功
    boolean remove(Object o);//同样删除元素,返回决定失败还是成功
    boolean containsAll(Collection c);//同上,只是判别对象变了而已
    boolean addAll(Collection c);//同上
    boolean removeAll(Collection c);//同上
    //Java8搞的事情:删除所有该集合的元素,满足给定的预测。该方法将会批量删除符合filter条件的所有元素,该方法需要一个Predicate对象作为作为参数,Predicate也是函数式接口,因此可使用Lambda表达式作为参数。
    default boolean removeIf(Predicate filter) {
        Objects.requireNonNull(filter);
        boolean removed = false;
        final Iterator each = iterator();
        while (each.hasNext()) {
            if (filter.test(each.next())) {
                each.remove();
                removed = true;
            }
        }
        return removed;
    }
    //用于从列表中移除未包含在指定collection中的所有元素,返回值:如果List集合对象由于调用retainAll方法而发生更改,则返回 true。
    boolean retainAll(Collection c);
    //全清咯
    void clear();
    //下面的两个方法都是object类过来的,从而要覆写的存在。
    boolean equals(Object o);
    int hashCode();
    //在Iterable接口中有大致讲解
     @Override
    default Spliterator spliterator() {
        return Spliterators.spliterator(this, 0);
    }
    //也是Java8搞的事情:给予博客:http://www.cnblogs.com/guguli/p/4396093.html
     default Stream stream() {
        return StreamSupport.stream(spliterator(), false);
    }
    default Stream parallelStream() {
        return StreamSupport.stream(spliterator(), true);
    }
}

(3)还有一个抽象类呢:AbstractCollection

它实现了Collection中除了iterator()和size()之外的所有方法。AbstractCollection的主要作用是方便其他类实现Collection.,比如ArrayList、LinkedList等。它们想要实现Collection接口,通过集成AbstractCollection就已经实现大部分方法了,再实现一下iterator()和size()即可。

但是要注意一个东西,默认不支持添加单个元素,所以它的add()本身的实现是直接抛UnsupportedOperationException异常的。实际上add()是一种“可选操作”,目的是延迟到需要时再实现,也就是说子类想自己去添加单个的话需要自己去实现啦!!!

//讲些有趣的重要常用的咯。
public abstract class AbstractCollection implements Collection {
//上面说过,用collection接口都要两个构造器咯
    protected AbstractCollection() {
    }
    //迭代的根据自己的子类的不同从而实现自己的迭代!!!
    public abstract Iterator iterator();
    public abstract int size();
    //判空
    public boolean isEmpty() {
        return size() == 0;
    }
    //判是否存在方法
    public boolean contains(Object o) {
        Iterator it = iterator();
        if (o==null) {
            while (it.hasNext())//从这里可以看出,任何非空集合都包含null 
                if (it.next()==null)
                    return true;
        } else {
            while (it.hasNext())
                if (o.equals(it.next()))
                    return true;
        }
        return false;
    }
     /*接口规定的,将集合转变成数组*/  
    public Object[] toArray() {
        Object[] r = new Object[size()];//创建与集合大小相同的数组  
        Iterator it = iterator();
        for (int i = 0; i < r.length; i++) {
            if (! it.hasNext())
                return Arrays.copyOf(r, i);//第二个参数是待copy的长度,如果这个长度大于r,则保留r的长度  
            r[i] = it.next();
        }
        return it.hasNext() ? finishToArray(r, it) : r;
    }
    //同上,不过参数是泛型而已。引入泛型模板机制后的新调用方法,也就是明确了类型而转换。
     public  T[] toArray(T[] a) {
        // Estimate size of array; be prepared to see more or fewer elements
        int size = size();
        T[] r = a.length >= size ? a :
                  (T[])java.lang.reflect.Array
                  .newInstance(a.getClass().getComponentType(), size);
        Iterator it = iterator();

        for (int i = 0; i < r.length; i++) {
            if (! it.hasNext()) { // fewer elements than expected
                if (a == r) {
                    r[i] = null; // null-terminate
                } else if (a.length < i) {
                    return Arrays.copyOf(r, i);
                } else {
                    System.arraycopy(r, 0, a, 0, i);
                    if (a.length > i) {
                        a[i] = null;
                    }
                }
                return a;
            }
            r[i] = (T)it.next();
        }
        // more elements than expected
        return it.hasNext() ? finishToArray(r, it) : r;
    }
    //最大的数组分配容量
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
    //两个参数r和it分别是toArray方法中放置集合元素的对象数组和迭代器
    private static  T[] finishToArray(T[] r, Iterator it) {
        int i = r.length;//初始数组大小
        while (it.hasNext()) {//第一次进入该while循环,那么就会分配一个更大的数组(增加一半的大小,注意可能会溢出,这里处理了分配超大数组的情况)
            int cap = r.length;
            if (i == cap) {
                int newCap = cap + (cap >> 1) + 1;//分配更大的数组
                // overflow-conscious code
                if (newCap - MAX_ARRAY_SIZE > 0)//一旦超过,还会继续分配大数组。最后只返回i个元素(即迭代器中元素个数)对应的数组
                    newCap = hugeCapacity(cap + 1);
                r = Arrays.copyOf(r, newCap);//扩容机制:然后将原来数组r中的元素拷贝到新数组中,后续将元素放置在扩容数组中,一旦超过,还会继续分配大数组。
            }
            r[i++] = (T)it.next();
        }
        // trim if overallocated
        return (i == r.length) ? r : Arrays.copyOf(r, i);
    }
    //分配大型数组时的异常处理
    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError
                ("Required array size too large");
                // MAX_ARRAY_SIZE的值是0x7ffffff7,如果需要分配的数组过大,可能导致内存溢出
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }
    //添加一个元素的add的默认实现总是抛出该异常。因为不支持添加一个元素,子类想实现就要自己去覆写
    public boolean add(E e) {
        throw new UnsupportedOperationException();
    }
     // 删除对象o ,使用迭代器去删除,也就是迭代过程中删除。问题根源文章:http://blog.csdn.net/qh_java/article/details/50154405 。一会还会详解这个问题。
    public boolean remove(Object o) {
        Iterator it = iterator();
        if (o==null) {
            while (it.hasNext()) {
                if (it.next()==null) {
                    it.remove();
                    return true;
                }
            }
        } else {
            while (it.hasNext()) {
                if (o.equals(it.next())) {
                    it.remove();
                    return true;
                }
            }
        }
        return false;
    }
    // 判断是否包含集合c中所有元素  
    public boolean containsAll(Collection c) {
        for (Object e : c)
            if (!contains(e))
                return false;
        return true;
    }
    //添加另一个集合中的所有元素addAll。!!!!这里是要求子类实现该类时如果需要调用addAll方法的话必须自己覆盖add操作。
    public boolean addAll(Collection c) {
        boolean modified = false;
        for (E e : c)
            if (add(e))
                modified = true;
        return modified;
    }
    //下面两个方法的时间复杂度都是O(this.size() * c.size())。
      //删除集合c中所有元素(如果存在的话)
    public boolean removeAll(Collection c) {
        Objects.requireNonNull(c);
        boolean modified = false;
        Iterator it = iterator();
        while (it.hasNext()) {
            if (c.contains(it.next())) {
                it.remove();
                modified = true;
            }
        }
        return modified;
    }
    //取得两个List的交集的方法
    public boolean retainAll(Collection c) {
        Objects.requireNonNull(c);
        boolean modified = false;
        Iterator it = iterator();
        while (it.hasNext()) {
            if (!c.contains(it.next())) {
                it.remove();
                modified = true;
            }
        }
        return modified;
    }
    //迭代清楚集合数据
    public void clear() {
        Iterator it = iterator();
        while (it.hasNext()) {
            it.next();
            it.remove();
        }
    }
    //将集合元素显示成[String] 
    public String toString() {
        Iterator it = iterator();
        if (! it.hasNext())
            return "[]";

        StringBuilder sb = new StringBuilder();
        sb.append('[');
        for (;;) {
            E e = it.next();
            sb.append(e == this ? "(this Collection)" : e);
            if (! it.hasNext())
                return sb.append(']').toString();
            sb.append(',').append(' ');
        }
    }
}

三、我们来讲下集合的一些注意点:

(1)迭代器:

迭 代器是一种设计模式,它是一个对象,它可以遍历并选择序列中的对象,而开发人员不需要了解该序列的底层结构。迭代器通常被称为“轻量级”对象,因为创建它的代价小。在Collection集合中都会实现Iterator,因此可以通过iterator()函数获得一个iterator对象,然后就可以利用提供的函数进行相应的输出操作。而ListIterator迭代器是一个另类迭代器,允许对容器中的元素进行双向遍历。

注意:使用集合子类的迭代器,我们是可以在遍历中进行删除操作的喔!!!!

在遍历的过程中,不允许对集合进行增删操作。如果想要对集合进行删除操作,也必须调用迭代器的remove()方法!其实是那个集合子类重写过的remove方法的处理!!例子如下:

能边遍历边删除原因是:子类重写remove实现拷贝跟AbstractCollection中的remove是不一样的!

public class IteratorTest {
    public static void main(String[] args) {
        // TODO Auto-generated method stub
        List list=new ArrayList();//创建一个线性表   
        list.add("a");
        list.add("#");
        list.add("b");
        list.add("#");
        list.add("c");
        list.add("#");

        Iterator it=list.iterator();//返回线性表的迭代器
        while(it.hasNext())   //遍历线性表 ,先检查是否还有元素可以迭代
        {
            String element=(String) it.next();//取出迭代的元素
            if("#".equals(element))//如果元素=="#",则删除
            {
                it.remove();//true 
                //这个remove方法是ArrayList重写过的remove方法,是经过拷贝的一个处理。将在下一篇文章ArrayList源码解析中重点讲解
            }
            System.out.println(element);
        }
        System.out.println(list);
    }
}
//输出是abc

Collection的remove导致的线程错误:也就是AbstractCollection中的remove

//将会出现Exception in thread "main" java.util.ConcurrentModificationException
public class IteratorTest4 {
    public static void main(String args[]) {
        List list = new ArrayList<>();
        list.add("a");
        list.add("b");
        list.add("c");
        list.add("d");
        //单纯的使用,真单纯。边遍历边删除,错死你!!
        for (String s : list) {
            if (s.equals("b")) {
                list.remove(s);
            }
        }
    }
}

原因就要对比源码去看了嘛。AbstractCollection中的remove

//单纯的边遍历边删除,它就搞死你咯,,像银行取钱,没有做处理。线程就会抢占。
public boolean remove(Object o) {
        Iterator it = iterator();
        if (o==null) {
            while (it.hasNext()) {
                if (it.next()==null) {
                    it.remove();
                    return true;
                }
            }
        } else {
            while (it.hasNext()) {
                if (o.equals(it.next())) {
                    it.remove();
                    return true;
                }
            }
        }
        return false;
    }

好了,深入Java基础(三)--集合(1)集合父类以及父接口源码及理解讲完了。本博客是这个系列的第三篇,讲得是Collection的基础先,然后会根据我们常用的集合子类去分析源码,分享经验给大家。欢迎在下面指出错误,共同学习!!你的点赞是对我最好的支持!!

更多内容,可以访问JackFrost的博客

你可能感兴趣的:(深入Java基础(三)--集合(1)集合父类以及父接口源码及理解)