Java中 ( Iterator ) 迭代器 详解 ( JDK8源码 )

Java集合框架的集合类,我们有时候称之为容器。容器的种类有很多种,比如ArrayList、LinkedList、HashSet...,每种容器都有自己的特点,ArrayList底层维护的是一个数组;LinkedList是链表结构的;HashSet依赖的是哈希表,每种容器都有自己特有的数据结构。

因为容器的内部结构不同,很多时候可能不知道该怎样去遍历一个容器中的元素。所以为了使对容器内元素的操作更为简单,Java引入了迭代器模式! 

那什么是迭代器呢?

迭代器(Iterator)是一个对象,它的工作就是遍历并选择序列中的对象,它提供了一种访问容器(container)对象中的各个元素,而又不必暴露该对象内部细节的方法。

迭代器是一种设计模式,它是一个对象,它可以遍历并选择序列中的对象,而开发人员不需要了解该序列的底层结构 ( 迭代器把访问逻辑从不同类型的集合类中抽取出来,从而避免向外部暴露集合的内部结构)。

迭代器通常被称为“轻量级”对象,因为创建它的代价小。

  Java中的Iterator功能比较简单,并且只能单向移动

  (1) 使用方法iterator()要求容器返回一个Iterator。第一次调用Iterator的next()方法时,它返回序列的第一个元素。注意:iterator()方法是java.lang.Iterable接口,被Collection继承。

  (2) 使用next()获得序列中的下一个元素。

  (3) 使用hasNext()检查序列中是否还有元素。

  (4) 使用remove()将迭代器新返回的元素删除。

只要看看下面这个例子就一清二楚了:

import java.util.*;
public class Muster {
 
    public static void main(String[] args) {
        ArrayList list = new ArrayList();
        list.add("a");
        list.add("b");
        list.add("c");
        Iterator it = list.iterator();
        while(it.hasNext()){
            String str = (String) it.next();
            System.out.println(str);
        }
    }
}

 结果

a
b
c

 可以看到,Iterator可以不用管底层数据具体是怎样存储的,都能够通过next()遍历整个List。

为啥要用Iterator?

若不使用迭代器, 访问代码和集合本身是紧密耦合的,因此无法将访问逻辑从集合类和客户端代码中分离出来。而由于不同的集合会对应不同的遍历方法,所以客户端代码无法复用。在实际应用中如何将上面两个集合整合是相当麻烦的。

而对于Iterator来说,它总是用同一种逻辑来遍历集合,使得客户端自身不需要维护集合的内部结构,所有的内部状态都由Iterator来维护。也就是说,客户端不用直接和集合进行打交道,而是控制Iterator向它发送向前向后的指令,就可以遍历集合。

实现原理

但是,具体是怎么实现的呢?背后机制究竟如何呢?

所有Iterator都最终实现接口Iterator,Iterator接口中包含三个基本方法,next(), hasNext(), remove(),其中对于List的遍历删除只能用Iterator的remove方法;

JDK1.8中java.util.Iterator接口的源码如下:

public interface Iterator {

    boolean hasNext();

    // JDK1.8的新特性,可以通过default在接口中写个方法的实现
    default void remove() {
        throw new UnsupportedOperationException("remove");
    }
    
    default void forEachRemaining(Consumer action) {
        Objects.requireNonNull(action);
        while (hasNext())
            action.accept(next());
    }
}

下面将基于ArrayList的Iterator的实现分析Iterator的原理(基于JDK1.8):

在ArrayList类中有个方法iterator(),此方法将返回一个iterator的实现,这里可以看出实现类叫Itr,通过其它源码可知,此类是AarryList的内部类,即ArryList的Iterator实现在ArrayList内部;

public Iterator iterator() {
        return new Itr();
    }

这里我们来看看Java里ArrayList中实现类Itr类的源码:

private class Itr implements Iterator {
        /**
         * 下一个返回的位置
         */
        int cursor = 0;
 
        /**
         * 当前操作的位置
         */
        int lastRet = -1;
 
        /**
         * 类似版本号,检查List是否有更新
         */
        int expectedModCount = modCount;
 
        public boolean hasNext() {      // 判断是否有下一个元素
            return cursor != size();
        }
 
        public E next() {  // 返回下一个元素
            checkForComodification();
            try {
                int i = cursor;     // cursor记录的是下一个元素,所以调用next时将返回的是cursor对应的元素
                E next = get(i);    //  记录需要返回的元素
                lastRet = i;        // 记录当前元素
                cursor = i + 1;     // 记录下一个元素
                return next;
            } catch (IndexOutOfBoundsException e) {
                checkForComodification();
                throw new NoSuchElementException();
            }
        }
 
        public void remove() {       // 移除元素
            if (lastRet < 0)
                throw new IllegalStateException();
            checkForComodification();     //   检查是否有更改,remove或者add
 
            try {
                AbstractList.this.remove(lastRet);   // 删除当前元素  
                if (lastRet < cursor)                // 删除了之后指标减1
                    cursor--;
                lastRet = -1;                    
                expectedModCount = modCount;         // 保持版本号一致
            } catch (IndexOutOfBoundsException e) {
                throw new ConcurrentModificationException();
            }
        }
 
        final void checkForComodification() {    // 如果有更改则抛出ConcurrentModificationException异常
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
        }

从上面代码中可以看出,对于Iterator的实现中主要有几个变量cursor,lastRest, expectedModCount三个变量,其中cursor将记录下一个位置,lastRet记录当前位置,expectedModCount记录没有修改的List的版本号

问题:还记得说List中在iterator遍历的时候,不能随便添加和删除元素吗,这是为什么呢?

在iterator遍历的时候抛出异常都是checkForComodification()方法作的,根本原因是modCout和expectedModCount不相等,导致抛出异常

那为啥会不相等呢?

可以看看ArrayList的add和remove方法,

remove方法:

这里写图片描述

add方法:

这里写图片描述

从上面的代码中可以看出只要对ArrayList作了添加或删除操作都会增加modCount版本号,这样的意思是在迭代期间,会不断检查modCount和迭代器持有的expectedModCount两者是不是相等,如果不相等就抛出异常了。

这样在迭代器迭代期间不能对ArrayList作任何增删操作,但是可以通过iterator的remove作删除操作,从之前的代码可以看出,在iterator的remove()中有一行代码,expectedModCount = modCount; 这个赋值操作保证了iterator的remove是可用性的。

当然,iterator期间不能增删的根本原因是ArrayList遍历会不准,就像遍历数组的时候改变了数组的长度一样

弱一致性迭代器请见这篇文章

使用该机制的主要目的是为了实现ArrayList中的快速失败机制(fail-fast),在Java集合中较大一部分集合是存在快速失败机制的。

快速失败机制产生的条件:当多个线程对Collection进行操作时,若其中某一个线程通过Iterator遍历集合时,该集合的内容被其他线程所改变,则会抛出ConcurrentModificationException异常。

而上面我们说了实现了Iterable接口的类就可以通过Foreach遍历,那是因为foreach要依赖于Iterable接口返回的Iterator对象,所以从本质上来讲,Foreach其实就是在使用迭代器,在使用foreach遍历时对集合的结构进行修改,和在使用Iterator遍历时对集合结构进行修改本质上是一样的。所以同样的也会抛出异常,执行快速失败机制。

注:foreach是JDK1.5新增加的一个循环结构,foreach的出现是为了简化我们遍历集合的行为。

所以要保证在使用Iterator遍历集合的时候不出错误,就应该保证在遍历集合的过程中不会对集合产生结构上的修改。

如么如何解决这种错误呢?解决方法如下:

在遍历的过程中把需要删除的对象保存到一个集合中,等遍历结束之后再调用removeAll()方法来删除,或者使用iter.remove()方法。


以上主要介绍了单线程的解决方法,那么多线程访问容器的过程中抛出ConcurrentModificationException异常的话又该咋办呢?

  • 在JDK1.5版本中引入了线程安全的容器,比如ConcurrentHashMap和CopyOnWriteArrayList等,可以使用这些线程安全的容器来代替非线程安全的容器。
    ConcurrentHashMap: https://blog.csdn.net/q5706503/article/details/85171474
  • 在使用迭代器遍历容器的时候对容器的操作放到synchronized代码块中,但是当引用程序并发成都比较高的时候,这会严重影响程序的性能。

for循环与迭代器的比较

每个方法都有不同的语境,因此它们没有绝对的好也没有绝对的坏,因此在效率上各有各的优势:

ArrayList对随机访问比较快,而for循环中使用的get()方法,采用的即是随机访问的方法,因此在ArrayList里for循环快。
LinkedList则是顺序访问比较快,Iterator中的next()方法采用的是顺序访问方法,因此在LinkedList里使用Iterator较快。
不过总的来说,这两种东西的好坏主要还是要依据集合的数据结构不同的判断。

Iterator与ListIterator有什么区别?

Iterator只能正向遍历集合,适用于获取移除元素。ListIerator继承自Iterator,专门针对List,可以从两个方向遍历List,同时支持元素的修改

 

参考博客 :

https://blog.csdn.net/Searchin_R/article/details/85176311

https://www.cnblogs.com/hasse/p/5024193.html

https://blog.csdn.net/qq_36101933/article/details/82632137

你可能感兴趣的:(JAVA)