Java集合框架的集合类,我们有时候称之为容器。容器的种类有很多种,比如ArrayList、LinkedList、HashSet...,每种容器都有自己的特点,ArrayList底层维护的是一个数组;LinkedList是链表结构的;HashSet依赖的是哈希表,每种容器都有自己特有的数据结构。
因为容器的内部结构不同,很多时候可能不知道该怎样去遍历一个容器中的元素。所以为了使对容器内元素的操作更为简单,Java引入了迭代器模式!
迭代器(Iterator)是一个对象,它的工作就是遍历并选择序列中的对象,它提供了一种访问容器(container)对象中的各个元素,而又不必暴露该对象内部细节的方法。
迭代器是一种设计模式,它是一个对象,它可以遍历并选择序列中的对象,而开发人员不需要了解该序列的底层结构 ( 迭代器把访问逻辑从不同类型的集合类中抽取出来,从而避免向外部暴露集合的内部结构)。
迭代器通常被称为“轻量级”对象,因为创建它的代价小。
Java中的Iterator功能比较简单,并且只能单向移动:
(1) 使用方法iterator()要求容器返回一个Iterator。第一次调用Iterator的next()方法时,它返回序列的第一个元素。注意:iterator()方法是java.lang.Iterable接口,被Collection继承。
(2) 使用next()获得序列中的下一个元素。
(3) 使用hasNext()检查序列中是否还有元素。
(4) 使用remove()将迭代器新返回的元素删除。
只要看看下面这个例子就一清二楚了:
import java.util.*;
public class Muster {
public static void main(String[] args) {
ArrayList list = new ArrayList();
list.add("a");
list.add("b");
list.add("c");
Iterator it = list.iterator();
while(it.hasNext()){
String str = (String) it.next();
System.out.println(str);
}
}
}
结果
a
b
c
可以看到,Iterator可以不用管底层数据具体是怎样存储的,都能够通过next()遍历整个List。
若不使用迭代器, 访问代码和集合本身是紧密耦合的,因此无法将访问逻辑从集合类和客户端代码中分离出来。而由于不同的集合会对应不同的遍历方法,所以客户端代码无法复用。在实际应用中如何将上面两个集合整合是相当麻烦的。
而对于Iterator来说,它总是用同一种逻辑来遍历集合,使得客户端自身不需要维护集合的内部结构,所有的内部状态都由Iterator来维护。也就是说,客户端不用直接和集合进行打交道,而是控制Iterator向它发送向前向后的指令,就可以遍历集合。
但是,具体是怎么实现的呢?背后机制究竟如何呢?
所有Iterator都最终实现接口Iterator,Iterator接口中包含三个基本方法,next(), hasNext(), remove(),其中对于List的遍历删除只能用Iterator的remove方法;
JDK1.8中java.util.Iterator接口的源码如下:
public interface Iterator {
boolean hasNext();
// JDK1.8的新特性,可以通过default在接口中写个方法的实现
default void remove() {
throw new UnsupportedOperationException("remove");
}
default void forEachRemaining(Consumer super E> action) {
Objects.requireNonNull(action);
while (hasNext())
action.accept(next());
}
}
下面将基于ArrayList的Iterator的实现分析Iterator的原理(基于JDK1.8):
在ArrayList类中有个方法iterator(),此方法将返回一个iterator的实现,这里可以看出实现类叫Itr,通过其它源码可知,此类是AarryList的内部类,即ArryList的Iterator实现在ArrayList内部;
public Iterator iterator() {
return new Itr();
}
这里我们来看看Java里ArrayList中实现类Itr类的源码:
private class Itr implements Iterator {
/**
* 下一个返回的位置
*/
int cursor = 0;
/**
* 当前操作的位置
*/
int lastRet = -1;
/**
* 类似版本号,检查List是否有更新
*/
int expectedModCount = modCount;
public boolean hasNext() { // 判断是否有下一个元素
return cursor != size();
}
public E next() { // 返回下一个元素
checkForComodification();
try {
int i = cursor; // cursor记录的是下一个元素,所以调用next时将返回的是cursor对应的元素
E next = get(i); // 记录需要返回的元素
lastRet = i; // 记录当前元素
cursor = i + 1; // 记录下一个元素
return next;
} catch (IndexOutOfBoundsException e) {
checkForComodification();
throw new NoSuchElementException();
}
}
public void remove() { // 移除元素
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification(); // 检查是否有更改,remove或者add
try {
AbstractList.this.remove(lastRet); // 删除当前元素
if (lastRet < cursor) // 删除了之后指标减1
cursor--;
lastRet = -1;
expectedModCount = modCount; // 保持版本号一致
} catch (IndexOutOfBoundsException e) {
throw new ConcurrentModificationException();
}
}
final void checkForComodification() { // 如果有更改则抛出ConcurrentModificationException异常
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
从上面代码中可以看出,对于Iterator的实现中主要有几个变量cursor,lastRest, expectedModCount三个变量,其中cursor将记录下一个位置,lastRet记录当前位置,expectedModCount记录没有修改的List的版本号。
问题:还记得说List中在iterator遍历的时候,不能随便添加和删除元素吗,这是为什么呢?
在iterator遍历的时候抛出异常都是checkForComodification()方法作的,根本原因是modCout和expectedModCount不相等,导致抛出异常
那为啥会不相等呢?
可以看看ArrayList的add和remove方法,
remove方法:
add方法:
从上面的代码中可以看出只要对ArrayList作了添加或删除操作都会增加modCount版本号,这样的意思是在迭代期间,会不断检查modCount和迭代器持有的expectedModCount两者是不是相等,如果不相等就抛出异常了。
这样在迭代器迭代期间不能对ArrayList作任何增删操作,但是可以通过iterator的remove作删除操作,从之前的代码可以看出,在iterator的remove()中有一行代码,expectedModCount = modCount; 这个赋值操作保证了iterator的remove是可用性的。
当然,iterator期间不能增删的根本原因是ArrayList遍历会不准,就像遍历数组的时候改变了数组的长度一样
弱一致性迭代器请见这篇文章
使用该机制的主要目的是为了实现ArrayList中的快速失败机制(fail-fast),在Java集合中较大一部分集合是存在快速失败机制的。
快速失败机制产生的条件:当多个线程对Collection进行操作时,若其中某一个线程通过Iterator遍历集合时,该集合的内容被其他线程所改变,则会抛出ConcurrentModificationException异常。
而上面我们说了实现了Iterable接口的类就可以通过Foreach遍历,那是因为foreach要依赖于Iterable接口返回的Iterator对象,所以从本质上来讲,Foreach其实就是在使用迭代器,在使用foreach遍历时对集合的结构进行修改,和在使用Iterator遍历时对集合结构进行修改本质上是一样的。所以同样的也会抛出异常,执行快速失败机制。
注:foreach是JDK1.5新增加的一个循环结构,foreach的出现是为了简化我们遍历集合的行为。
所以要保证在使用Iterator遍历集合的时候不出错误,就应该保证在遍历集合的过程中不会对集合产生结构上的修改。
如么如何解决这种错误呢?解决方法如下:
在遍历的过程中把需要删除的对象保存到一个集合中,等遍历结束之后再调用removeAll()方法来删除,或者使用iter.remove()方法。
以上主要介绍了单线程的解决方法,那么多线程访问容器的过程中抛出ConcurrentModificationException异常的话又该咋办呢?
每个方法都有不同的语境,因此它们没有绝对的好也没有绝对的坏,因此在效率上各有各的优势:
ArrayList对随机访问比较快,而for循环中使用的get()方法,采用的即是随机访问的方法,因此在ArrayList里for循环快。
LinkedList则是顺序访问比较快,Iterator中的next()方法采用的是顺序访问方法,因此在LinkedList里使用Iterator较快。
不过总的来说,这两种东西的好坏主要还是要依据集合的数据结构不同的判断。
Iterator只能正向遍历集合,适用于获取移除元素。ListIerator继承自Iterator,专门针对List,可以从两个方向遍历List,同时支持元素的修改
参考博客 :
https://blog.csdn.net/Searchin_R/article/details/85176311
https://www.cnblogs.com/hasse/p/5024193.html
https://blog.csdn.net/qq_36101933/article/details/82632137