迭代器是可以迭代的对象。 在本教程中,您将了解迭代器的工作原理,以及如何使用__iter__和__next__方法构建自己的迭代器。
迭代器在Python中无处不在。 它们优雅地实现在循环,推导,生成器等中,但隐藏在明显的视觉中。
Python中的迭代器只是一个可以迭代的对象。一个将一次返回数据的对象或一个元素。
从技术上讲,Python迭代器对象必须实现两个特殊的方法__iter__()和__next__(),统称为迭代器协议。
如果我们从中获取一个迭代器,那么一个对象被称为iterable。 大多数Python中的内置容器是列表,元组,字符串等都是可迭代的。
iter()函数(这又调用__iter__()方法)返回一个迭代器。
通过Python中的迭代器迭代
使用next()函数来手动遍历迭代器的所有项目。当到达结束,没有更多的数据要返回时,它将会引发StopIteration。 以下是一个例子。
# define a listmy_list = [4, 7, 0, 3]# get an iterator using iter()my_iter = iter(my_list)## iterate through it using next() #prints 4print(next(my_iter))#prints 7print(next(my_iter))## next(obj) is same as obj.__next__()#prints 0print(my_iter.__next__())#prints 3print(my_iter.__next__())## This will raise error, no items leftnext(my_iter)
更优雅的自动迭代方式是使用for循环。 使用for循环可以迭代任何可以返回迭代器的对象,例如列表,字符串,文件等。
>>> for element in my_list:... print(element)... 4703
循环如何实际工作?
在上面的例子中看到的,for循环能够自动通过列表迭代。
事实上,for循环可以迭代任何可迭代对象。我们来仔细看一下在Python中是如何实现for循环的。
for element in iterable: # do something with element
实际上它是以类似下面的方式来实现的 -
# create an iterator object from that iterableiter_obj = iter(iterable)# infinite loopwhile True: try: # get the next item element = next(iter_obj) # do something with element except StopIteration: # if StopIteration is raised, break from loop break
所以在for的内部,for循环通过在可迭代的对象上调用iter()来创建一个迭代器对象iter_obj。
有意思的是,这个for循环实际上是一个无限循环~..~。
在循环中,它调用next()来获取下一个元素,并使用该值执行for循环的主体。 在所有对象耗尽后,引发StopIteration异常,内部被捕获从而结束循环。请注意,任何其他类型的异常都将正常通过。
在Python中构建自己的Iterator
构建迭代器在Python中很容易。只需要实现__iter__()和__next__()方法。
__iter__()方法返回迭代器对象本身。如果需要,可以执行一些初始化。
__next__()方法必须返回序列中的下一个项目(数据对象)。 在到达结束后,并在随后的调用中它必须引发StopIteration异常。
在这里,我们展示一个例子,在每次迭代中给出下一个2的几次方。 次幂指数从零开始到用户设定的数字。
class PowTwo: """Class to implement an iterator of powers of two""" def __init__(self, max = 0): self.max = max def __iter__(self): self.n = 0 return self def __next__(self): if self.n <= self.max: result = 2 ** self.n self.n += 1 return result else: raise StopIteration
现在可以创建一个迭代器,并通过它迭代如下 -
>>> a = PowTwo(4)>>> i = iter(a)>>> next(i)1>>> next(i)2>>> next(i)4>>> next(i)8>>> next(i)16>>> next(i)Traceback (most recent call last):...StopIteration
也可以使用for循环迭代那些迭代器类。
>>> for i in PowTwo(5):... print(i)... 12481632
Python无限迭代器
迭代器对象中的项目不必都是可耗尽的,可以是无限迭代器(永远不会结束)。 处理这样的迭代器时一定要小心。
下面是用来演示无限迭代器的一个简单的例子。
内置的函数iter()可以用两个参数来调用,其中第一个参数必须是可调用对象(函数),而第二个参数是标头。迭代器调用此函数,直到返回的值等于指定值。
>>> int()0>>> inf = iter(int,1)>>> next(inf)0>>> next(inf)0
可以看到,int()函数总是返回0,所以将它作为iter(int,1)传递将返回一个调用int()的迭代器,直到返回值等于1。这从来没有发生,所以这样就得到一个无限迭代器。
我们也可以建立自己的无限迭代器。 以下迭代器理论上将返回所有奇数。
class InfIter: """Infinite iterator to return all odd numbers""" def __iter__(self): self.num = 1 return self def __next__(self): num = self.num self.num += 2 return num
示例运行如下 -
>>> a = iter(InfIter())>>> next(a)1>>> next(a)3>>> next(a)5>>> next(a)7
当迭代这些类型的无限迭代器时,请注意指定终止条件。
使用迭代器的优点是它们可以节省资源。 如上所示,我们可以获得所有奇数,而不将整个系统存储在内存中。理论上,可以在有限的内存中计算有无限的项目。