chapter14 可迭代的对象,迭代器跟生成器

Python中,所有的集合都可以迭代。在语言内部中,迭代器主要用于:

  • for循环
  • 构建和扩展集合类型
  • 逐行遍历文件文本
  • 列表推导,字典推导跟集合推导
  • 元组拆包
  • 调用函数时,用*拆包实参

序列可以迭代的原因: iter函数

解释器需要迭代对象x时,会自动调用iter(x).
内置的iter函数有以下作用:

  1. 检查对象是否实现了__iter__方法,如果实现了就调用它,获取一个迭代器.
  2. 如果没有__iter__方法,寻找__getitem__方法,尝试按照顺序(index为0开始)获取元素.
  3. 如果都没有,python抛出TypeError异常.提示"x object is not iterable. x为目标对象所属的类. 在白鹅类型理论中,可迭代对象的定义更为简单,实现了iter方法即可.因为abc.Iterable类实现了subclasshook`方法。

标准的迭代器接口有两个方法

__next__: 返回下一个可用的元素。如无,则抛出StopIteration异常。在collections.abc.Iterator抽象基类中定义。继承自Iterable类.
__iter__: 返回self,以便在应该使用可迭代对象的地方使用迭代器。例如for循环中。定义在Iterable类中.

chapter14 可迭代的对象,迭代器跟生成器_第1张图片
uml类图

迭代器定义

迭代器是这样的对象:实现了无参数的__next__方法,返回序列中的下一个元素,如没有元素了,就抛出StopIteration异常.
Python中的迭代器还实现了__iter__方法,所有迭代器也可以迭代.

可迭代对象与迭代器的对比

python从可迭代对象中获取迭代器。
要知道

  • 可迭代对象有个__iter__方法,每次都实例化一个新的迭代器;
  • 而迭代器要实现__next__ 方法,返回单个元素,还要实现__iter__方法,返回迭代器本身。
    因此,迭代器可以迭代,但是可迭代对象不是迭代器。
    两个结论:
  • 可迭代的对象一定不能是自身的迭代器,也就是说,可迭代的对象必须实现__iter__方法,但不能实现__next__ 方法
  • 另一方面,迭代器应该一直可以迭代,所有迭代器的__iter__方法应该返回自身。

生成器函数

生成器函数的工作原理

只要python函数的定义体中有yield关键字,该函数就是生成器函数。

生成器表达式

可以理解为列表推导的惰性版本。是制造生成器的工厂。

何时使用生成器表达式

当生成器函数比较简单时。

python中的自带生成器函数。

  • 用于过滤
  • 用于映射
  • 合并多个可迭代对象
  • 用于重新排列元素的生成器函数

新语法 yield from

如果生成器函数需要产出另一个生成器生成的值,传统方法是使用嵌套的for循环.
yield from 其实就是代替了内部的for循环.获取到内部生成器产生的值
常用在协程上。

可迭代的归约函数

chapter14 可迭代的对象,迭代器跟生成器_第2张图片
image.png

深入分析iter函数

可以传入两个参数。第一个参数必须是可调用的对象,用于不断调(该对象没有参数), 产出各个值,第二个值可以看做是个终止条件,当第一个参数对象调用返回改值时。迭代器抛出StopIteration异常。停止迭代。

你可能感兴趣的:(chapter14 可迭代的对象,迭代器跟生成器)