迭代机制

可迭代对象、迭代器、生成器、生成式区别

a. 可迭代对象:

一个对象能够被迭代的使用,这个对象就是可迭代对象

容器是一种把多个元素组织在一起的数据结构,容器中的元素可以逐个的迭代获取,容器本身实际
上并不支持取出元素的功能,而是由可迭代对象赋予了容器这种能力,比如列表中的元素获取,元
祖、字典、集合等;

python数据类型中,除了整型的基本数据类型都是可迭代对象,包括文件对象,python内部定义一个对象是不是可迭代对象的依据是,该对象是否存在__iter__()对象方法。

所以判断一个对象是否是可迭代对象的方法有:
方法一:
from collections import Iterable
isinstance(obj,Iterable) # 返回True表明是可迭代对象

方法二:
hasattr(obj,'__iter__')  # 返回True表明是可迭代对象
因此:可以通过添加__iter__()方法让一个类的实列变为可迭代对象

b. 迭代器:

迭代器也是一种容器,并且是可迭代对象,因为迭代器是有_iter_()方法的,迭代器与可迭代对象的区别就在于,迭代器有_next_()方法,而单纯的可迭代对象并没有这个方法

判断对象是是否是迭代器:
方法一:
from collections import iterator
isinstance(boj,Iterator)  # 返回True表明是迭代器
 
方法二:
hasattr(obj,'__next__')  # 返回True表明是迭代器

迭代器可以通过内置函数next(obj)和obj.__next__()方法获取迭代器的下一个值,当迭代器的值
取完了之后,再取会抛出StopIteration错误,但是可迭代对象并不能使用这两个方法

c. 生成器(本质上来说就是一个迭代器):

一个利用yield返回结果的函数就是一个生成器,用iter(iterable)也可以生成一个生成器

一般的函数在执行完毕之后会返回一个值然后退出,但是生成器函数会自动挂起,待下一次调用时,
会在上次结束位置继续执行,实现了延迟计算,省内存

斐波那契数列:
def fib(max):
    n,a,b =0,0,1
    while n < max:
        yield b
        a,b =b,a+b
        n = n+1
    return 'done'
 
a = fib(10)  # 先调用生成器函数保存为迭代器对象,再获取元素,如果直接next(fib(10)),无论多少次next,只会拿到第一次元素
for i in a:
    print(i)

d.生成式

生成式是一种简单的生成器,返回一个迭代器对象,来源于迭代和列表解析的组合

列表解析式:
a = [i for i in range(10)]

生成式:
b = (i for i in range(10))

a和b主要有两点区别,第一就是a占用的内存比b大,第二就是a是通过遍历或者下标
获取元素,b是通过遍历或者next获取元素

e. for循环的遍历机制:

可迭代对象是不可以直接从其中获取元素的,for i in obj遍历obj对象时,在for循环内部,被遍历
的对象obj会首先调用__iter__()方法,将其变为一个迭代器,然后这个迭代器再调用其__next__()
方法,返回取到的值给i,简单的说,for i in obj这句代码做的事就是:
       obj_iter = obj.__iter__()
       i = obj_iter.__next__()  
当然以上代码功能并不完整,因为for循环还自动捕捉了迭代器元素取完之后的StopIteration错误

完整模拟for循环的内部机制的代码如下:

    l = [1,2,3,4,5]
    item = l.__iter__()  # 生成一个迭代器
    while True:
        try:
            i = item.__next__()
            print(i)
        except StopIteration:  # 捕获异常,如果有异常,说明应该停止迭代
            break

f. 反向迭代和迭代器切片操作:

(1)反向迭代:

python内置函数revered()可以实现可迭代对象的反向迭代:
a = [1,2,3,4]
b = reversed(a) # 此方法是生成一个a的反向对象,创建新的对象
print(b)  # 输出:[4,3,2,1]
等同于:
a.reverse()  # 此方法是将a本身反向,并不创建新对象(只能引用于可变对象)
如果实现了__reversed__()方法,就可以在自定义的类上实现反向迭代

(2)迭代器切片:

切片(islice方法):
import itertools
a = (i for i in range(10))
b = itertools.islice(a,3)  # 返回一个迭代器对象,类似 [:3]
c = itertools.islice(a,3,None) # 返回一个迭代器对象,类似 [3:]
c = itertools.islice(a,3,6) # 类似 [3:6]
注意: islice会消耗迭代器,经过切片的迭代器会将切片部分以及切片之前的元素去掉,
      设置了None的islice会将原迭代器全部消耗掉:
        b = (i for i in range(10))  # 如果b是列表,用islice不会消耗该列表
        c = itertools.islice(b,3,None)
        print([i for i in c])  # 输出 [3, 4, 5, 6, 7, 8, 9]
        print(next(b))  # 抛出StopIteration错误

去特定元素(dropwhile方法):
import itertools
with open('test.py','r') as f: 
  for line in itertools.dropwhile(lambda x:x.startswith('#'), f):  # 遍历不是以#开头的所有行
       print(line)

其中:itertools.dropwhile(lambda x:x.startswith('#'), f)表示删除f中以#开头的行,返回其他行的迭代器

你可能感兴趣的:(迭代机制)