Python迭代器

一、什么是迭代器

迭代是python中访问集合元素的一种强大方式。迭代器对象从集合中的第一个元素开始访问,直到所有的元素被访问完。迭代器有两个方法:iter()和next()。

Python迭代器_第1张图片

二、可迭代的对象

 类似于list、tuple、str等类型的数据可以使用for……in……的循环遍历语法从中依次拿到数据并进行使用,我们把这个过程称为遍历,也称为迭代。python中可以迭代的对象有list(列表)、tuple(元组)、dict(字典)、str(字符串)、set(集合)等。

Python迭代器_第2张图片

mylist = [1,2,3,4,5]
mydirt = {
    "name":"张三",
    "sex":"男",
    "age":18
    }
    
mytuple = (1,2,3,4,5)
myset = {1,2,3,3,4}
 
for i in mylist:
    print(i)
 
for i in mytuple:
    print(i)
 
for i in myset:
    print(i)
 
for i,j in mydirt.items():
    print("%s:%s" % (i,j))
 
 

 此外也可以创建可迭代的对象:只要此对象含有__iter__方法,那么它就是一个可迭代的对象。如下,定义了一个__iter__f方法,通过isinstance()函数和Iterable来判断由Classmate类创建的class1对象能否迭代:若class1是一个可迭代对象,则返回True;否则,结果为False。

from collections.abc import Iterable

# 定义一个同学类
class Classmate(object):
      
    def __init__(self):
        self.name = list()
        self.name_num = 0

    def add(self,name):
        self.name.append(name)
   
    def __iter__(self):
        return pass


class1 = Classmate ()
class1.add("张三")
class1.add("李四")
class1.add("王五")

print("判断是否是可迭代对象:", isinstance(class1,Iterable))

运行结果如下:

判断是否是可迭代的对象: True

三、创建一个迭代器

1.一个类(对象)只要含有“__iter__”、"__next__"两个方法,就将其称为迭代器。

__iter__方法返回一个特殊的迭代器对象,而这个迭代器对象自动实现了_next__方法,并返回一个值,最后通过抛出异常StopIteration来结束迭代。我们来给上一个例子增加__next__方法:
 

from collections.abc import Iterable
from collections.abc import Iterator
 
 
class Classmate(object):
    """定义一个同学类"""
 
    def __init__(self):
        self.name = list()
        self.name_num = 0
 
    def add(self,name):
        self.name.append(name)
    
    def __iter__(self):
        pass
 
    def __next__(self):
       pass
 
 
class1 =  Classmate()
class1.add("张三")
class1.add("李四")
class1.add("王五")
 
print("判断是否是可迭代的对象:", isinstance(class1,Iterable))
 
print("判断是否是迭代器:", isinstance(class1,Iterator))
 
 

运行结果:

判断是否是可迭代的对象: True
判断是否是可迭代器: True

2.只是名义上的 可迭代对象/迭代器 还不够,具有相应的功能才算是完整。__iter__方法,需要具有一个可以返回一个迭代器对象的功能(这个对象可以是自己(前提是本身就是一个迭代器),也可以是其它迭代器);__next__方法,需要标记并返回下一个迭代器对象。代码如下:

from collections.abc import Iterable
from collections.abc import Iterator
import time
 
 
class Classmate(object):
    """定义一个同学类"""
 
    def __init__(self):
        self.name = list()
        self.name_num = 0
 
    def add(self,name):
        self.name.append(name)
    
    def __iter__(self):
        return self   # 返回本身
 
    def __next__(self):
       
       # 记忆性返回数据
       if self.name_num < len(self.name):
           ret = self.name[self.name_num]
           self.name_num += 1
           return ret
 
 
 
class1 =  Classmate()
class1.add("张三")
class1.add("李四")
class1.add("王五")
 
print("判断是否是可迭代的对象:", isinstance(class1,Iterable))
 
print("判断是否是迭代器:", isinstance(class1,Iterator))
 
for name in class1:
    print(name)
    time.sleep(1)

运行结果:

Python迭代器_第3张图片

通过上述结果可知,程序没有停止,而是无限循环地返回空值。因此我们要添加抛出异常(StopIteration ,python中用于标记迭代完成,防止出现无限循环的情况)的程序:

from collections.abc import Iterable
from collections.abc import Iterator
import time
 
 
class Classmate(object):
    """定义一个同学类"""
 
    def __init__(self):
        self.name = list()
        self.name_num = 0
 
    def add(self,name):
        self.name.append(name)
    
    def __iter__(self):
        return self   # 返回本身
 
    def __next__(self):
       if self.name_num < len(self.name):
           ret = self.name[self.name_num]
           self.name_num += 1
           return ret
 
        # 抛出异常,当循环后自动结束
       else:
           raise StopIteration
 
 
class1 =  Classmate()
class1.add("张三")
class1.add("李四")
class1.add("王五")
 
print("判断是否是可迭代的对象:", isinstance(class1,Iterable))
 
print("判断是否是迭代器:", isinstance(class1,Iterator))
 
for name in class1:
    print(name)
    time.sleep(1)
 

运行结果:

Python迭代器_第4张图片

四、迭代器的应用

 迭代器最核心的功能就是可以通过__next__方法的调用来返回下一个值。而这个值不是从已有的数据中读取的,而是通过程序按照一定的规则生成的。这也就意味着我们可以不再依赖一个现存的数据集合来存放数据,而是边用边生成,这样的好处就是可以节省大量的内存空间。通过以下问题的两种解决方法,来理解迭代器的优势。

问题:试编写一个程序实现斐波那契数列(0,1,1,2,3,5,8,13,21……后一项总是等于前两项的   和):

方法1(常规):

a = 0
b = 1
myFibonacci = list()
 
nums = int(input("请输入需要生成Fibonacci数列项的个数:"))
 
i = 0
while i < nums:
    myFabonacci.append(a)
    a,b = b,a+b
    i += 1
 
for num in nums:
    print(num)

方法2(迭代器):

class Fibonacci(object):
    """斐波那契数列得迭代器"""
    def __init__(self,nums):
        self.nums = nums   # 传入参数,生成斐波那契数列的个数
        self.a = 0   
        self.b = 1
        self.i =0    # 用于记忆生成的个数
    def __iter__(self):
        return self
 
    def __next__(self):
           
       ret = self.a   # 记忆第一个数
 
       if self.i < self.nums:
            self.a, self.b = self.b,self.a +self.b
            self.i += 1
            return ret
       else:
           raise StopIteration   # 停止迭代
 
nums = int(input("请输入需要生成Fibonacci数列项的个数:"))
fobo = Fibonacci(nums)
 
for num in fobo:
    print(num)
 

 假如要生成9个Fibonacci数列的项,这两种方法的结果相同,如下:

Python迭代器_第5张图片

分析:

虽然结果相同,但实际效果相差巨大。

方法1,通过while循环立即生成一个列表用来存放数据,接着再从已有的数据中读取所需数据,需要占用一定的内存空间

方法2,并没有用到列表,而是返回一个迭代器,在需要的时候生成相关数据

纵观以上两种方法,在生成个数较小时,两者相差不大,但当生成个数是10万,100万,1000万呢?前者需要消耗大量的内存资源,而后者仅需占用一点内存即可。这也是python2中range()函数和python3中range()函数的不同点,python3的range()函数采用了迭代器的方式,不再依赖于现有的数据集合,也就相当于python2中的xrange()函数。

五、小结

1.可迭代对象不一定是迭代器。

2.迭代器一定是可迭代对象

2.容器类型(list、tuple、dict 、str、set)是可迭代对象,而不是迭代器。

你可能感兴趣的:(Python,学习,python)