【2017-09-26】迭代器与生成器(三)

  • 同时迭代多个序列
    运用内置zip()函数
    zip(a, b) 会生成一个可返回元组 (x, y) 的迭代器,其中 x 来自 a, y 来自 b。一旦其中某个序列到结尾,迭代宣告结束。因此迭代长度跟参数中最短序列长度一致。
    例如
>>> headers = ['name', 'shares', 'price','other']
>>> values = ['ACME', 100, 490.1]
>>> for name,value in zip(headers,values):
    print(name,"=",value )

name = ACME
shares = 100
price = 490.1
>>> 

上述迭代长度仅根参数最短序列长度一致,若需要与最长序列一致,可以使用 itertools.zip_longest() 函数来代替
上述例子可改写为:

>>> import itertools
>>> for name,value in itertools.zip_longest(headers,values):
    print(name,"=",value )

name = ACME
shares = 100
price = 490.1
other = None
>>> 
  • 序列上索引值迭代
    运用内置enumerate()函数
    enumerate() 函数返回的是一个 enumerate 对象实例,它是一个迭代器,返回连续的包含一个计数和一个值的元组,元组中的值通过在传入序列上调用 next() 返回,可指定一个开始的索引参数
    示例1:
>>> values = ['ACME', 100, 490.1]
>>> for idx,val in enumerate(values,1):
    print(idx,val)

    
1 ACME
2 100
3 490.1
>>> for idx,val in enumerate(values):
    print(idx,val)

    
0 ACME
1 100
2 490.1
>>> data = [ (1, 2), (3, 4), (5, 6), (7, 8) ]
>>> for idx,val in enumerate(data):
    print(idx,val)

0 (1, 2)
1 (3, 4)
2 (5, 6)
3 (7, 8)
>>> 

示例2:统计文本文件单词出现的行号

# -*- coding: utf-8 -*-
from collections import defaultdict

work_sum=defaultdict(list)
with open("1.txt","r") as fp:
       lines=fp.readlines()
       for idx,val in enumerate(lines,1):
              words=[w.lower() for w in val.split()]
              for word in words:
                     work_sum[word].append(idx)

print(work_sum)
  • 跳过可迭代对象的开始部分
    仅仅跳过开始部分
    使用itertools模块dropwhile() 函数,使用时,你给它传递一个函数对象和一个可迭代对象。它会返回一个迭代器对象,丢弃原有序列中直到函数返回 True 之前的所有元素。然后返回后面所有元素。
#过滤到#开头的
with open("1.txt","r") as fp:
       for line in dropwhile(lambda line :line.startswith('#'), fp):
              print(line)

值得注意的是,dropwhile() 函数仅仅是跳过满足条件的开始行

你可能感兴趣的:(【2017-09-26】迭代器与生成器(三))