生成器表达式是一个对象,它执行的计算和列表包含相同,但会迭代地生成结果。语法也和列表包含相同,但要用圆括号代替方括号。
(expression for item1 in iterable1 if condition1
for item2 in iterable2 if condition2
...
for itemN in iterableN if conditionN)
和列表推导不同,生成器表达式实际上不创建列表或者立即圆括号内的表达式求值。相反,它会创建一个通过迭代并按照需要生成值的生成器对象, 例如:
列表推导和生成器表达式之间的差异十分重要,但很微妙。
使用列表推导时,python实际上创建了包含结果数据的列表。而使用生成器表达式时,python创建的是只知道如何按照需要生成数据的生成器。在某些应用中,这可能极大地影响性能和内存使用。
# 读取一个文件
f = open("data.txt") # 打开文件
lines = (t.strip() for t in f) # 读取行,并删除前后空白
comments = (t for t in lines if t[0] == '#') # 所有注释
for c in comments:
print(c)
这个例子中,生成器表达式提取各行并删除其中的空白,但它实际上没有将整个文件读取到内存中。提取注释的表达式也是如此。相反,在程序开始在for循环中进行迭代时,读取了文件的各行。
在这个迭代过程中,按照需要生成了文件的各行并对其进行过滤。事实上,该过程中绝对没有把整个文件加载到内存中。因此,这是一种从很大的python源文件中提取注释的高效方法。
和列表推导不同,生成器表达式不会创建序列形式的对象。不能对它进行索引,也不能进行任何常规的列表操作,例如append()。但是,使用内置的list()函数可以将生成器表达式转换为列表, 例如:
clist = list(comments)