1、使用生成器可以节省内存。
eg:sum([i*i for i in range(1,1001)]),会列出1到1000之间的所有数的平方,并对值进行求和。当数据量比较大时,很容易占用大量计算机的可用内存资源。解决方法是,使用括号替换方括号。
sum((i*i for i in range(1,1001)))。将方括号替换为括号,会将列表推导更改为生成器表达式。要从列表中检索数据,但不需要同时访问所有数据时,生成器表达式非常合适。生成器表达式返回生成器对象,而不是创建列表。该对象指导他在当前状态中的位置并且仅在被要求时计算下一个值。因此,当sum通过重复调用.__next__()来迭代生成器对象时,生成器检查i等于多少,并计算i*i,在内部递增i,并将正确的值返回到sum。该设计允许生成器用于大量数据序列,因为一次只有一个元素存在于内存中。
2、enumerate()返回一个计数器和元素值。计数器默认为0,也是元素的索引。如果不想在0开始你的计数,只需要使用可选start参数来设置偏移量。
>>> numbers = [45, 22, 14, 65, 97, 72]
>>> for i, num in enumerate(numbers):
... if num % 3 == 0 and num % 5 == 0:
... numbers[i] = 'fizzbuzz'
... elif num % 3 == 0:
... numbers[i] = 'fizz'
... elif num % 5 == 0:
... numbers[i] = 'buzz'
...
>>> numbers
['fizzbuzz', 22, 14, 'buzz', 97, 'fizz']
>>> numbers = [45, 22, 14, 65, 97, 72]
>>> for i, num in enumerate(numbers, start=52):
... print(i, num)
...
52 45
53 22
54 14
55 65
56 97
57 72
3、使用.get()和.setdefault()在字典中定义默认值。
想象一下,你有一个名为cowboy的字典,你想得到那个cowboy的名字。一种方法是使用条件显式检查key:
>>> cowboy = {'age': 32, 'horse': 'mustang', 'hat_size': 'large'}
>>> if 'name' in cowboy:
... name = cowboy['name']
... else:
... name = 'The Man with No Name'
...
>>> name
'The Man with No Name'
此方法首先检查字典中是否存在name键,如果存在,则返回相应的值。否则,它返回默认值。
虽然清楚地检查key确实有效,但如果使用.get(),它可以很容易地用一行代替:
>>> name = cowboy.get('name', 'The Man with No Name')
get()执行与第一种方法相同的操作,但现在它们会自动处理。如果key存在,则返回适当的值。否则,将返回默认值。
但是,如果你想在仍然访问name的key时使用默认值更新字典呢?.get()在这里没有真正帮助你,所以你只需要再次显式检查这个值:
>>> if 'name' not in cowboy:
... cowboy['name'] = 'The Man with No Name'
...
>>> name = cowboy['name']
检查values并设置默认值是一种有效的方法,并且易于阅读,但Python再次使用.setdefault()提供了更优雅的方法:
>>> name = cowboy.setdefault('name', 'The Man with No Name')
.setdefault()完成与上面代码片段完全相同的操作。它检查cowboy中是否存在名称,如果是,则返回该值。否则,它将cowboy ['name']设置为The Man with No Name并返回新值。