橡皮擦,一个逗趣的互联网高级网虫,新的系列,让我们一起
Be More Pythonic
。
四、列表推导式与字典推导式
在 Python 中推导式是一种非常 Pythonic
的知识,本篇博客将为你详细解答列表推导式与字典推导式相关的技术知识。
4.1 列表推导式
列表推导式可以利用列表,元组,字典,集合等数据类型,快速的生成一个特定需要的列表。
语法格式如下:
[表达式 for 迭代变量 in 可迭代对象 [if 条件表达式]]
if 条件表达式
非必选,学完列表推导式之后,你可以发现它就是 for 循环的一个变种语句,例如咱们现有一个需求是将一个列表中的所有元素都变成原值的 2 倍。
for 循环写法
my_list = [1,2,3]
new_list = []
for i in my_list:
new_list.append(i*2)
print(new_list)
列表推导式写法
nn_list = [i*2 for i in my_list]
print(nn_list)
是不是对比看就是将 for 循环语句做了变形之后,增加了一个 []
,不过需要注意的是,列表推导式最终会将得到的各个结果组成一个新的列表。
再看一下列表推导式语法构成 nn_list = [i*2 for i in my_list]
,for
关键字后面就是一个普通的循环,前面的表达式 i*2
其中的 i
就是 for
循环中的变量,也就是说表达式可以用后面 for
循环迭代产生的变量,理解这个内容列表推导式就已经掌握 9 成内容了,剩下的是熟练度的问题。
在将 if
语句包含进代码中,运行之后,你也能掌握基本技巧,if
语句是一个判断,其中 i
也是前面循环产生的迭代变量。
nn_list = [i*2 for i in my_list if i>1]
print(nn_list)
这些都是一般技能,列表推导式能支持两层 for
循环,例如下述代码:
nn_list = [(x,y) for x in range(3) for y in range(3) ]
print(nn_list)
当然如果你想加密(谁都看不懂你的代码)你的代码,你可以无限套娃下去,列表推导式并没有限制循环层数,多层循环就是一层一层的嵌套,你可以展开一个三层的列表推导式,就都明白了
nn_list = [(x,y,z,m) for x in range(3) for y in range(3) for z in range(3) for m in range(3)]
print(nn_list)
当然在多层列表推导式里面,依旧支持 if 语句
,并且 if
后面可以用前面所有迭代产生的变量,不过不建议超过 2 成,超过之后会大幅度降低你代码的可阅读性。
当然如果你希望你代码更加难读,下面的写法都是正确的。
nn_list = [(x, y, z, m) for x in range(3) if x > 1 for y in range(3) if y > 1 for z in range(3) for m in range(3)]
print(nn_list)
nn_list = [(x, y, z, m) for x in range(3) for y in range(3) for z in range(3) for m in range(3) if x > 1 and y > 1]
print(nn_list)
nn_list = [(x, y, z, m) for x in range(3) for y in range(3) for z in range(3) for m in range(3) if x > 1 if y > 1]
print(nn_list)
现在你已经对列表推导式有比较直观的概念了,列表推导式对应的英文是 list comprehension
,有的地方写作列表解析式,基于它最后的结果,它是一种创建列表的语法,并且是很简洁的语法。
有了两种不同的写法,那咱们必须要对比一下效率,经测试小数据范围影响不大,当循环次数到千万级时候,出现了一些差异。
import time
def demo1():
new_list = []
for i in range(10000000):
new_list.append(i*2)
def demo2():
new_list = [i*2 for i in range(10000000)]
s_time = time.perf_counter()
demo2()
e_time = time.perf_counter()
print("代码运行时间:", e_time-s_time)
运行结果:
# for 循环
代码运行时间: 1.3431036140000001
# 列表推导式
代码运行时间: 0.9749278849999999
在 Python3 中列表推导式具备局部作用域,表达式内部的变量和赋值只在局部起作用,表达式的上下文里的同名变量还可以被正常引用,局部变量并不会影响到它们。所以其不会有变量泄漏的问题。例如下述代码:
x = 6
my_var = [x*2 for x in range(3)]
print(my_var)
print(x)
列表推导式还支持嵌套
参考代码如下,只有想不到,没有做不到的。
my_var = [y*4 for y in [x*2 for x in range(3)]]
print(my_var)
4.2 字典推导式
有了列表推导式的概念,字典推导式学起来就非常简单了,语法格式如下:
{键:值 for 迭代变量 in 可迭代对象 [if 条件表达式]}
直接看案例即可
my_dict = {key: value for key in range(3) for value in range(2)}
print(my_dict)
得到的结果如下:
{0: 1, 1: 1, 2: 1}
此时需要注意的是字典中不能出现同名的 key,第二次出现就把第一个值覆盖掉了,所以得到的 value 都是 1。
最常见的哪里还是下述的代码,遍历一个具有键值关系的可迭代对象。
my_tuple_list = [('name', '橡皮擦'), ('age', 18),('class', 'no1'), ('like', 'python')]
my_dict = {key: value for key, value in my_tuple_list}
print(my_dict)
4.3 元组推导式与集合推导式
其实你应该能猜到,在 Python 中是具备这两种推导式的,而且语法相信你已经掌握了。不过语法虽然差不多,但是元组推导式运行结果却不同,具体如下。
my_tuple = (i for i in range(10))
print(my_tuple)
运行之后产生的结果:
at 0x0000000001DE45E8>
使用元组推导式生成的结果并不是一个元组,而是一个生成器对象,需要特别注意下,这种写法在有的地方会把它叫做生成器语法,不叫做元组推导式。
集合推导式也有一个需要注意的地方,先看代码:
my_set = {value for value in 'HelloWorld'}
print(my_set)
因为集合是无序且不重复的,所以会自动去掉重复的元素,并且每次运行显示的顺序不一样,使用的时候很容易晕掉。
4.4 这篇博客的总结
这篇博客,我们学习了列表和字典推导式,掌握并熟练的应用二者之后,你 Python 技能又向前进了一步。
相关阅读
- Python 爬虫 100 例教程,超棒的爬虫教程,立即订阅吧
- Python 爬虫小课,精彩 9 讲
今天是持续写作的第 98 / 100 天。
如果你想跟博主建立亲密关系,可以关注同名公众号 梦想橡皮擦,近距离接触一个逗趣的互联网高级网虫。
博主 ID:梦想橡皮擦,希望大家点赞、评论、收藏。