Python中的列表解析和生成表达式

  优雅、清晰和务实都是python的核心价值观,如果想通过操作和处理一个序列(或其他的可迭代对象)来创建一个新的列表时可以使用列表解析(  List comprehensions)和生成表达式,通过这两个操作,我们可以看到这三个观点是如何在python中和谐统一起来的。

  列表解析

  在需要改变列表而不是需要新建某列表时,可以使用列表解析。列表解析表达式为:

   
   
   
   
[expr for iter_var in iterable]
[expr
for iter_var in iterable if cond_expr]

  第一种语法:首先迭代iterable里所有内容,每一次迭代,都把iterable里相应内容放到iter_var中,再在表达式中应用该iter_var的内容,最后用表达式的计算值生成一个列表。
  第二种语法:加入了判断语句,只有满足条件的内容才把iterable里相应内容放到iter_var中,再在表达式中应用该iter_var的内容,最后用表达式的计算值生成一个列表。

  举例如下:

   
   
   
   
1 . >>> L = [(x + 1 ,y + 1 ) for x in range( 3 ) for y in range( 5 )]
2 . >>> L
3 . [( 1 , 1 ), ( 1 , 2 ), ( 1 , 3 ), ( 1 , 4 ), ( 1 , 5 ), ( 2 , 1 ), ( 2 , 2 ), ( 2 , 3 ), ( 2 , 4 ),
(
2 , 5 ), ( 3 , 1 ), ( 3 , 2 ), ( 3 , 3 ), ( 3 , 4 ), ( 3 , 5 )]
   
   
   
   
1 . >>> N = [x + 10 for x in range( 10 ) if x > 5 ]
2 . >>> N
3 . [ 16 , 17 , 18 , 19 ]
   
   
   
   
1 . newlist = [x + 5 for x in olderlist if x > 10 ]

  一个更复杂的例子:

   
   
   
   
1 . < span style = " font-size: 14px; " >>>> num = [j for i in range( 2 , 8 ) for j in
range(i
* 2 , 50 , i)]
2 . >>> num
3 . [ 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 , 22 , 24 , 26 , 28 , 30 , 32 , 34 , 36 , 38 , 40 ,
42 , 44 , 46 , 48 , 6 ,
4 . 9 , 12 , 15 , 18 , 21 , 24 , 27 , 30 , 33 , 36 , 39 , 42 , 45 , 48 , 8 , 12 , 16 , 20 , 24 ,
 
28 , 32 , 36 , 40 ,
5 . 44 , 48 , 10 , 15 , 20 , 25 , 30 , 35 , 40 , 45 , 12 , 18 , 24 , 30 , 36 , 42 , 48 , 14 , 21 ,
 
28 , 35 , 42 , 49 ]
6 . span >
   
   
   
   
1 . >>> words = ' The quick brown fox jumps over the lazy dog ' .split()
2 . >>> words
3 . [ ' The ' , ' quick ' , ' brown ' , ' fox ' , ' jumps ' , ' over ' , ' the ' , ' lazy ' , ' dog ' ]
4 . >>> stuff = [[w.upper(), w.lower(), len(w)] for w in words]
5 . >>> for i in stuff:
6 . print i
7 .
8 .
9 . [ ' THE ' , ' the ' , 3 ]
10 . [ ' QUICK ' , ' quick ' , 5 ]
11 . [ ' BROWN ' , ' brown ' , 5 ]
12 . [ ' FOX ' , ' fox ' , 3 ]
13 . [ ' JUMPS ' , ' jumps ' , 5 ]
14 . [ ' OVER ' , ' over ' , 4 ]
15 . [ ' THE ' , ' the ' , 3 ]
16 . [ ' LAZY ' , ' lazy ' , 4 ]
17 . [ ' DOG ' , ' dog ' , 3 ]

  上述代码的map()实现:、

   
   
   
   
>>> stuff = map( lambda w: [w.upper(), w.lower(), len(w)], words)
>>> for i in stuff:
...
print i
...
[
' THE ' , ' the ' , 3 ]
[
' QUICK ' , ' quick ' , 5 ]
[
' BROWN ' , ' brown ' , 5 ]
[
' FOX ' , ' fox ' , 3 ]
[
' JUMPS ' , ' jumps ' , 5 ]
[
' OVER ' , ' over ' , 4 ]
[
' THE ' , ' the ' , 3 ]
[
' LAZY ' , ' lazy ' , 4 ]
[
' DOG ' , ' dog ' , 3 ]

  生成器表达式

  生成器表达式是在python2.4中引入的,当序列过长, 而每次只需要获取一个元素时,应当考虑使用生成器表达式而不是列表解析。生成器表达式的语法和列表解析一样,只不过生成器表达式是被()括起来的,而不是[],如下:

   
   
   
   
(expr for iter_var in iterable)
(expr
for iter_var in iterable if cond_expr)

  例:

   
   
   
   
>>> L = (i + 1 for i in range( 10 ) if i % 2 )
>>> L
< generator object < genexpr > at 0xb749a52c >
>>> L1 = []
>>> for i in L:
... L1.append(i)
...
>>> L1
[
2 , 4 , 6 , 8 , 10 ]

  生成器表达式并不真正创建数字列表, 而是返回一个生成器,这个生成器在每次计算出一个条目后,把这个条目“产生”(yield)出来。 生成器表达式使用了“惰性计算”(lazy evaluation,也有翻译为“延迟求值”,我以为这种按需调用call by need的方式翻译为惰性更好一些),只有在检索时才被赋值( evaluated),所以在列表比较长的情况下使用内存上更有效。A generator object in python is something like a lazy list. The elements are only evaluated as soon as you iterate over them. 

  一些说明:

  1. 当需要只是执行一个循环的时候尽量使用循环而不是列表解析,这样更符合python提倡的直观性。

   
   
   
   
for item in sequence:
process(item)

  2. 当有内建的操作或者类型能够以更直接的方式实现的,不要使用列表解析。

  例如复制一个列表时,使用:L1=list(L)即可,不必使用:

   
   
   
   
L1 = [x for x in L]

  3. 当序列过长, 而每次只需要获取一个元素时,使用生成器表达式。、

  4. 列表解析的性能相比要比map要好,参考http://www.qingliangcn.com/2010/02/list-comprehensions%E4%B8%8Elist-map%E6%80%A7%E8%83%BD%E5%AF%B9%E6%AF%94/

你可能感兴趣的:(Python,列表解析,表达式)