【第二十二天】便携表达式与懒惰求值

7.5

1.便捷表达式

函数式编程的思维是自上而下的,py中也有不少体现这一思维的语法
如生成器表达式,列表解析和词典解析
生成器表达式是构建生成器的便捷方法
考虑下面一个生成器:

def gen():
    for i in range(4):
        yield i 

等价的,上面程序可以写成生成器表达式(Generator Expression)

gen = (x for x in range(4))

这一语法很直观,写出来的代码也很简洁
再来看一个生成列表的方法:

l = []

for x in range(10):
    l.append(x**2)

上述代码形成了表l,但是有更快的方式,列表解析(List Comprehension)
是快速生成列表的方法,它的语法简单,很有实用价值
列表解析语法和生成器表达式很像,只不过把小括号换成了中括号:

l = [x**2 for x in range(10)]

列表解析的语法很直观,我们直接了当的说明了想要的是元素的平方
然后再通过for来增加限定条件,即哪些元素的平方,除了for
列表解析中还可以使用if,比如下面一个更复杂的例子:

x1 = [1,3,5]
y1 = [9,12,13]
l = [x**2 for (x,y) in zip(x1,y1) if y > 10]

print(l)
[9, 25]

zip()函数:http://www.runoob.com/python/python-func-zip.html

词典解析可用于快捷的生成词典,它的语法也与之前的类似:

d = {k: v for k,v in enumerate("Vamei") if v not in "Vi"}
print(d)
{1: 'a', 2: 'm', 3: 'e'}

enumerate()函数:http://www.runoob.com/python/python-func-enumerate.html

上面这一节提到生成器,是不是很多同学有困惑呢

首先讲概念

在 py 中,使用了 yield 的函数被称为生成器(generator)
跟普通函数不同的是,生成器是一个返回迭代器的函数
只能用于迭代操作,更简单点理解生成器就是一个迭代器
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息
返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行
调用一个生成器函数,返回的是一个迭代器对象。

下面看例子:

a = [i*i for i in range(3)]
       
print(a) 

for i in a:
     print(i)
[0, 1, 4]
0
1
4
a = (i*i for i in range(3))
       
print(a) 

for i in a:
     print(i)
 at 0x10e0e2d00>
0
1
4

可以看到小括号打印的是一个(generator object)也就是生成器对象
而中括号打印的是一个列表,下面会提到两者区别

2.懒惰求值

py中的迭代器也很有函数式编程的意味,从功能上说
迭代器很多时候看起来就像个列表,比如下面的迭代器和列表
效果上都一样:

for i in (x**2 for x in range(10)):
    print(i)
    
for i in [x**2 for x in range(10)]:
    print(i)

但是我们在介绍迭代器时曾提到过,迭代器的元素是实时计算出来的
在使用该元素之前,元素并不会占据内存空间,与之相应
列表在建立时,就已经产生了各个元素的值,并保存在内存中
迭代器的工作方式正是函数式编程中的懒惰求值(Lazy Evaluation)
我们可以对迭代器进行各种各样的操作

但,只有需要时,迭代器才会计算出具体的值

懒惰求值可以最小化计算机要做的工作
比如下面的程序可以在py3中飞速运行完成

a = range(100000000)
result = map(lambda x: x**2, a) 

在py3中,上面程序可以迅速执行,因为map()返回的是迭代器
所以会懒惰求值,除非通过某种方式调用迭代器中的元素
或者把迭代器转化成列表,运算过程才会开始
读者若感兴趣可以在上面的程序中添加:

result = list(result)

运算时间将大大增加

如果说计算最终都不可避免,那么懒惰求值和即时求值的运算量并没有多少区别
但是如果不需要穷尽所有的数据元素,那么懒惰求值将节省不少时间
比如下面的情况中,列表提前准备数据的方式,就浪费了很多运算资源:

for i in (x**2 for x in range(100000000)):
    if i > 1000:
        break
        
for i in [x**2 for x in range(100000000)]:
    if i > 1000:
        break

除了运算资源,懒惰求值还能节约不少内存空间,对于即时求值来说
其运算过程的中间结果都需要占用不少的内存空间
而懒惰求值可以先在迭代器层面上操作,在获得最终迭代器以后一次性完成计算
除了用map(),filter()等函数外
py中的itertools包还提供了丰富的操作迭代器的工具
感兴趣的读者可以自行搜集

你可能感兴趣的:(【第二十二天】便携表达式与懒惰求值)