【第二十二天】便携表达式与懒惰求值

7.5

1.便捷表达式

函数式编程的思维是自上而下的，py中也有不少体现这一思维的语法
如生成器表达式，列表解析和词典解析
生成器表达式是构建生成器的便捷方法
考虑下面一个生成器：

def gen():
    for i in range(4):
        yield i

等价的，上面程序可以写成生成器表达式(Generator Expression)

gen = (x for x in range(4))

这一语法很直观，写出来的代码也很简洁
再来看一个生成列表的方法：

l ＝ []

for x in range(10):
    l.append(x**2)

上述代码形成了表l，但是有更快的方式，列表解析(List Comprehension)
是快速生成列表的方法，它的语法简单，很有实用价值
列表解析语法和生成器表达式很像，只不过把小括号换成了中括号：

l = [x**2 for x in range(10)]

列表解析的语法很直观,我们直接了当的说明了想要的是元素的平方
然后再通过for来增加限定条件，即哪些元素的平方，除了for
列表解析中还可以使用if，比如下面一个更复杂的例子：

x1 = [1,3,5]
y1 = [9,12,13]
l = [x**2 for (x,y) in zip(x1,y1) if y > 10]

print(l)

[9, 25]

zip()函数：http://www.runoob.com/python/python-func-zip.html

词典解析可用于快捷的生成词典，它的语法也与之前的类似：

d = {k: v for k,v in enumerate("Vamei") if v not in "Vi"}
print(d)

{1: 'a', 2: 'm', 3: 'e'}

enumerate()函数：http://www.runoob.com/python/python-func-enumerate.html

上面这一节提到生成器，是不是很多同学有困惑呢

首先讲概念

在 py 中，使用了 yield 的函数被称为生成器（generator）
跟普通函数不同的是，生成器是一个返回迭代器的函数
只能用于迭代操作，更简单点理解生成器就是一个迭代器
在调用生成器运行的过程中，每次遇到 yield 时函数会暂停并保存当前所有的运行信息
返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行
调用一个生成器函数，返回的是一个迭代器对象。

下面看例子：

a = [i*i for i in range(3)]
       
print(a) 

for i in a:
     print(i)

[0, 1, 4]
0
1
4

a = (i*i for i in range(3))
       
print(a) 

for i in a:
     print(i)

 at 0x10e0e2d00>
0
1
4

可以看到小括号打印的是一个(generator object)也就是生成器对象
而中括号打印的是一个列表，下面会提到两者区别

2.懒惰求值

py中的迭代器也很有函数式编程的意味，从功能上说
迭代器很多时候看起来就像个列表，比如下面的迭代器和列表
效果上都一样：

for i in (x**2 for x in range(10)):
    print(i)
    
for i in [x**2 for x in range(10)]:
    print(i)

但是我们在介绍迭代器时曾提到过，迭代器的元素是实时计算出来的
在使用该元素之前，元素并不会占据内存空间，与之相应
列表在建立时，就已经产生了各个元素的值，并保存在内存中
迭代器的工作方式正是函数式编程中的懒惰求值(Lazy Evaluation)
我们可以对迭代器进行各种各样的操作

但，只有需要时，迭代器才会计算出具体的值

懒惰求值可以最小化计算机要做的工作
比如下面的程序可以在py3中飞速运行完成

a = range(100000000)
result = map(lambda x: x**2, a)

在py3中，上面程序可以迅速执行，因为map()返回的是迭代器
所以会懒惰求值，除非通过某种方式调用迭代器中的元素
或者把迭代器转化成列表，运算过程才会开始
读者若感兴趣可以在上面的程序中添加：

result ＝ list(result)

运算时间将大大增加

如果说计算最终都不可避免，那么懒惰求值和即时求值的运算量并没有多少区别
但是如果不需要穷尽所有的数据元素，那么懒惰求值将节省不少时间
比如下面的情况中，列表提前准备数据的方式，就浪费了很多运算资源：

for i in (x**2 for x in range(100000000)):
    if i > 1000:
        break
        
for i in [x**2 for x in range(100000000)]:
    if i > 1000:
        break

除了运算资源，懒惰求值还能节约不少内存空间，对于即时求值来说
其运算过程的中间结果都需要占用不少的内存空间
而懒惰求值可以先在迭代器层面上操作，在获得最终迭代器以后一次性完成计算
除了用map(),filter()等函数外
py中的itertools包还提供了丰富的操作迭代器的工具
感兴趣的读者可以自行搜集

【第二十二天】便携表达式与懒惰求值

7.5

1.便捷表达式

2.懒惰求值

你可能感兴趣的:(【第二十二天】便携表达式与懒惰求值)