高阶函数英文叫Higher-order function。什么是高阶函数?举例说明。
变量可以指向函数
以Python内置的求绝对值的函数abs()
为例,调用该函数用以下代码:
>>> abs(-10)
10
但是,如果只写abs
呢?
>>> abs
可见,abs(-10)
是函数调用,而abs
是函数本身。要获得函数调用的结果,我们可以把结果赋值给变量:
>>> x = abs(-10)
>>> x
10
但是,如果把函数本身赋值给变量呢?
>>> f = abs
>>> f
结论:函数本身也可以赋值给变量,即:变量可以指向函数。
如果一个变量指向了一个函数,那么就可以通过该变量来调用这个函数:
>>> f = abs
>>> f(-10)
10
函数名也是变量
函数名就是指向函数的变量!对于abs()
这个函数,完全可以把函数名abs
看成变量,他只想一个可以计算绝对值的函数。
如果把abs
指向其他对象,会发生什么?
>>> abs = 10
>>> abs(-10)
Traceback (most recent call last):
File "", line 1, in
TypeError: 'int' object is not callable
把abs
指向10
后,就无法通过abs(-10)
调用该函数了!因为abs
变量已经不指向求绝对值函数而是指向一个整数10
。当然实际代码绝对不能这么些,这里是为了说明函数名也是变量。要恢复abs
函数,请重启交互环境。
注:由于abs
函数实际上是定义在import builtins
模块中的,所以要让修改abs
变量的指向在其他模块也生效,要用import builtins; builtins.abs = 10
。
传入函数
既然便利那个可以指向函数,函数的参数就能接收变量,那么一个函数就可以接受另一个函数作为参数,这种函数就称之为高阶函数。
一个最简单的高阶函数:
>>> def add(x, y, f):
... return f(x) + f(y)
当我们调用add(-5, 6, abs)
时,参数x
, y
和'f'分别接收-5
, 6
和abs
,根据函数定义,我们可以推导计算过程为:
x = -5
y = 6
f = abs
f(x) + f(y) == > abs(-5) + abs(6) ==> 11
return 11
小结
把函数作为参数传入,这样的函数称为高阶函数,函数式编程就是指这种高度抽象的编程范式。
1.map/reduce
Python中内建了map()
和reduce()
函数。
map()
函数接收两个参数,一个是函数,一个是Iterable
,map
将传入的函数一次作用到序列的每个元素,并把结果作为新的Iterator
返回。
比如,我们有一个函数f(x)=x²,要把这个函数作用在一个list[1, 2, 3, 4, 5, 6, 7, 8, 9]上,就可以用map()
实现:
>>> def f(x):
... return x * x
...
>>> r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> list(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]
map()
传入的第一个参数是f
,即函数对象本身。由于结果r
是一个Iterator
, Iterator
是惰性序列,因此通过list()
函数让他把整个序列都计算出来并返回一个list。
你可能会想,我写一个循环,也可以计算结果
L = []
for n in [1, 2, 3, 4, 5, 6, 7, 8, 9]:
L.append(f(n))
print(L)
的确可以,但是从上面的循环代码,并不能一眼看明白“把f(x)作用在list的每一个元素并把结果生成一个新的list”。所以,map()
作为高阶函数,事实上他把运算规则抽象了,因此,我们不但可以计算简单的f(x)=x²,还可以计算任意复杂的函数,比如,把这个list所有数字转为字符串:
>>> list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
['1', '2', '3', '4', '5', '6', '7', '8', '9']
reduce
把一个函数作用在一个序列[x1, x2, x3, ...]
上,这个函数必须接收两个参数,reduce
把结果继续和序列的下一个元素做累积计算,其效果就是:
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
比如说对一个序列求和,就可以用reduce实现:
>>> from functools import reduce
>>> def add(x, y):
... return x + y
...
>>> reduce(add, [1, 3, 5, 7, 9])
25
当然求和运算可以直接用Python内置函数sum()
,没必要用reduce
。但是如果要把序列[1, 3, 5, 7, 9]
变成整数13579
,reduce
就可以派上用场:
>>> from functools import reduce
>>> def add(x, y):
... return x * 10 + y
...
>>> reduce(add, [1, 3, 5, 7, 9])
13579
这个例子本身没多大用处,但是,如果考虑到字符串str
也是一个序列,对上面的例子稍加改动,配合map()
,我们就可以写出把str
转换为int
的函数:
>>> from functools import reduce
>>> def fn(x, y):
... return x * 10 + y
...
>>> def char2num(s):
... digits = {'0' : 0,'1' : 1,'2' : 2,'3' : 3,'4' : 4,'5' : 5,'6' : 6,'7' : 7,'8' : 8,'9' : 9}
... return digits[s]
...
>>> reduce(fn, map(char2num, '13579'))
13579
整理成一个str2int
的函数就是:
from functools import reduce
DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
def str2int(s):
def fn(x, y):
return x * 10 + y
def char2num(s):
return DIGITS[s]
return reduce(fn, map(char2num, s))
进一步简化
from functools import reduce
DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
def char2num(s):
return DIGITS[s]
def str2int(s):
return reduce(lambda x, y: x * 10 + y, map(char2num, s))
filter
Python内建的filter()
函数用于过滤序列。
和map()
类似,filter()
也接收一个函数和一个序列。和map()
不同的是,filter()
把传入的函数一次作用于每个元素,然后根据返回值是True
还是False
决定保留还是丢弃该元素。
例如,在一个list中,删掉偶数,只保留奇数,可以这么写:
>>> def is_odd(n):
... return n % 2 == 1
...
>>> list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
[1, 5, 9, 15]
把一个序列中的空字符串删掉,可以这么写:
>>> def not_empty(s):
... return s and s.strip()
...
>>> list(filter(not_empty, ['A', '', 'b', None, 'C', ' ']))
['A', 'b', 'C']
可见用filter()
这个高阶函数,关键在于正确实现一个“筛选”函数。注意到filter()
函数返回的是一个Iterator
,也就是一个惰性序列,所以要强迫fiflter()
完成计算结果,需要用list()
函数获得所有结果并返回list。
sorted
排序算法
排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,我们可以直接比较,但是如果是字符串或者是两个dict呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。
Python内置的sorted()
函数就可以对list进行排序:
>>>sorted([36, 5, -12, 9, -21])
[-21, -12, 5, 9, 36]
此外,sorted()
函数也是一个高阶函数,他还可以接收一个key
函数来实现自定义的排序,例如按照绝对值大小排序:
sorted([36, 5, -12, 9, -21], key=abs)
[5, 9, -12, -21, 36]
key指定的函数将作用于list的每一个元素上,并根据key函数返回的结果进行排序。对比原始的list和经过key=abs
处理过的list:
list = [36, 5, -12, 9, -21]
keys = [36, 5, 12, 9, 21]
我们再看一个字符串排序的例子:
>>>sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
默认情况下,对字符串排序,是按照ASCII的大小比较的,由于'Z' < 'a'
,结果,大写字母Z
会排在小写字母a
前面