函数式编程
函数是Python内建支持的一种封装,我们通过把大段代码拆成函数,通过一层一层的函数调用,就可以把复杂任务分解成简单的任务,这种分解可以称之为面向过程的程序设计。函数就是面向过程的程序设计的基本单元。
而函数式编程(请注意多了一个"式”字)——Functional Programming,虽然也可以归结到面向过程的程序设计,但其思想更接近数学计算。
我们首先要搞明白计算机(Computer)和计算(Compute)的概念。
在计算机的层次上,CPU执行的是加减乘除的指令代码,以及各种条件判断和跳转指令,所以,汇编语言是最贴近计算机的语言。
而计算则指数学意义上的计算,越是抽象的计算,离计算机硬件越远。
对应到编程语言,就是越低级的语言,越贴近计算机,抽象程度低,执行效率高,比如C语言;越高级的语言,越贴近计算,抽象程度高,执行效率低,比如Lisp语言。
函数式编程就是一种抽象程度很高的编程范式,纯粹的函数式编程语言编写的函数没有变量,因此,任意一个函数,只要输入是确定的,输出就是确定的,这种纯函数我们称之为没有副作用。而允许使用变量的程序设计语言,由于函数内部的变量状态不确定,同样的输入,可能得到不同的输出,因此,这种函数是有副作用的。
函数式编程的一个特点就是,允许把函数本身作为参数传入另一个函数,还允许返回一个函数!
Python对函数式编程提供部分支持。由于Python允许使用变量,因此,Python不是纯函数式编程语言。
高阶函数
高阶函数英文叫Higher-order function。把函数作为参数传入,这样的函数称为高阶函数,函数式编程就是指这种高度抽象的编程范式。
python把函数作为参数
编写了一个简单的高阶函数:
defadd(x, y, f):return f(x) + f(y)
如果传入abs作为参数f的值:
add(-5, 9, abs)
根据函数的定义,函数执行的代码实际上是:
abs(-5) + abs(9)
由于参数 x, y 和 f 都可以任意传入,如果 f 传入其他函数,就可以得到不同的返回值。
如:
importmathdefadd(x, y, f):return f(x) +f(y)print add(25, 9, math.sqrt)
python中map()函数
map()是 Python 内置的高阶函数,它接收一个函数 f 和一个 list,并通过把函数 f 依次作用在 list 的每个元素上,得到一个新的 list 并返回。
例如,对于list [1, 2, 3, 4, 5, 6, 7, 8, 9]
如果希望把list的每个元素都作平方,就可以用map()函数:
因此,我们只需要传入函数f(x)=x*x,就可以利用map()函数完成这个计算:
deff(x):return x*xprint map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
输出结果:
[1, 4, 9, 10, 25, 36, 49, 64, 81]
注意:map()函数不改变原有的 list,而是返回一个新的 list。
利用map()函数,可以把一个 list 转换为另一个 list,只需要传入转换函数。
由于list包含的元素可以是任何类型,因此,map() 不仅仅可以处理只包含数值的 list,事实上它可以处理包含任意类型的 list,只要传入的函数f可以处理这种数据类型。
例子:
假设用户输入的英文名字不规范,没有按照首字母大写,后续字母小写的规则,请利用map()函数,把一个list(包含若干不规范的英文名字)变成一个包含规范英文名字的list:
输入:['adam', 'LISA', 'barT']
输出:['Adam', 'Lisa', 'Bart']
defformat_name(s):return s[0].upper() + s[1:].lower()print map(format_name, ['adam', 'LISA', 'barT'])
python中reduce()函数
reduce()函数也是Python内置的一个高阶函数。reduce()函数接收的参数和 map()类似,一个函数 f,一个list,但行为和 map()不同,reduce()传入的函数 f 必须接收两个参数,reduce()对list的每个元素反复调用函数f,并返回最终结果值。
例如,编写一个f函数,接收x和y,返回x和y的和:
deff(x, y):return x + y
调用 reduce(f, [1, 3, 5, 7, 9])时,reduce函数将做如下计算:
先计算头两个元素:f(1, 3),结果为4;
再把结果和第3个元素计算:f(4, 5),结果为9;
再把结果和第4个元素计算:f(9, 7),结果为16;
再把结果和第5个元素计算:f(16, 9),结果为25;
由于没有更多的元素了,计算结束,返回结果25。
上述计算实际上是对 list 的所有元素求和。虽然Python内置了求和函数sum(),但是,利用reduce()求和也很简单。
reduce()还可以接收第3个可选参数,作为计算的初始值。如果把初始值设为100,计算:
reduce(f, [1, 3, 5, 7, 9], 100)
结果将变为125,因为第一轮计算是:
计算初始值和第一个元素:f(100, 1),结果为101。
例子:
Python内置了求和函数sum(),但没有求积的函数,请利用recude()来求积:
输入:[2, 4, 5, 7, 12]
输出:2*4*5*7*12的结果
defprod(x, y):return x *yprint reduce(prod, [2, 4, 5, 7, 12])
python中filter()函数
filter()函数是 Python 内置的另一个有用的高阶函数,filter()函数接收一个函数 f 和一个list,这个函数 f 的作用是对每个元素进行判断,返回 True或 False,filter()根据判断结果自动过滤掉不符合条件的元素,返回由符合条件元素组成的新list。
例如,要从一个list [1, 4, 6, 7, 9, 12, 17]中删除偶数,保留奇数,首先,要编写一个判断奇数的函数:
defis_odd(x):return x % 2 == 1
然后,利用filter()过滤掉偶数:
filter(is_odd, [1, 4, 6, 7, 9, 12, 17])
结果:[1, 7, 9, 17]
利用filter(),可以完成很多有用的功能,例如,删除 None 或者空字符串:
defis_not_empty(s):return s and len(s.strip()) >0
filter(is_not_empty, ['test', None, '', 'str', ' ', 'END'])
结果:['test', 'str', 'END']
注意: s.strip(rm) 删除 s 字符串中开头、结尾处的 rm 序列的字符。
当rm为空时,默认删除空白符(包括' ', ' ', ' ', ' '),如下:
a = '123'a.strip()
结果: '123'
a=' 123 'a.strip()
结果:'123'
例子:
请利用filter()过滤出1~100中平方根是整数的数,即结果应该是:
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
importmathdefis_sqr(x):
r=int(math.sqrt(x))return r*r==xprint filter(is_sqr, range(1, 101))
python中自定义排序函数
Python内置的 sorted()函数可对list进行排序:
>>>sorted([36, 5, 12, 9, 21])
[5, 9, 12, 21, 36]
但 sorted()也是一个高阶函数,它可以接收一个比较函数来实现自定义排序,比较函数的定义是,传入两个待比较的元素 x, y,如果 x 应该排在 y 的前面,返回 -1,如果 x 应该排在 y 的后面,返回 1。如果 x 和 y 相等,返回 0。
因此,如果我们要实现倒序排序,只需要编写一个reversed_cmp函数:
defreversed_cmp(x, y):if x >y:return -1
if x
return 0
这样,调用 sorted() 并传入 reversed_cmp 就可以实现倒序排序:
>>> sorted([36, 5, 12, 9, 21], reversed_cmp)
[36, 21, 12, 9, 5]
sorted()也可以对字符串进行排序,字符串默认按照ASCII大小来比较:
>>> sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
'Zoo'排在'about'之前是因为'Z'的ASCII码比'a'小。
例子:
对字符串排序时,有时候忽略大小写排序更符合习惯。请利用sorted()高阶函数,实现忽略大小写排序的算法。
输入:['bob', 'about', 'Zoo', 'Credit']
输出:['about', 'bob', 'Credit', 'Zoo']
defcmp_ignore_case(s1, s2):
s1=s1.upper()
s2=s2.upper()if s1
else:return 1
print sorted(['bob', 'about', 'Zoo', 'Credit'],cmp_ignore_case)
python中返回函数
Python的函数不但可以返回int、str、list、dict等数据类型,还可以返回函数!
例如,定义一个函数 f(),我们让它返回一个函数 g,可以这样写:
deff():print 'call f()...'
#定义函数g:
defg():print 'call g()...'
#返回函数g:
return g
仔细观察上面的函数定义,我们在函数 f 内部又定义了一个函数 g。由于函数 g 也是一个对象,函数名 g 就是指向函数 g 的变量,所以,最外层函数 f 可以返回变量 g,也就是函数 g 本身。
调用函数 f,我们会得到 f 返回的一个函数:
>>> x = f() #调用f()
call f()...>>> x #变量x是f()返回的函数:
>>> x() #x指向函数,因此可以调用
call g()... #调用x()就是执行g()函数定义的代码
请注意区分返回函数和返回值:
defmyabs():return abs #返回函数
defmyabs2(x):return abs(x) #返回函数调用的结果,返回值是一个数值
返回函数可以把一些计算延迟执行。例如,如果定义一个普通的求和函数:
defcalc_sum(lst):return sum(lst)
调用calc_sum()函数时,将立刻计算并得到结果:
>>> calc_sum([1, 2, 3, 4])10
但是,如果返回一个函数,就可以"延迟计算”:
defcalc_sum(lst):deflazy_sum():returnsum(lst)return lazy_sum
# 调用calc_sum()并没有计算出结果,而是返回函数:
>>> f = calc_sum([1, 2, 3, 4])>>>f
# 对返回的函数进行调用时,才计算出结果:
>>>f()10
由于可以返回函数,我们在后续代码里就可以决定到底要不要调用该函数。
例子:
请编写一个函数calc_prod(lst),它接收一个list,返回一个函数,返回函数可以计算参数的乘积。
先定义能计算乘积的函数,再将此函数返回。
参考代码:
defcalc_prod(lst):deflazy_prod():deff(x, y):return x *yreturn reduce(f, lst, 1)returnlazy_prod
f= calc_prod([1, 2, 3, 4])print f()
python中闭包(相当于Java中的内部类)
在函数内部定义的函数和外部定义的函数是一样的,只是他们无法被外部访问:
defg():print 'g()...'
deff():print 'f()...'
return g
将 g 的定义移入函数 f 内部,防止其他代码调用 g:
deff():print 'f()...'
defg():print 'g()...'
return g
但是,考察上一小节定义的 calc_sum 函数:
defcalc_sum(lst):deflazy_sum():returnsum(lst)return lazy_sum
注意: 发现没法把 lazy_sum 移到 calc_sum 的外部,因为它引用了 calc_sum 的参数 lst。
像这种内层函数引用了外层函数的变量(参数也算变量),然后返回内层函数的情况,称为闭包(Closure)。
闭包的特点是返回的函数还引用了外层函数的局部变量,所以,要正确使用闭包,就要确保引用的局部变量在函数返回后不能变。举例如下:
#希望一次返回3个函数,分别计算1x1,2x2,3x3:
defcount():
fs=[]for i in range(1, 4):deff():return i*i
fs.append(f) #此处加入到数组中的是函数引用,并非函数值returnfs
f1, f2, f3= count() #所以此处可以f1,f2,f3接到的是函数引用,所以下文可以调用f1()
你可能认为调用f1(),f2()和f3()结果应该是1,4,9,但实际结果全部都是 9(请自己动手验证)。
原因就是当count()函数返回了3个函数时,这3个函数所引用的变量 i 的值已经变成了3。由于f1、f2、f3并没有被调用,所以,此时他们并未计算 i*i,当 f1 被调用时:
>>>f1()9 #因为f1现在才计算i*i,但现在i的值已经变为3
注意:
1)s.append(f),只是将每一个f()的引用保存进了list,并没有进行对于i的计算,所以导致最后在运行了f(1)之后,i已经变为了3,所以会一样结果都为9.只要将这里改为 fs.append(f())即可,这样就在这一步的时候已经进行了i*i的运算,将结果保存了,通过这一题可以注意到在python这门语言之中,f与f()的大区别。
2)f1, f2, f3 = count(),这句话的意思是f1=count()[0],f2=count()[1],f3=count()[2].这种赋值语句只能用于数组,一一对应。
因此,返回函数不要引用任何循环变量,或者后续会发生变化的变量。
例子:
返回闭包不能引用循环变量,请改写count()函数,让它正确返回能计算1x1、2x2、3x3的函数。
考察下面的函数 f:
deff(j):defg():return j*jreturn g
它可以正确地返回一个闭包g,g所引用的变量j不是循环变量,因此将正常执行。
在count函数的循环内部,如果借助f函数,就可以避免引用循环变量i。
参考代码:
defcount():
fs=[]for i in range(1, 4):deff(j):defg():return j*jreturn g #函数f()返回的是g函数
r=f(i) #变量r接到的也是函数引用
fs.append(r) #所以此处加入到数组的也是函数引用
returnfs
f1, f2, f3= count() #所以此处函数返回的也是函数引用
print f1(), f2(), f3() #所以可以调用f1(), f2(), f3()
python中匿名函数
高阶函数可以接收函数做参数,有些时候,我们不需要显式地定义函数,直接传入匿名函数更方便。
在Python中,对匿名函数提供了有限支持。还是以map()函数为例,计算 f(x)=x2时,除了定义一个f(x)的函数外,还可以直接传入匿名函数:
>>> map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9])
[1, 4, 9, 16, 25, 36, 49, 64, 81]
通过对比可以看出,匿名函数 lambda x: x * x 实际上就是:
deff(x):return x * x
关键字lambda 表示匿名函数,冒号前面的 x 表示函数参数。
匿名函数有个限制,就是只能有一个表达式,不写return,返回值就是该表达式的结果。
使用匿名函数,可以不必定义函数名,直接创建一个函数对象,很多时候可以简化代码:
>>> sorted([1, 3, 9, 5, 0], lambda x,y: -cmp(x,y))
[9, 5, 3, 1, 0]
返回函数的时候,也可以返回匿名函数:
>>> myabs = lambda x: -x if x < 0 elsex>>> myabs(-1)1
>>> myabs(1)1
例子:
利用匿名函数简化以下代码:
defis_not_empty(s):return s and len(s.strip()) >0 #s不为空且不是空字符串则返回true
filter(is_not_empty, ['test', None, '', 'str', ' ', 'END'])
定义匿名函数时,没有return关键字,且表达式的值就是函数返回值。
print filter(lambda s: s and len(s.strip())>0, ['test', None, '', 'str', ' ', 'END'])
装饰器
在面向对象(OOP)的设计模式中,decorator被称为装饰模式。OOP的装饰模式需要通过继承和组合来实现,而Python除了能支持OOP的decorator外,直接从语法层次支持decorator。Python的decorator可以用函数实现,也可以用类实现。
decorator可以增强函数的功能,定义起来虽然有点复杂,但使用起来非常灵活和方便。
python中编写无参数decorator
Python的 decorator 本质上就是一个高阶函数,它接收一个函数作为参数,然后,返回一个新函数。
使用 decorator 用Python提供的 @ 语法,这样可以避免手动编写f = decorate(f) 这样的代码。
考察一个@log的定义:
deflog(f):deffn(x):print 'call' + f.__name__ + '()...'
returnf(x)return fn
对于阶乘函数,@log工作得很好:
@logdeffactorial(n):return reduce(lambda x,y: x*y, range(1, n+1))print factorial(10)
结果:
call factorial()...3628800
把@log放到factorial(n)函数的定义处,相当于执行了语句:
factorial= log(factorial)
由于log()是一个decorator,返回一个函数,所以,原来的factorial(n)函数仍然存在,只是现在同名的factorial变量指向了新的函数,于是调用factorial()将执行新函数,即在log()函数中返回的fn(n)函数。
但是,对于参数不是一个的函数,调用将报错:
@logdefadd(x, y):return x +yprint add(1, 2)
结果:
Traceback (most recent call last):
File"test.py", line 15, in
print add(1,2)
TypeError: fn() takes exactly1 argument (2 given)
因为 add() 函数需要传入两个参数,但是 @log 写死了只含一个参数的返回函数。
要让 @log 自适应任何参数定义的函数,可以利用Python的 *args 和 **kw,保证任意个数的参数总是能正常调用:
deflog(f):def fn(*args, **kw):print 'call' + f.__name__ + '()...'
return f(*args, **kw)return fn
现在,对于任意函数,@log 都能正常工作。
例子:
请编写一个@performance,它可以打印出函数调用的时间。
计算函数调用的时间可以记录调用前后的当前时间戳,然后计算两个时间戳的差。
参考代码:
importtimedefperformance(f):def fn(*args,**kw):
t1=time.time()
r=f(*args,**kw)
t2=time.time()print 'call%s() in %fs'%(f.__name__,(t2-t1)) #注意这里的f.__name__中的短横是两个"__”不是一个"_”
returnrreturnfn
@performancedeffactorial(n):return reduce(lambda x,y: x*y, range(1, n+1))print factorial(10)
补充:
1)函数对象有一个__name__属性,可以拿到函数的名字:
>>> now.__name__
'now'
>>> f.__name__
'now'
python中编写带参数decorator
考察上一节的 @log 装饰器:
deflog(f):deffn(x):print 'call' + f.__name__ + '()...'
returnf(x)return fn
发现对于被装饰的函数,log打印的语句是不能变的(除了函数名)。
如果有的函数非常重要,希望打印出'[INFO] call xxx()...',有的函数不太重要,希望打印出'[DEBUG] call xxx()...',这时,log函数本身就需要传入'INFO'或'DEBUG'这样的参数,类似这样:
@log('DEBUG')defmy_func():pass
把上面的定义翻译成高阶函数的调用,就是:
my_func = log('DEBUG')(my_func)
上面的语句看上去还是比较绕,再展开一下:
log_decorator = log('DEBUG')
my_func= log_decorator(my_func)
上面的语句又相当于:
log_decorator = log('DEBUG')
@log_decoratordefmy_func():pass
所以,带参数的log函数首先返回一个decorator函数,再让这个decorator函数接收my_func并返回新函数:
deflog(prefix):deflog_decorator(f):def wrapper(*args, **kw):print '[%s] %s()...' % (prefix, f.__name__)return f(*args, **kw)returnwrapperreturnlog_decorator
@log('DEBUG')deftest():pass
print test()
执行结果:
[DEBUG] test()...
None
对于这种3层嵌套的decorator定义,你可以先把它拆开:
#标准decorator:
deflog_decorator(f):def wrapper(*args, **kw):print '[%s] %s()...' % (prefix, f.__name__)return f(*args, **kw)returnwrapperreturnlog_decorator#返回decorator:
deflog(prefix):return log_decorator(f)
拆开以后会发现,调用会失败,因为在3层嵌套的decorator定义中,最内层的wrapper引用了最外层的参数prefix,所以,把一个闭包拆成普通的函数调用会比较困难。不支持闭包的编程语言要实现同样的功能就需要更多的代码。
例子:
上一节的@performance只能打印秒,请给 @performace 增加一个参数,允许传入's'或'ms':
@performance('ms')deffactorial(n):return reduce(lambda x,y: x*y, range(1, n+1))
要实现带参数的@performance,就需要实现:
my_func = performance('ms')(my_func)
需要3层嵌套的decorator来实现。
参考代码:
importtimedefperformance(unit):defperf_decorator(f):def wrapper(*args,**kw):
t1=time.time();
r=f(*args,**kw)
t2=time.time()
t=(t2-t1)*1000 if unit=='ms' else (t2-t1)print "call%s() in %f%s" %(f.__name__,t,unit)returnrreturnwrapperreturnperf_decorator
@performance('ms')deffactorial(n):return reduce(lambda x,y: x*y, range(1, n+1))print factorial(10)
python中完善decorator
@decorator可以动态实现函数功能的增加,但是,经过@decorator"改造”后的函数,和原函数相比,除了功能多一点外,有没有其它不同的地方?
在没有decorator的情况下,打印函数名:
deff1(x):pass
print f1.__name__
输出: f1
有decorator的情况下,再打印函数名:
deflog(f):def wrapper(*args, **kw):print 'call...'
return f(*args, **kw)returnwrapper
@logdeff2(x):pass
print f2.__name__
输出: wrapper
可见,由于decorator返回的新函数函数名已经不是'f2',而是@log内部定义的'wrapper'。这对于那些依赖函数名的代码就会失效。decorator还改变了函数的__doc__等其它属性。如果要让调用者看不出一个函数经过了@decorator的"改造”,就需要把原函数的一些属性复制到新函数中:
deflog(f):def wrapper(*args, **kw):print 'call...'
return f(*args, **kw)
wrapper.__name__ = f.__name__wrapper.__doc__ = f.__doc__
return wrapper
这样写decorator很不方便,因为我们也很难把原函数的所有必要属性都一个一个复制到新函数上,所以Python内置的functools可以用来自动化完成这个"复制”的任务:
importfunctoolsdeflog(f):
@functools.wraps(f)def wrapper(*args, **kw):print 'call...'
return f(*args, **kw)return wrapper
最后需要指出,由于我们把原函数签名改成了(*args, **kw),因此,无法获得原函数的原始参数信息。即便我们采用固定参数来装饰只有一个参数的函数:
deflog(f):
@functools.wraps(f)defwrapper(x):print 'call...'
returnf(x)return wrapper
也可能改变原函数的参数名,因为新函数的参数名始终是 'x',原函数定义的参数名不一定叫 'x'。
例子:
请思考带参数的@decorator,@functools.wraps应该放置在哪:
defperformance(unit):defperf_decorator(f):def wrapper(*args, **kw):
???returnwrapperreturn perf_decorator
注意@functools.wraps应该作用在返回的新函数上。
参考代码:
importtime, functoolsdefperformance(unit):defperf_decorator(f):
@functools.wraps(f) #@functools.wraps应该作用在返回的新函数上def wrapper(*args,**kw):
t1=time.time()
r=f(*args,**kw)
t2=time.time()
t=(t2-t1)*1000 if unit=='ms' else (t2-t1)print 'call%s() in %f%s'%(f.__name__,t,unit)returnrreturnwrapperreturnperf_decorator
@performance('ms')deffactorial(n):return reduce(lambda x,y: x*y, range(1, n+1))print factorial.__name__
python中偏函数
Python的functools模块提供了很多有用的功能,其中一个就是偏函数(Partial function)。要注意,这里的偏函数和数学意义上的偏函数不一样。
在介绍函数参数的时候,我们讲到,通过设定参数的默认值,可以降低函数调用的难度。而偏函数也可以做到这一点。
当一个函数有很多参数时,调用者就需要提供多个参数。如果减少参数个数,就可以简化调用者的负担。
比如,int()函数可以把字符串转换为整数,当仅传入字符串时,int()函数默认按十进制转换:
>>> int('12345')12345
但int()函数还提供额外的base参数,默认值为10。如果传入base参数,就可以做 N 进制的转换:
>>> int('12345', base=8)5349
>>> int('12345', 16)74565
假设要转换大量的二进制字符串,每次都传入int(x, base=2)非常麻烦,于是,我们想到,可以定义一个int2()的函数,默认把base=2传进去:
def int2(x, base=2):return int(x, base)
这样,我们转换二进制就非常方便了:
>>> int2('1000000')64
>>> int2('1010101')85
functools.partial就是帮助我们创建一个偏函数的,不需要我们自己定义int2(),可以直接使用下面的代码创建一个新的函数int2:
>>> importfunctools>>> int2 = functools.partial(int, base=2)>>> int2('1000000')64
>>> int2('1010101')85
所以,functools.partial可以把一个参数多的函数变成一个参数少的新函数,少的参数需要在创建时指定默认值,这样,新函数调用的难度就降低了。
例子:
在上面小节中,我们在sorted这个高阶函数中传入自定义排序函数就可以实现忽略大小写排序。请用functools.partial把这个复杂调用变成一个简单的函数:
sorted_ignore_case(iterable)
要固定sorted()的cmp参数,需要传入一个排序函数作为cmp的默认值。
参考代码:
importfunctools
sorted_ignore_case= functools.partial(sorted,cmp=lambdas1,s2:cmp(s1.upper(),s2.upper()))print sorted_ignore_case(['bob', 'about', 'Zoo', 'Credit'])
本篇博客参考: