Python进阶(二)

博客链接:http://inarrater.com/2016/07/03/pythonadvance2/

这一部分是关于Python的Callable。在Stackoverflow上有一个专门的问题叫做“What is a "callable" in Python”,高票回答中说:

A callable is anything that can be called.

这个回答很抽象,大雄从更具体的角度来阐述Callable这个概念——在Python中哪些是callable的?

  • function
  • closure
  • bound method
  • unbound method
  • class method
  • static method
  • functor
  • operator
  • class

先说答案,很明显,列出的这些都是callable的。这些概念中的大部分我在工作中都有使用,包括比如closure的坑也帮助新同学调试bug的时候看到新入职的同学自己踩到过,但是对于bound methodunbound method这些概念还不是很清晰。我们也一个个来看。

3. Closure

Closure,闭包,在Python中本质上是一个函数,或者更具体来说它和Function的区别是它包含了Code和Environment,而Python中Environment又可以分为globals、locals和cells三部分。
globals和locals比较容易理解,其实就是两个dict,分别保存了全局变量和局部变量,那这个cells是什么?我们先来看一个非常经典的例子:

def foo():
    logout_lst = []

    for i in xrange(5):
        def logout():
            print i
        logout_lst.append(logout)

    for l in logout_lst:
        l()

foo()

思考:这段代码的输出是什么?

分析一下这段代码,虽然这里为了方便演示,构造了一个只有print的逻辑,你可能会质疑它的作用,但是在我们开发的过程中,就有同学在循环内部定义了类似的闭包用于引擎回调的调用,引用了外部了一个类似i的变量。例子中,在foo的函数内部,代码def logout()定义了一个闭包(写到这里让我想起了遥远的过去写JAVA代码时使用的Inner Class),然后我们想使用外部变量i的值,这里只是把它输出出来,通常我们想要输出的结果是打印0、1、2、3、4这几个数字,当然中间有换行,但是最终的输出结果是什么呢?
5个4!
为什么呢?我们来添加一些输出日志来查看一下,为了方便看输出,我们只循环两次来看,修改后的代码如下:

def foo():
    logout_lst = []

    for i in xrange(2):
        def logout():
            print "i:", i, id(i)
            print "globals:", globals()
            print "locals:", locals()
        logout_lst.append(logout)

    for l in logout_lst:
        l()
        print "Cells:", l.__closure__, id(l.__closure__[0].cell_contents)
        print ''

foo()

输出的结果如下:

i: 1 35882616
globals: {'__builtins__': , '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': , '__doc__': None}
locals: {'i': 1}
Cells: (,) 35882616

i: 1 35882616
globals: {'__builtins__': , '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': , '__doc__': None}
locals: {'i': 1}
Cells: (,) 35882616

首先打印一下i的值与i这个变量的id,你可以认为这是i在Python虚拟机中的唯一编号,两次输出它的值都是1,id也都是一个35882616,然后输出一下globals和locals看一下,这两个很简单,不做分析了。最后通过__closure属性来看下闭包的内容:

Cells: (,)

这就是前面说的cells,它是一个cell对象,里面的内容有一个int对象,通过cell_contents属性可以查看到它的id是35882616,和i是一样的。
可以看出,cells就是对于up-values的引用(references)注意引用
那之前的输出就很容易理解了,引用,当后面调用闭包执行的时候,i变量值已经变成了4,那输出i自然每次都是4。
最后,如何修改可以让你的代码可以按照之前的计划正常执行呢?很简单,不要直接使用cells中的值,而是用一个参数来让它变成参数,就是定义这个闭包的时刻的值了。

def foo():
    logout_lst = []

    for i in xrange(2):
        def logout(x = i):
            print "x:", x, id(x)
            print "globals:", globals()
            print "locals:", locals()
        logout_lst.append(logout)

    for l in logout_lst:
        l()
        print "Cells:", l.__closure__
        print ''

foo()

输出结果:

x: 0 37062276
globals: {'__builtins__': , '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': , '__doc__': None}
locals: {'x': 0}
Cells: None

x: 1 37062264
globals: {'__builtins__': , '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': , '__doc__': None}
locals: {'x': 1}
Cells: None

此处,cells的内容变为了None,输出的结果也是0和1,它们的id自然也不同。其实参数也可以写成def logout(i = i):,内部可以使用i,但是这会造成一些困扰,个人不推荐这么写。

思考:那么你以为这个坑就踩完了吗?有没有哪里还可能存在问题?

def logout(x = i):这种定义虽然用在闭包里,但是其实是函数的默认参数,那么默认参数如果使用list、dict或者python object等这样mutable的值会怎样?这自然是另外一个入门级的坑:

背景: 不建议在函数默认参数中使用mutable value,而保证只使用immutable value。

但有时候为了解决一个坑,可能不小心踩入另外一个坑。如果这里使用了,比如一个list对象作为参数,那么创建出来的这几个闭包中的x都引用的会是同一个对象,而且,在任何一个闭包多次调用的时候,x的值都是同一个对象的引用。如果像例子中是只读的逻辑的话,可能没有问题,如果后面有人添加了修改的逻辑,那就呵呵呵呵了。可能会乱成一锅粥,出现各种神奇的现象,写这样逻辑的人自求多福吧。

总结:理解闭包的概念,理解引用的概念,编写代码保持思路清晰,明确自己使用的变量存在在哪里,是一件非常非常重要的事情,对团队开发中避免匪夷所思令人抓狂的Bug很有帮助!

这一部分只讲闭包这一个点,其实关于闭包还有很多知识点,有兴趣的可以自己查阅相关资料。第三部分讲解bound method和unbound method,这是我这次课程最喜欢的部分。

PS: 很多坑,你看过文章介绍,或者听同事讲过,但是写代码的时候有时还是会由于当时思路的混乱而饶进去,重新踩一遍,这往往难以避免,不亲身经历的坑思维上很难那么敏感。经验学习和知识积累的作用,是让你从坑中往外爬的时候更快一些,回头看那些坑印象更深刻一些。

2016年7月2日于杭州网易大厦

你可能感兴趣的:(Python进阶(二))