Python闭包(closure)详解

阿巴阿巴阿巴,老Amy 来啦~由于闭包这家伙是块难啃得的骨头,所以 老Amy 就想着用一篇逐字稿帮助大家来搞定它!

首先,在 get 闭包这个知识点之前,我们已经知道了函数的作用域。那现在考考大家,思考如下代码是否有问题?

def test():
    a = 1
    
    def test_in():
        a += 1
        print(a)
        
    return test_in


res = test()
res()

那如果说大家觉得 no problem 的话,那你就把该代码拷贝到你的 pycharm 中,就会发现 OMG,怎么报错了呢?

Python闭包(closure)详解_第1张图片
其实就是因为在 test 这个函数中的 a 变量作用域是 enclosing ,那在 test_in 当中对 a 进行了 a += 1 的操作。此时,程序就不太明白 test_in 中的 a,是local还是enclosing ,所以报错。解决方案或详细解释参考:链接: https://blog.csdn.net/weixin_44352981/article/details/110819292.

此处代码应将 test_in 中的变量声明为非局部变量,如下:

def test():
    a = 1

    def test_in():
        nonlocal a
        a += 1
        print(a)

    return test_in


res = test()
res()           # test_in() 

那如果这块大家可以想通透的话,意味着大家对作用域的概念也掌握的很不错了。

接下来我们就思考新的问题:我们知道,一个函数中的局部变量会随着函数的运行结束而消失。那对于示例中 test() 里面的 test_in(),它是如何在外层函数代码块已经结束后仍然可以引用到 a 的呢

要理解这个问题,我们还是先来了解闭包的概念。

闭包

目前在大多数主流编程语言中,都支持闭包。笼统的说,闭包( Closure )是一种在将函数作为头等公民的计算机程序设计语言中实现词法作用域下名称绑定的技术

追根溯源,闭包的概念最初是由英国计算机科学家彼得·兰丁在 20 世纪 60 年代定义的,它将闭包定义为一种包含环境部分( environment part )和控制部分( control part )的实体,这个概念也反映了闭包在实现层面的构成。

那么,具体到实现层面来看,闭包由一个函数其关联环境组成,在内部通常由包含有一个函数地址和一个映射的结构体来实现,在映射中(即对应的环境部分)包含了自由变量的名称-值映射关系

这段描述中,我们提到了两个比较陌生的名词,这里解释一下:

  • 将函数作为头等公民的计算机程序设计语言,即该语言支持头等函数( first-class functions )。如何理解头等函数的概念?头等函数是函数式编程中的核心要素,它表示我们在程序设计中可以将函数赋值给变量作为其他函数的参数 / 返回值,以及存储在一些复合数据结构中。比如我们在 Python 中经常使用的内置函数 map(func, *iterables) ,它会将函数作为参数应用在 iterables 中的每一项。简单来说,也就是我们所接触过的高阶函数。

  • 什么是自由变量?下面是关于自由变量在 Python 官方文档中的解释。

    如果名称绑定在一个代码块中,则为该代码块的局部变量,除非声明为 nonlocalglobal
    如果名称绑定在模块层级,则为全局变量 (模块代码块的变量既为模块局部变量又为全局变量) 。
    如果变量在一个代码块中被使用但不是在其中定义,则为自由变量。

那此时,我们结合代码来理解自由变量,如下:

a = 1


def test():
    b = 2

    def test_in():
        print(a, b)

    return test_in


res = test()
res()           # test_in()

在这里,我们发现对于 test_in 来说,按照这个定义的完整自由变量集合既包括 a,也包括 b

但这里我们需要缩小一下范围,我们在闭包中所说的自由变量,指的仅仅是 b,而不包括 a,所以对于我们在闭包场景下所说的自由变量的一个更细化的定义是:

Variables that are used locally, but defined in an enclosing scope.

也就说明,自由变量是在 local 作用域使用,但是定义在 enclosing

上面我们讲到了,闭包是一种函数环境的组合体。但仍然需要进一步细化,闭包不同于函数,它和一个常见函数的不同点在于,闭包使用了自由变量,并且闭包中的自由变量在脱离了定义该自由变量的上下文环境后,仍然可以正常的被使用,这也是为什么外层函数运行结束后 test_in 可以引用到 a 的原因。

这里我们基本的说明了闭包的核心概念,那么什么情况下会产生闭包呢?

其实上面的概念也能够从某种程度上说明这个问题,不过我们还是举个例子来说明,这样更加明确一些:当我们在一个外层函数中定义了一个内嵌的函数时,如果在这个内嵌的函数中使用了自由变量,那么将在编译过程中产生闭包。

这时我们再回过头看看最开始我们定义的两个函数,显而易见的是,我们应用了闭包的能力。这里,我们给之前的代码增加一些内容,用于说明一些内部的情况。

def test(a):
    b = 2

    def test_in():
        print(a, b)

    return test_in


res = test(1)
print(res.__closure__)  # (, )
print([i.cell_contents for i in res.__closure__])  # [1, 2]
print(res.__code__.co_freevars)  # ('a', 'b')

常常有人将闭包解释为一种可以记住外层函数内部变量的函数(哪怕是外层函数对应的嵌套作用域已不存在),虽然这种解释在直观的角度上来看并没有太大的问题。但我们应该更清楚的了解,闭包不仅仅指的是一种嵌套函数,其更全面的是指一种由函数和环境共同构成的实体

我们可以利用闭包来为内嵌函数保持状态,这样可以简单的代替类的编写,所以有人也将这种方式称为“穷人的类”:

def test(a):

    def test_in(b):
        print(a + b)

    return test_in


res = test(10)
res(1)  # 11
res(2)  # 12
res(3)  # 13

另外,产生闭包时通常不会真正执行,闭包在被调用真正执行,所以这也是一种惰性求值的方式,并且也可以用于实现更复杂的控制结构。

有更多关于 python 的学习,欢迎关注公众号奥~
Python闭包(closure)详解_第2张图片

你可能感兴趣的:(少女的技术文章,python)