作为一名算法工程师,如何快速实现一个想法并验证它是否有效对日常工作至关重要。Python 是一个出色的工具,可以很方便地实现这一点。它允许我们专注于想法本身,而不会被繁杂的代码实现所困扰。
然而,小伙伴们一定都听说过,Python脚本语言有一个致命缺点:相比比 C 或 C++ 等编译语言Python运行慢得多。那么,在我们通过构建 Python 快速实现了一个想法之后,现在我们想将它变成一个快速且高性能的工具,我们该怎么办?通常情况下,我们最终会耗费大概两倍的时间来将 Python 代码手动转换为 C/C++。
但是如果我们的 Python 代码本身可以运行得更快,那不是很好吗?那么如何实现呢?
幸运的是,我偶然发现了该问题的解决方案:PyPy,它是 Python运行时快速的替代品。
为了直观对比 PyPy可以提升多少加速效果,我在以下示例中同时运行了默认的 Python 解释器和 使用PyPy,代码如下:
import time
from termcolor import colored
start = time.time()
number = 0
for i in range(100000000):
number += i
print(colored("FINISHED", "green"))
print(f"Ellapsed time: {time.time() - start} s")
简单来说,上述脚本在一个循环中将 0 到 100,000,000 之间的所有整数相加,并在完成时打印一条消息和整个代码脚本运行时间。
尽管只是简单的对比,但上述例子的加速效果仍然令人兴奋。与大约需要 10 秒的默认 Python 解释器相比,PyPy 仅在 0.22 秒后就完成了执行!另外,请注意,我们可以直接将 Python 代码提供给 PyPy,而无需对代码做任何更改。
当我们将其与 C语言实现的版本进行比较时,结果会更加令人印象深刻。在我的电脑上,C 中的等效实现需要 0.32 秒。尽管在大多数情况下 C 总体上仍然是速度大师,但 PyPy 在某些情况下可以击败 C。
需要注意的是:
当我们的程序大部分运行时间都来自于调用非 python 库(比如Cpython)时,PyPy 的效率会降低。但是,如果我们有一个缓慢的程序,大部分时间都花在执行调用 Python库相关代码上时,那么 PyPy 可以极大地提升代码的运行效率。
如果你也是第一次遇到 PyPy,那么您可能会问自己"PyPy运行这么快的背后原理是啥?"
额。。。 回顾我们的实验,我们运行完全相同的代码,并且使用 PyPy 似乎可以免费获得巨大的加速,黑科技哎。。。
其实尽管代码完全相同,但两种方式下的代码的执行方式却大不相同。 PyPy 性能提升的秘诀在于即时编译,简称 JIT 编译。
C、C++ 以及 Swift、Haskell、Rust 等编程语言都是提前编译的。这意味着,在我们用这些语言编写了一些代码之后,需要点击一个build按钮,编译器就会将源代码转换为机器可读的代码,由一种特定的计算机架构读取。每当执行程序时,您的原始源代码早已不复存在。执行的只是机器代码。
Python、JavaScript、PHP 等类似开发语言采用不同的方法。它们都是可以被解释的。与将源代码转换为机器代码相比,源代码保持不变。每次程序运行时,解释器都会逐行“查看”代码并为我们运行它。
对于 JavaScript,每个 Web 浏览器都内置了一个解释器。标准的 Python 解释器称为 CPython。但是,区分 Python 语言脚本和运行代码的解释器工具是非常重要的,那是因为我们可以拥有完全不同的工具,它们都具有运行 Python 代码的能力。这就是 PyPy 发挥作用的地方。
PyPy 是利用即时编译的 Python 的替代实现。背后的原理是 PyPy 开始时就像一个解释器,直接从源文件运行我们的 Python 代码。但是,PyPy 不是逐行运行代码,而是在执行它们之前将部分代码编译为机器代码,可以说是及时。
从这个意义上说,JIT 编译是解释和提前编译的结合。这样,我们不仅获得了提前编译的性能提升,而且解释性语言的灵活性和跨平台可用性也保留了下来。
现在我们了解了 PyPy 如何实现惊人的性能提升背后的原理。在官网 pypy.org 上免费提供PyPy安装包。除了工具本身,该网站还包含大量关于微调 Python 程序以进一步提高性能的技巧。由于 PyPy 只是 Python 的一种替代实现,大多数时候它都是开箱即用,无需对 Python 项目进行任何更改。它与 Web 框架 Django、科学计算包 Numpy 和许多其他包完全兼容,推荐大家多多使用。
关注公众号《AI算法之道》,获取更多AI算法资讯。
参考