大鸡啄米

【Python】为什么说python很慢

原地址

讲的非常简单易懂

我们之前一定听有人说过，python的执行速度比其他语言慢。

我们通常的解释是：python是一个动态的解释型语言；python中的值不是存储在缓存区而是分散的存储在对象中。通过使用Numpy和Scipy等相关可以进行矢量化操作的工具并调用编译后的代码来绕过这个问题来避开这个问题。

然而，“动态类型 - 解释 - 缓冲 - 矢量化编译”这些词的解释太过笼统。这些解释不能解释python运行过慢的底层性的深层次原因。最佳无意间在网上看到这样一边帖子《Why Python is Slow: Looking Under the Hood》便翻译一下，贴出来供大家参考。

为什么python比较慢？python比Fortran和C语言慢的原因

1.1. python是动态性语言不是静态性语言

这是说在python程序执行的时候，编译器不知道变量的类型。图1.展示了C语言中的变量与python中变量的区别。在C中编译器知道变量在定义时的类型，而python中执行的时候只知道它是一个对象。

图1

因此，如果您在C中编写以下内容：

/ * C代码* /

int a = 1 ;

int b = 2 ;

int c = a + b ;

C编译器从一开始就知道a并且b是整数：它们根本不可能是其他任何东西！有了这些知识，它可以调用添加两个整数的例程，返回另一个整数，它在内存中只是一个简单的值。在C中执行的流程大概如下：

###C加法：

1. 分配1给a；

2. 分配2给b；

3. 调用二进制加法binary_add(a, b)(a, b)；

4. 将结构分配给c变量

python中等效的代码如下：

# python code

a = 1

b = 2

c = a + b

这里解释器只知道1和2是对象，但不知道它们是什么类型的对象。因此解释器必须检查每个变量的PyObject_HEAD以找到类型信息，然后为这两种类型调用适当的求和例程。最后，它必须创建并初始化一个新的Python对象来保存返回值。执行流程大致如下：

###Python 加法

1. 分配1给a

（1）设置a->PyObject_HEAD->typecode为整数

（2）设置Set a->val = 1

2. 分配2给b

（1）设置 b->PyObject_HEAD->typecode 为整数

（2）设置 b->val = 2

3. 调用二进制加法binary_add(a, b)

（1）找到类型代码 a->PyObject_HEAD

（2）a是整数，值为a->val

（3）找到类型代码 b->PyObject_HEAD

（4）b是整数，值为b->val

（5）调用二进制加法 binary_add(a->val, b->val)

（6）结果是result，是一个整数。

4. 创建一个新的对象c

（1）设置 c->PyObject_HEAD->typecode 为整数

（2）将 c->val 分配给结果

动态类型意味着任何操作都需要更多的步骤。这是Python在数值数据操作方面比C慢的主要原因。

1.2. python是解释性语言而不是编译性语言

解释型语言与编译型语言它们本身的区别也会造成程序在执行的时候的速度差异。一个智能化的编译器可以预测并针对重复和不需要的操作进行优化。这也会提升程序执行的速度。

1.3. python的对象模型会导致访问内存效率低下

在上面的例子中，相对于C语言，在python中对整数进行操作会有一个额外的类型信息层。当有很多的整数并且希望进行某种批操作时，在python中往往会使用一个list，而在C中会使用某个基于缓存区的数组。

在Numpy数组的最简单的形式是一个围绕着C中的数组建的一个python对象。也就是说Numpy有一个指针指向连续缓存区数据的值，而在python中，python列表有一个只想缓存区的指针，每个指针都指向一个python缓存对象，而且每个对象都绑定一个数据（本例中是整数）。这两种情况的原理图如图2：

图2

从图2中可以很明显的看出，当对数据进行操作时（例如排序、计算、查找等），无论是在存续成本还是访问成本上，Numpy都比python更加的高效。

1.4. 为什么我们还要使用python

既然用pytho处理数据那么低效，那么为什么我们还要使用python呢？主要是因为，python是动态的语言，它比C更加的容易上手使用，而且用法更加的灵活和兼容，这可以极大的节省开发时间。而且，python是开源的，跨平台，具有很强的移植性。在那些真正需要运用C或Fortran进行优化的场合中，python都有强大的API或库进行支持。这就是为什么Python在许多科学社区中的使用一直在不断增长。所以，Python最终成为使用代码进行科学研究的总体任务的极其有效的语言。

上面已经谈到了python的一些特有的内部结构，但文章并不想止步于此，下面对python进行一些黑客攻击，这个过程很具有启发性。

接下来的部分将使用黑客攻击来暴露一些python对象来证明上述信息的正确性。请注意，以下所有内容均使用Python 3.4编写。早期的python版本python对象的内部结构不同，随后的版本其内部的对象结构也会发生调整，所以注明python的版本很重要。请确保使用正确的版本！此外，下面的大多数代码假定为64位CPU。如果您使用的是32位平台，则必须调整下面的某些C类型以解释这种差异。

2.1. 深入研究python整型

Python中的整数易于创建和使用：

然而，这个界面的简单性却隐藏了底层的复杂性，上面的叙述中简要讨论了python整数在内存中的布局。在这里，我们将使用Python的内置ctypes模块从Python解释器本身检查Python的整数类型。首先我们需要准确的指导在C的API级别上python的整型是什么样子的。

CPython中的实际x变量存储在CPython源代码(包含Include / longintrepr.h)中定义的结构中。

struct _longobject {

PyObject_VAR_HEAD

digit ob_digit[1];

};

PyObject_VAR_HEAD是一个宏，它使用以下结构启动对象，该结构在Include / object.h中定义：

typedef struct {

PyObject ob_base ;

Py_ssize_t ob_size ; / *变量部分中的项目数* /

} PyVarObject ;

...并包含一个PyObject元素，该元素也在Include / object.h中定义：

typedef struct _object {

_PyObject_HEAD_EXTRA

Py_ssize_t ob_refcnt;

struct _typeobject *ob_type;

} PyObject;

这里_PyObject_HEAD_EXTRA是一个宏，它通常不在Python构建中使用。

把所有这些放在一起，typedef / macros不进行模糊处理，我们的整数对象就就可以解决如下结构：

struct _longobject {

long ob_refcnt;

PyTypeObject *ob_type;

size_t ob_size;

long ob_digit[1];

};

ob_refcnt变量是对象的引用计数，ob_type变量是指向包含对象的所有类型信息和方法定义的结构的指针，ob_digit保存实际的数值。

有了这些知识，我们将使用ctypes模块开始查看实际的对象结构，并提取上面的一些信息。

首先，我们在C中定义一个python。

现在让我们看看一些数字的内部表示，比如说42。我们将使用在cPython中ID函数给出对象的内存的位置：

ob_digit属性指向内存中的正确位置！

但是refcount怎么办？只创建了一个值，为什么引入比这个值大得多的数？

事实上python中使用了很多的小整数。如果PyObject为这些整数中的每一个创建了一个新的，那将占用大量内存。因此，Python将公共整数值实现为单例：即，内存中只存在这些数字的一个副本。换句话说，每次在此范围内创建新的Python整数时，您只需使用该值创建对单例的引用：

这两个变量都是指向同一内存地址的指针。当你得到更大的整数（在Python 3.4中大于255）时，这不再是True：

只要启动Python解释器，就会创建许多整数对象;看看有多少引用可能是很有趣的:

我们看到零被引用几千次，并且正如您所预期的那样，引用的频率通常随着整数值的增加而减小。为了进一步确保这样做符合我们的预期，让我们确保该ob_digit字段保持正确的值：

如果你更深入一点，你可能会注意到这不适用于大于256的数字：事实证明，一些位位移操作是在Objects / longobject.c中执行的，它们改变了内存中表示大整数的方式。我不能说我完全理解为什么会发生这种情况，但我认为这与Python有效处理超过long int数据类型溢出限制的整数的能力有关，正如我们在这里看到的：

这些数太长了而不能变为long整型，long整型只能储存64位。

2.2 深入研究python列表

让我们将上述想法应用于更复杂的类型：Python列表。类似于整数，我们在Include / listobject.h中找到列表对象的定义：

typedef struct {

PyObject_VAR_HEAD

PyObject **ob_item;

Py_ssize_t allocated;

} PyListObject;

同样，我们可以扩展宏并对类型进行去混淆，以查看结构实际上是以下内容：

typedef struct {

long ob_refcnt;

PyTypeObject *ob_type;

Py_ssize_t ob_size;

PyObject **ob_item;

long allocated;

} PyListObject;

这里PyObject **ob_item是指向列表内容的对象，该ob_size值告诉我们列表中有多少项。

我们来试试吧：

为了确保我们已经正确完成了任务，让我们创建一些额外的列表引用，并查看它如何影响引用计数：

现在让我们看看如何找到列表中的实际元素。如上所述，元素通过连续的PyObject指针数组存储。使用CyType，我们实际上可以创建一个复合结构，它由以前的IntStruct对象组成：

现在让我们来看看每个项目中的值：

我们已经恢复了列表中的PyObject整数！您可能希望花一点时间回顾上面列表内存布局的原理图，并确保您了解这些ctypes操作如何映射到该图表。

2.3 深入研究Numpy数组

现在，为了比较，让我们对numpy数组进行相同的检查。我将跳过NumPy C-API数组定义的详细介绍; 如果你想看看它，你可以在中找到它https://github.com/numpy/numpy/blob/maintenance/1.8.x/numpy/core/include/numpy/ndarraytypes.h#L646请注意，我在这里使用Numpy 1.8版; 这些内部可能在不同版本之间发生了变化。

让我们从创建一个表示Numpy数组本身的结构开始。这应该开始看起来很熟悉…

我们还将添加一些定制属性来访问Python版本的shape和stride：

现在让我们试一试：

我们看到我们已经提取出正确的shape信息。让我们确保引用计数是正确的：

现在，我们可以完成提取数据缓冲区的复杂部分。为了简单起见，我们将忽略大步并假设它是一个C连续数组；这可以用一点工作来概括。

该data变量现在是Numpy数组中定义的连续内存块的视图！为了表明这一点，我们将更改数组中的值...

...并观察数据视图也会发生变化。两者x并data都指向的存储器中的相同的连续块。

比较Python列表和Numpy ndarray的内部结构，对于表示相同类型的数据，很明显Numpy的数组要比列表要简单得多。

2.4 修改整数的值

受这篇Reddit帖子的启发，我们可以修改整数对象的数值！如果我们使用一个普通的数字，比如0或1，我们很可能会崩溃我们的Python内核。但是如果我们用不那么重要的数字来做，我们就可以侥幸逃脱，至少暂时的。

请注意，这是一个非常非常糟糕的主意。特别是，如果你在IPython笔记本中运行它，你可能会破坏IPython内核的运行能力（因为你在运行时搞乱了变量）。尽管如此，我们还是会用指出：

但是现在请注意，我们不能以简单的方式返回值，因为Python中不再存在真正的113的值！

恢复的一种方法是直接操作字节。所以在运行Python 3.4的小端64位系统上，以下工作可以做：

2.5 列表内容的就地修改

上面我们对Numpy数组中的值进行了就地修改。这很容易，因为Numpy数组只是一个数据缓冲区。但是我们可以为列表做同样的事情吗？这会变得有点棘手，因为列表存储对值的引用而不是值本身。为了不让Python本身崩溃，你需要非常小心地跟踪这些引用计数。可以用一下方式完成：

就像我说的，你永远都不应该用这个，老实说，我想不出任何你想用的理由。但它让您了解了解释器在修改列表内容时必须执行的操作类型。与上面的Numpy示例相比，您将看到为什么Python列表比Python数组开销更大的一个原因。

2.6 Meta Goes Meta：自包装Python对象

使用上述方法，我们可以开始变得更加陌生。所述Structure类ctypes本身是一个Python对象，其中可以看到模块/ _ctypes / ctypes.h。正如我们包装整数和列表一样，我们可以按如下方式自行包装结构：

现在我们将尝试制作一个包裹自己的结构。我们不能直接这样做，因为我们不知道内存中的哪个地址将创建新结构。但我们可以做的是创建第二个包装第一个结构，并使用它来就地修改其内容！

我们首先制作一个临时的元结构并将其包装起来：

现在我们添加第三个结构，并使用它来就地调整第二个内存值：

我们现在有一个自包装的Python结构！再说一次，我想不出你有什么理由想要这样做。并且请记住，在Python中有关于这种类型的自引用的开创性 - 由于它的动态类型，在不直接破解内存的情况下执行这样的操作是非常简单的：

3. 结论

Python很慢。正如我们所看到的那样，其中一个重要原因就是引擎盖下的类型间接，这使得开发人员可以快速，轻松，有趣地使用Python。正如我们所见，Python本身提供的工具可以用来攻击Python对象本身。

我希望通过对各种物体之间的差异的探索以及CPython本身内部的一些自由捣蛋来更清楚地说明这一点。这个练习对我来说非常有启发性，我希望它也适合你...快乐的黑客攻击！

这篇博客文章完全是在IPython Notebook中编写的。完整的笔记本可以在查看下载，或在这里静态查看。

你可能感兴趣的:(Python&Analyz)

windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情