《Python源码剖析》笔记-python中的对象

本书1-5章讲的是python中的对象,对应于源码objects目录中的内容。第1章是最基本的对象,第2章是整数对象,第3章是字符串对象,第4章是列表对象,第5章是字典对象。这5章中,基本对象、列表变化不大;2中的整数和长整数在3中间进行了合并;字符串和Unicode字符串在3中进行了合并;而字典对象则采用了新的实现,以提高性能表现。2与3的差别对应1-4章的内容如下:

第1章

第1章讲的是python中的对象。

3里面的PyObject对象没有变,但宏定义和2不同。3中是先定义了PyObject结构体,然后将一个结构体的对象定义为PyObject_HEAD宏。每次使用这一宏时,相当于定义了一个PyObject成员。

3中整数的基本类型是long类型,这一对象_longobject在longintrepr.h中定义。由于长整数类型支持任意长的整数,因此也是一个变长类型,使用了PyObject_VAR_HEAD。

类型对象没有什么变化。

第2章

第2章介绍的是Python2中的Int类型。

在Python3中,Int类型被取消,基本的整数类型成了Long类型,因此有很多地方是不同的。

最主要的变化是:1,长整型是一个变长的对象。2,取消了原来的整数池。

具体来看看这一章的内容。

首先Long类型的头文件不止longobject.h一个,还有一部分内容在longintrepr.h中,比如_longobject这一结构体的定义。

PyIntObject是一个固定大小的对象,在PyObject_HEAD后就是这一对象对应的数值,以ob_ival存储。而PyLongObject则是一个变长对象,在PyObject_VAR_HEAD后是一个数组,用来存储这一对象对应的数值。对应的运算如Long_Compare,与Int对象有所不同。

小整数对象的优化在python3中也得到了保留。

在一个整数对象生成时,会判断这个数的数值是否在小整数的范围之内,如果是一个小整数,则直接引用小整数对象,而不用重新生成对象。

而通用整数池则在Python3中得到了取消。2中的通用整数池技术,使得整数占用的空间一经分配就不会释放。

而Python3中取消了这一技术,则整数在使用完之后空间会得到释放。这一点可能用任务管理器来直接观察。

运行下面的代码,每一步的内存变化如表:

《Python源码剖析》笔记-python中的对象_第1张图片

内存占用情况

可以看到,在生成出了这些整数对象之后,python2中整数占用的空间并没有被回收,而3中则得到了回收。

而最后一段的代码修改,因为整数池已经不复存在,因此这里只修改代码输出对应的内存位置。

只需要在long_to_decimal函数中加入

printf("address @%d\n", &aa);

即可。

运行结果如下图

《Python源码剖析》笔记-python中的对象_第2张图片
整数的地址

第3章

Python2中的str类型已如书中所述。
2中的unicode类型与str类型类似,其类型定义为:

typedef struct {
PyObject_HEAD
Py_ssize_t length;          /* Length of raw Unicode data in buffer */
Py_UNICODE *str;            /* Raw Unicode buffer */
long hash;                  /* Hash value; -1 if not set */
PyObject *defenc;          /* (Default) Encoded version as Python
string, or NULL; this is used for
implementing the buffer protocol */
} PyUnicodeObject;

Intern机制,即字符串共享机制。这一部分JAVA中也有,3中与2中机制相同。
字符串的连接部分,string_join对应的部分在_PyUnicode_JoinArray中。

字符串对象的生成机制较为复杂,因为涉及到编码与解码过程,这一部分在codec中,不完全算是对象的一部分。

第4章

list与2中基本一样。

设置新值并对旧值解引用的部分在3中用一个宏表示。

这个宏的定义在object.h中。

Py_SETREF采用Py_DECREF解引用,Py_XSETREF采用Py_XDECREF解引用。

你可能感兴趣的:(《Python源码剖析》笔记-python中的对象)