Python虚拟机的初始化概览

今天想跟下Python虚拟机的启动,看看以调试模式跑起python_d.exe是怎么一个过程。

1. d:\Python-2.7.2\Modules\python.c文件是main函数,直接调用Py_Main函数;
2. 在Py_Main函数中,初始化函数为Py_Initialize();,而后者直接调用Py_InitializeEx(1);函数;
3. 在Py_InitializeEx函数中,首先判断是否已经初始化过,如果有则返回,没有就改下标志,开始初始化;第一步也是十分关键的一步,是调用函数(interp = PyInterpreterState_New();)创建PyInterpreterState对象(即解释器进程,现在Python一个解释器只有一个进程,所以存在一个缺点,在多核的机子上也只能存在一个进程)。
4. 在PyInterpreterState_New()函数中,首先为PyInterpreterState对象分配内存:
    PyInterpreterState *interp = (PyInterpreterState *)
                                 malloc(sizeof(PyInterpreterState));

如果分配内存成功,执行HEAD_INIT();宏:
#ifdef WITH_THREAD
#include "pythread.h"
static PyThread_type_lock head_mutex = NULL; /* Protects interp->tstate_head */
#define HEAD_INIT() (void)(head_mutex || (head_mutex = PyThread_allocate_lock()))
#define HEAD_LOCK() PyThread_acquire_lock(head_mutex, WAIT_LOCK)
#define HEAD_UNLOCK() PyThread_release_lock(head_mutex)

不论是从名称还是注释都可以看出head_mutex是用来保护解释器进程的tstate_head成员的。
在head_mutex为NULL的情况下会调用PyThread_allocate_lock()函数初始化head_mutex变量。
接着初始化其它成员。
于是,解释器进程就这么创建了……

接着立马创建线程:tstate = PyThreadState_New(interp);,继而调用new_threadstate(interp, 1);
同样地,先为线程对象分配空间:PyThreadState *tstate = (PyThreadState *)malloc(sizeof(PyThreadState));
接着一样是对线程对象进行初始化,然后切换一下线程:(void) PyThreadState_Swap(tstate);

接下来一步是很重要的,就是初始化类型信息:_Py_ReadyTypes();
后续初始化顺序如下:
    if (!_PyFrame_Init())
        Py_FatalError("Py_Initialize: can't init frames");

    if (!_PyInt_Init())
        Py_FatalError("Py_Initialize: can't init ints");

    if (!_PyLong_Init())
        Py_FatalError("Py_Initialize: can't init longs");

    if (!PyByteArray_Init())
        Py_FatalError("Py_Initialize: can't init bytearray");

    _PyFloat_Init();

第一个函数其实就是初始化变量static PyObject *builtin_object;为字符串“__builtins__”;
第二个函数是初始化小整数的缓存链表,这里的小整数范围是可以自定义再重新编译进行设置的,过程挺有趣的;
第三个函数初始化Long类型信息,第四个函数没做什么;
接着初始化Float类型信息。

然后是初始化interp的modules和modules_reloading成员,都是简单地调用PyDict_New()函数赋值。
如果需要的话,还会初始化Unicode编码:_PyUnicode_Init();

接着是模块初始化,代码有省略:
bimod = _PyBuiltin_Init();
interp->builtins = PyModule_GetDict(bimod);
sysmod = _PySys_Init();
interp->sysdict = PyModule_GetDict(sysmod);

还有模块导入机制、异常、警告的初始化,代码有省略:
_PyImport_Init();
_PyExc_Init();
_PyWarnings_Init();

    initmain(); /* Module __main__ */

初始化全局锁:
    /* auto-thread-state API, if available */
#ifdef WITH_THREAD
    _PyGILState_Init(interp, tstate);
#endif /* WITH_THREAD */

最后是检查stdin,stdout,stderr和设置相关信息。

然后回到Py_Main,输出版本信息以及“>>>”,等用户输入。

假设输入“a = 1”,然后按Enter键:
Python会先对用户输入进行编译(co = PyAST_Compile(mod, filename, flags, arena);),生成PyCodeObject,然后再执行:v = PyEval_EvalCode(co, globals, locals);
PyObject *
PyEval_EvalCode(PyCodeObject *co, PyObject *globals, PyObject *locals)
{
    return PyEval_EvalCodeEx(co,
                      globals, locals,
                      (PyObject **)NULL, 0,
                      (PyObject **)NULL, 0,
                      (PyObject **)NULL, 0,
                      NULL);
}

于是我们最终进入到PyEval_EvalFrameEx函数,在这里用大量的switch/case来执行指令。


你可能感兴趣的:(thread,虚拟机,python,object,Module,null)