Python源码剖析-PyStringObject对象和STR(中)

引言

在《源码奥义:PyStringObject对象和STR(上)》中我介绍了Python虚拟机的一些 优化 机制以及PyStringObject的创建元方法,本节将讨论一个 PyStringObject的 PyString_Type.

  • PyString_Type对象
PyTypeObject PyString_Type = {
    PyVarObject_HEAD_INIT(&PyType_Type, 0)
    "str",
    PyStringObject_SIZE,
    ... 
    string_str,          /* tp_str*/     //tp_str 指向string_str 函数
    &string_as_number,   /* tp_as_number */
    &string_as_sequence, /* tp_as_sequence */
    &string_as_mapping,  /* tp_as_mapping */
    (hashfunc)string_hash,
    string_methods,
    ....
    string_new,       //实例化对象方法   /* tp_new */
    PyObject_Del,        /* tp_free */
};

看过INT(上)的介绍,我们可以知道 str('python') 其实是调用了 PyString_Type-> string_new,如有疑问,请参阅 《INT函数与对象剖析(上)》

我们来看看实例化一个string对象的源码方法 string_new:

static PyObject *
string_new(PyTypeObject *type, PyObject *args, PyObject *kwds)
{
    PyObject *x = NULL;
    static char *kwlist[] = {"object", 0};

    if (type != &PyString_Type) //判断是否为str类型对象
        return str_subtype_new(type, args, kwds);
    if (!PyArg_ParseTupleAndKeywords(args, kwds, "|O:str", kwlist, &x))  
        return NULL;  //解析参数失败
    if (x == NULL)
        return PyString_FromString("");
    return PyObject_Str(x);
}

又看到熟悉的PyArg_ParseTupleAndKeywords解析参数的过程,可见str()函数接受值参数或者一个键参数 object,如下:
>>> str(object = 123) returns '123'
最终该参数会进入PyObject_Str at object.c
该函数又会调用 _PyObject_Str 对参数进行处理,然后判断参数是否为unicode字符串的操作。
res = (*Py_TYPE(v)->tp_str)(v);
综上,在实例化一个str对象的时候主要是以下两个步骤:

  • 检查对象的类型是否为 str
  • 判断类型是否为unicode
  • 判断对象 issubclass(obj, str)
  • 如果上述不满足且对象是str的子类对象,将取回 (*Py_TYPE( 对象 )->tp_str)( 对象)
    tp_str 的值返回

为了一探究竟,继续跟进 tp_str,在上述PyString_Type结构体可知tp_str 指向string_str 函数:

static PyObject *
string_str(PyObject *s)
{
    if (PyString_CheckExact(s)) { //如果为str对象则直接返回
        Py_INCREF(s);
        return s;
    }
    else { //str的子类或其它返回对象真正的值ob_sval(genuine value)
        PyStringObject *t = (PyStringObject *) s;
        return PyString_FromStringAndSize(t->ob_sval, Py_SIZE(t));
    }
}

[图片上传失败...(image-a0b31e-1549099856335)]


为了验证假设的,修改源码添加输出如上所示
[图片上传失败...(image-342e17-1549099856335)]


从上可知,一个继承自str的类对象的实例, 在用str()函数对其输出的时候, 它既不是 str 也不是 unicode,但在类中实现 了 _str_方法的时候, 也就是使其具有了 str 属性:
[图片上传失败...(image-fd3972-1549099856335)]


至此,对于python中的任意对象都能经过str() 转化输出了。
[图片上传失败...(image-a58502-1549099856335)]


小结

本节介绍了 实例化一个string 对象的详细步骤,以及动态语言的强大组装能力,下一节将介绍string对象的类整数,类序列的真正原因。

:kissing_heart: :smiley:
©敬贤。 勤勉方能生智。


2018-06-22 18:42:37 星期五

你可能感兴趣的:(Python源码剖析-PyStringObject对象和STR(中))