php7变量的实现

PHP作为“世界上最好的语言”,我们都知道php是弱类型语言,即在使用过程中,可以任意改变变量的类型。这对于代码中的灵活性有极大的方便。php底层是由c语言去实现的,那么c语言作为强类型语言,是怎么实现php的这些特性?

在php中变量的值由zval来表示

php7中的zval结构如下

struct _zval_struct {
    zend_value        value;            /* value */
    union {
        struct {
            ZEND_ENDIAN_LOHI_4(
                zend_uchar    type,         //存储具体类型
                zend_uchar    type_flags,
                zend_uchar    const_flags,
                zend_uchar    reserved)     /* call info for EX(This) */
        } v;
        uint32_t type_info;
    } u1;
    union {
        uint32_t     next;                 /* hash collision chain */
        uint32_t     cache_slot;           /* literal cache slot */
        uint32_t     lineno;               /* line number (for ast nodes) */
        uint32_t     num_args;             /* arguments number for EX(This) */
        uint32_t     fe_pos;               /* foreach position */
        uint32_t     fe_iter_idx;          /* foreach iterator index */
        uint32_t     access_flags;         /* class constant access flags */
        uint32_t     property_guard;       /* single property guard */
        uint32_t     extra;                /* not further specified */
    } u2;
};

typedef union _zend_value {
    zend_long         lval;             //整型
    double            dval;             //浮点型
    zend_refcounted  *counted;          //引用计数
    zend_string      *str;              //字符串类型
    zend_array       *arr;              //数组类型
    zend_object      *obj;              //对象类型
    zend_resource    *res;              //资源类型
    zend_reference   *ref;              //引用类型
    zend_ast_ref     *ast;              //抽象语法树
    zval             *zv;               //zval类型
    void             *ptr;              //指针类型
    zend_class_entry *ce;               //class类型
    zend_function    *func;             //function类型
    struct {
        uint32_t w1;
        uint32_t w2;
    } ww;
} zend_value;

php 通过使用 zval中的type 去判断变量的类型,_zend_value联合体去查找对应类型的值。

php7变量的实现_第1张图片
$a=1到$a=12.3

在php7中,type的值可以为如下

type的类型可为如下
/* regular data types */
#define IS_UNDEF                    0
#define IS_NULL                     1
#define IS_FALSE                    2
#define IS_TRUE                     3
#define IS_LONG                     4
#define IS_DOUBLE                   5
#define IS_STRING                   6
#define IS_ARRAY                    7
#define IS_OBJECT                   8
#define IS_RESOURCE                 9
#define IS_REFERENCE                10

/* constant expressions */
#define IS_CONSTANT                 11
#define IS_CONSTANT_AST             12

/* fake types */
#define _IS_BOOL                    13
#define IS_CALLABLE                 14
#define IS_ITERABLE                 19
#define IS_VOID                     18

/* internal types */
#define IS_INDIRECT                 15
#define IS_PTR                      17
#define _IS_ERROR                   20

具体变量的表示

对于整型、浮点型、布尔和NULL,由于占用空间小,在zval中直接存储。
对于字符串、数组、资源类型和对象,php7重新对应的结构来装载数据。在_zend_value中存储对应结构的指针地址。

以下拿字符串来举例

在php7中字符串结构体定义如下

struct zend_string{
    zend_refcounted_h gc;
    zend_ulong h;
    size_t len;
    char val[1];
}
字段名 含义
gc 用于维护变量的垃圾回收
h 冗余了hash值,避免在数组中操作中重复计算hash
len 记录字符串长度
val val记录了字符串的内容,这里用了c的柔性数组

引用和赋值

  • 赋值
    对于整型、浮点型、布尔和NULL,由于占用空间小,在zval中直接存储。直接在进行赋值时,会创建2个zval。
    字符串、数组、资源类型和对象会在赋值时,指向同一个value,等到变量的值被改变时,才会申请变量值的内存空间
  • 引用
    php7 中为引用多引入了一个新结构体
struct _zend_reference{
  zend_refcounted_h gc;
  zval val;
}

$a = '1234';//$a->zend_string(type=IS_STRING,recount_gc=1,is_ref_gc=0);
$c=$a;// $c,$a-> zend_string (type=IS_STRING,recount_gc=2,is_ref_gc=0);
$b=&$a;// $b,$a-> zval (type=IS_REFERENCE,recount_gc=2);
//$c-> zend_string (type=IS_STRING,recount_gc=2,);

在php7中,引入了zend_reference来处理。使得即使是引用 或者是赋值,在内存中只存有一份字符串

php7变量的实现_第2张图片
字符串赋值

php7变量的实现_第3张图片
字符串引用

数组、对象和资源类型的赋值和引用与字符串类似。这里暂不讨论。

变量的作用域

参考博文

全局变量

php中把定义在函数、类之外的变量称之为全局变量。包括include和require导入的代码。这些变量可以在函数和类的成员方法中通过global关键字引入。
全局变量保存在EG(symbol_table),这是一个哈希表。全局变量的访问是通过局部变量指向全局变量的方式进行访问的。
对于全局变量,ZEND内核有一个_zend_executor_globals结构,该结构中的symbol_table就是全局符号表, 其中保存了在顶层作用域中的变量。同样,函数或者对象的方法在被调用时会创建active_symbol_table来保存局部变量。 当程序在顶层中使用某个变量时,ZE就会在symbol_table中进行遍历, 同理,如果程序运行于某个函数中,Zend内核会遍历查询与其对应的active_symbol_table, 而每个函数的active_symbol_table是相对独立的,通过active_symbol_table指向symbol_table 从而取到全局变量的值。
变量的作用域是使用不同的符号表来实现的,于是顶层的全局变量在函数内部使用时, 需要先使用global语句来将变量“挪”到函数独立的*active_symbol_table中, 即变量的跨域操作。

局部变量

函数中的局部变量就存储在_zend_execute_data的symbol_table中,在执行当前函数的op_array时, 全局zend_executor_globals中的active_symbol_table会指向当前_zend_execute_data中的symbol_table。 因为每个函数调用开始时都会重新初始化EG(active_symbol_table)为NULL, 在这个函数的所有opcode的执行过程中这个全局变量会一直存在,并且所有的局部变量修改都是在它上面操作完成的,如前面的赋值操作等。 而此时,其他函数中的symbol_table会存放在栈中,将当前函数执行完并返回时,程序会将之前保存的zend_execute_data恢复, 从而其他函数中的变量也就不会被找到,局部变量的作用域就是以这种方式来实现的。

你可能感兴趣的:(php7变量的实现)