lua 的值类型

lua 的值类型

lua 是动态类型的语言,即是说类型附着于值而不是变量。在 lua 脚本里,变量是没有类型的,只有值才具有类型。这跟 C\C++ 相比不太一样, C\C++ 里的类型是附着于变量的。

lua 里有八种类型: boolean, number, string, table, userdata, function, thread, nil

思考一下:lua 脚本里的值在解释器里是怎样表示的?如何做到类型附着于值?

1. 从 lua_pushnumber, lua_pushstring 入手

C\C++ 通过 lua_pushnumber 等函数将 int, char* 等类型的值压入 lua 栈,从而传递给 lua。我们就从这儿来入手,看看 int, char* 等 C\C++ 的值是如何在 lua 栈里表示的。

lua 的值类型_第1张图片

从 lua_pushnumber 的定义代码里可以看到,它从 lua_State 里取出 top,并把 bool 值传给了一个宏 setbvalue(obj, x)
而在 setbvalue 里,obj 被转换成了 TValue 类型,接着又调用了两个宏 val_(), settt_() 来设置 TValue 类型的两个成员。

再看看别的 lua_push 函数及 setvalue 宏,也都是从 lua_State 里取出 top,并将其转换为 TValue 类型:

lua 的值类型_第2张图片

由此可见,lua 栈中所有类型的值都是用 TValue 结构体来表示的。

2. 查看 TValue 结构体

lua 的值类型_第3张图片

先看注释,TValue 是 Tagged Values 的缩写。正如探索的结论,TValue 是 lua 值的基本表示。它由一个实际的 value 和一个值类型的 tag 组成。

TValue 结构体有两个成员 value_, tt_。

tt_ 成员的类型可以从 LUA_TNUMINT 等定义处找到:

lua 的值类型_第4张图片

value_ 是一个 union 类型 Value。所以它可以存储多种类型的值。

typedef union Value {
  GCObject *gc;    /* 可以被垃圾回收的对象, */
  void *p;         /* light userdata */
  int b;           /* 布尔值 */
  lua_CFunction f; /* light C functions */
  lua_Integer i;   /* 整形值 */
  lua_Number n;    /* 浮点数值 */
} Value;

lua_Number 是在以下两个文件里定义出来的,可以看到它实际上是个 double 类型。在需要时,可以方便地修改 lua_Number 的类型:

lua 的值类型_第5张图片

3. 查看 GCObject 结构体

Value 联合体中有一个 GCObject 成员,这个结构体用于表示可以被垃圾回收的对象,像是 string, table 这些。现在来看看 GCObject 结构体张啥样:

lua 的值类型_第6张图片

很奇怪,它的成员只有用宏 CommonHeader 定义的 GCObject *next; lu_byte tt; lu_byte marked 这几个。这几个成员显然表示不了 string,table 这些类型。
看注释可以知道,CommonHeader 是给所有可回收对象用的,可以被包含在其它对象中。所以我们就搜索一下有哪些对象包含了这个 CommonHeader:

lua 的值类型_第7张图片

可以看到,可以被垃圾回收的对象(string, userdata, function, thread, table) 的结构体声明里,第一行都是 CommonHeader。

先不讨论各个类型的结构体意义,在 CommonHeader 宏里,next 字段说明可回收对象是可以放到链表里的,而 marked 字段是 GC 用来进行标记的。这些内容以后再探讨,值得注意的是表示类型的 tt 字段。TValue 里不是已经有一个 tt_ 字段用于表示类型了吗?为什么在 GCObject 里还需要这个字段呢?

这个问题可以这样想:

  1. 要从 GCObject 反向得到 TValue 是不行的,假如 GCObject 没有 tt 字段,单单持有 GCObject 的时候,没法判断这个 GCObject 的类型是什么。
  2. GC 在回收对象的时候需要根据类型来释放资源。基于第一点,必须在 GCObject 里加一个表示类型的字段 tt。

最后附上一张 lua 值内存表示的图:
x


lua 的值类型_第8张图片

总结

  1. lua 中的值在 C 中都用 TValue 结构体来表示;TValue 有两个成员 Value value_; int tt_ Value 是一个联合体,可以存储所有类型的值。访问 TValue 的时候,先通过 tt_ 获取 TValue 的类型,然后将 Value 转换为对应的类型进行访问。比如:
TValue value = xxx;
if(value.tt_ == LUA_TBOOLEAN)
{
  int bFlag = value.value_.b;
}
  1. 对于可垃圾回收的对象,也可以用同样的方式来转换的到原对象。因为所有的可垃圾回收对象的开头都是 CommonHeader

引用

The Inplementation of Lua5.0
Lua源码分析(2) -- 对象表示

你可能感兴趣的:(lua 的值类型)