lua 的值类型
lua 是动态类型的语言,即是说类型附着于值而不是变量。在 lua 脚本里,变量是没有类型的,只有值才具有类型。这跟 C\C++ 相比不太一样, C\C++ 里的类型是附着于变量的。
lua 里有八种类型: boolean, number, string, table, userdata, function, thread, nil
思考一下:lua 脚本里的值在解释器里是怎样表示的?如何做到类型附着于值?
1. 从 lua_pushnumber, lua_pushstring 入手
C\C++ 通过 lua_pushnumber 等函数将 int, char* 等类型的值压入 lua 栈,从而传递给 lua。我们就从这儿来入手,看看 int, char* 等 C\C++ 的值是如何在 lua 栈里表示的。
从 lua_pushnumber 的定义代码里可以看到,它从 lua_State 里取出 top,并把 bool 值传给了一个宏 setbvalue(obj, x)
而在 setbvalue 里,obj 被转换成了 TValue 类型,接着又调用了两个宏 val_(), settt_() 来设置 TValue 类型的两个成员。
再看看别的 lua_push 函数及 setvalue 宏,也都是从 lua_State 里取出 top,并将其转换为 TValue 类型:
由此可见,lua 栈中所有类型的值都是用 TValue 结构体来表示的。
2. 查看 TValue 结构体
先看注释,TValue 是 Tagged Values 的缩写。正如探索的结论,TValue 是 lua 值的基本表示。它由一个实际的 value 和一个值类型的 tag 组成。
TValue 结构体有两个成员 value_, tt_。
tt_ 成员的类型可以从 LUA_TNUMINT 等定义处找到:
value_ 是一个 union 类型 Value。所以它可以存储多种类型的值。
typedef union Value {
GCObject *gc; /* 可以被垃圾回收的对象, */
void *p; /* light userdata */
int b; /* 布尔值 */
lua_CFunction f; /* light C functions */
lua_Integer i; /* 整形值 */
lua_Number n; /* 浮点数值 */
} Value;
lua_Number 是在以下两个文件里定义出来的,可以看到它实际上是个 double 类型。在需要时,可以方便地修改 lua_Number 的类型:
3. 查看 GCObject 结构体
Value 联合体中有一个 GCObject 成员,这个结构体用于表示可以被垃圾回收的对象,像是 string, table 这些。现在来看看 GCObject 结构体张啥样:
很奇怪,它的成员只有用宏 CommonHeader
定义的 GCObject *next; lu_byte tt; lu_byte marked
这几个。这几个成员显然表示不了 string,table 这些类型。
看注释可以知道,CommonHeader 是给所有可回收对象用的,可以被包含在其它对象中。所以我们就搜索一下有哪些对象包含了这个 CommonHeader:
可以看到,可以被垃圾回收的对象(string, userdata, function, thread, table) 的结构体声明里,第一行都是 CommonHeader。
先不讨论各个类型的结构体意义,在 CommonHeader 宏里,next 字段说明可回收对象是可以放到链表里的,而 marked 字段是 GC 用来进行标记的。这些内容以后再探讨,值得注意的是表示类型的 tt 字段。TValue 里不是已经有一个 tt_ 字段用于表示类型了吗?为什么在 GCObject 里还需要这个字段呢?
这个问题可以这样想:
- 要从 GCObject 反向得到 TValue 是不行的,假如 GCObject 没有 tt 字段,单单持有 GCObject 的时候,没法判断这个 GCObject 的类型是什么。
- GC 在回收对象的时候需要根据类型来释放资源。基于第一点,必须在 GCObject 里加一个表示类型的字段 tt。
最后附上一张 lua 值内存表示的图:
x
总结
- lua 中的值在 C 中都用 TValue 结构体来表示;TValue 有两个成员
Value value_; int tt_
Value 是一个联合体,可以存储所有类型的值。访问 TValue 的时候,先通过 tt_ 获取 TValue 的类型,然后将 Value 转换为对应的类型进行访问。比如:
TValue value = xxx;
if(value.tt_ == LUA_TBOOLEAN)
{
int bFlag = value.value_.b;
}
- 对于可垃圾回收的对象,也可以用同样的方式来转换的到原对象。因为所有的可垃圾回收对象的开头都是 CommonHeader
引用
The Inplementation of Lua5.0
Lua源码分析(2) -- 对象表示