xlua源码分析(四) lua访问C#的值类型

xlua源码分析(四) lua访问C#的值类型

上一节我们主要探讨了C#是如何使用interface和delegate访问lua层的table和function的,本节我们跟着Examples 05_NoGc,来看看xlua是如何实现lua层无gc访问C#的值类型的。

首先例子中用到的lua代码如下:

function id(...)
    return ...
end

function add(a, b) return a + b end

function array_exchange(arr)
    arr[0], arr[1] = arr[1], arr[0]
end

local v3 = CS.UnityEngine.Vector3(7, 8, 9)
local vt = CS.XLuaTest.MyStruct(5, 6)

function lua_access_csharp()
    monoBehaviour:FloatParamMethod(123) --primitive
    monoBehaviour:Vector3ParamMethod(v3) --vector3
    local rnd = math.random(1, 100)
    local r = monoBehaviour:Vector3ParamMethod({x = 1, y = 2, z = rnd}) --vector3
    assert(r.x == 1 and r.y == 2 and r.z == rnd)
    monoBehaviour:StructParamMethod(vt) --custom struct
    r = monoBehaviour:StructParamMethod({a = 1, b = rnd, e = {c = rnd}})
    assert(r.b == rnd and r.e.c == rnd)
    monoBehaviour:EnumParamMethod(CS.XLuaTest.MyEnum.E2) --enum
    monoBehaviour:DecimalParamMethod(monoBehaviour.a5[0])
    monoBehaviour.a1[0], monoBehaviour.a1[1] = monoBehaviour.a1[1], monoBehaviour.a1[0] -- field
end

exchanger = {
    exchange = function(self, arr)
        array_exchange(arr)
    end
}

A = { B = { C = 789}}
GDATA = 1234;

回到C#,例子在Start函数中,push了当前的NoGc这个C#对象到lua层:

luaenv.Global.Set("monoBehaviour", this);

我们之前有提到,xlua对C#类信息的提取是lazy的,只会在需要用到类型信息的时候触发。比如这里,把一个C#对象push到lua层,意味着lua层需要知道对象的类型id,也就是C#层的getTypeId函数,它的主体代码如下:

internal int getTypeId(RealStatePtr L, Type type, out bool is_first, LOGLEVEL log_level = LOGLEVEL.WARN)
{
    if (!typeIdMap.TryGetValue(type, out type_id)) // no reference
    {
        LuaAPI.luaL_getmetatable(L, alias_type == null ? type.FullName : alias_type.FullName);

        if (LuaAPI.lua_isnil(L, -1)) //no meta yet, try to use reflection meta
        {
            LuaAPI.lua_pop(L, 1);

            if (TryDelayWrapLoader(L, alias_type == null ? type : alias_type))
            {
                LuaAPI.luaL_getmetatable(L, alias_type == null ? type.FullName : alias_type.FullName);
            }
            else
            {
                throw new Exception("Fatal: can not load metatable of type:" + type);
            }
        }

        //循环依赖,自身依赖自己的class,比如有个自身类型的静态readonly对象。
        if (typeIdMap.TryGetValue(type, out type_id))
        {
            LuaAPI.lua_pop(L, 1);
        }
        else
        {
            type_id = LuaAPI.luaL_ref(L, LuaIndexes.LUA_REGISTRYINDEX);
            LuaAPI.lua_pushnumber(L, type_id);
            LuaAPI.xlua_rawseti(L, -2, 1);
            LuaAPI.lua_pop(L, 1);

            if (type.IsValueType())
            {
                typeMap.Add(type_id, type);
            }

            typeIdMap.Add(type, type_id);
        }
    }
    return type_id;
}

代码中TryDelayWrapLoader这个函数负责真正类型的wrap,我们先看一下getTypeId的主体逻辑。

  • 第一步,在typeIdMap中查找C#类型对应的type id,如果查找到了说明wrap过了,直接返回即可;
  • 如果没有查找到,首先获取一下该类型的metatable,如果metatable存在,说明当前调用是发生在递归的过程,也就是正在wrap中,此时不需要走到真正wrap的逻辑中;
  • 如果metatable不存在,说明尚未wrap,需要调用TryDelayWrapLoader
  • 在调用TryDelayWrapLoader的过程中,是有可能又调用getTypeId这个函数的,这里的代码注释也提到了,如果有个自身类型的静态readonly对象也需要wrap,那么在访问这个对象的时候也需要知道其类型的type id;
  • 如果是这种情况,首先要避免重复wrap,这里就是代码的高明之处了,C#类型的metatable是在wrap的时候生成的,而只有metatable不存在时,才会调用wrap;
  • 其次,还要避免重复生成type id,所以代码在新增type id时,要再次判断typeIdMap中是否已包含该类型。

我们在之前的文章详细分析了使用反射进行wrap的方式,这里NoGc类采用了事先生成wrap代码的方式对C#类进行注册,注册函数为XLuaTestNoGcWrap.__Register

public static void __Register(RealStatePtr L)
{
	ObjectTranslator translator = ObjectTranslatorPool.Instance.Find(L);
	System.Type type = typeof(XLuaTest.NoGc);
	Utils.BeginObjectRegister(type, L, translator, 0, 5, 5, 5);
	
	Utils.RegisterFunc(L, Utils.METHOD_IDX, "FloatParamMethod", _m_FloatParamMethod);
	Utils.RegisterFunc(L, Utils.METHOD_IDX, "Vector3ParamMethod", _m_Vector3ParamMethod);
	Utils.RegisterFunc(L, Utils.METHOD_IDX, "StructParamMethod", _m_StructParamMethod);
	Utils.RegisterFunc(L, Utils.METHOD_IDX, "EnumParamMethod", _m_EnumParamMethod);
	Utils.RegisterFunc(L, Utils.METHOD_IDX, "DecimalParamMethod", _m_DecimalParamMethod);
	
    Utils.RegisterFunc(L, Utils.GETTER_IDX, "a1", _g_get_a1);
    Utils.RegisterFunc(L, Utils.GETTER_IDX, "a2", _g_get_a2);
    Utils.RegisterFunc(L, Utils.GETTER_IDX, "a3", _g_get_a3);
    Utils.RegisterFunc(L, Utils.GETTER_IDX, "a4", _g_get_a4);
    Utils.RegisterFunc(L, Utils.GETTER_IDX, "a5", _g_get_a5);
    
    Utils.RegisterFunc(L, Utils.SETTER_IDX, "a1", _s_set_a1);
    Utils.RegisterFunc(L, Utils.SETTER_IDX, "a2", _s_set_a2);
    Utils.RegisterFunc(L, Utils.SETTER_IDX, "a3", _s_set_a3);
    Utils.RegisterFunc(L, Utils.SETTER_IDX, "a4", _s_set_a4);
    Utils.RegisterFunc(L, Utils.SETTER_IDX, "a5", _s_set_a5);
    
    Utils.EndObjectRegister(type, L, translator, null, null,
	    null, null, null);

    Utils.BeginClassRegister(type, L, __CreateInstance, 1, 0, 0);
	
	Utils.EndClassRegister(type, L, translator);
}

对照着NoGc类,很容易找到wrap所对应的属性和方法:

public class NoGc : MonoBehaviour
{
    [NonSerialized]
    public double[] a1 = new double[] { 1, 2 };
    [NonSerialized]
    public Vector3[] a2 = new Vector3[] { new Vector3(1, 2, 3), new Vector3(4, 5, 6) };
    [NonSerialized]
    public MyStruct[] a3 = new MyStruct[] { new MyStruct(1, 2), new MyStruct(3, 4) };
    [NonSerialized]
    public MyEnum[] a4 = new MyEnum[] { MyEnum.E1, MyEnum.E2 };
    [NonSerialized]
    public decimal[] a5 = new decimal[] { 1.00001M, 2.00002M };

    public float FloatParamMethod(float p)
    {
        return p;
    }

    public Vector3 Vector3ParamMethod(Vector3 p)
    {
        return p;
    }

    public MyStruct StructParamMethod(MyStruct p)
    {
        return p;
    }

    public MyEnum EnumParamMethod(MyEnum p)
    {
        return p;
    }

    public decimal DecimalParamMethod(decimal p)
    {
        return p;
    }
}

可以看到,NoGc类的wrap分为两大块,一块是针对object的,一块是针对class的,两者的区别在于lua层是访问userdata调用C#方法,还是访问class table调用C#方法。这里BeginObjectRegister函数最后3个参数为5,5,5,分别表示要注册的方法数量,get属性数量,set属性数量。如果数量不为0,xlua会创建一个table容纳接下来要注册进来的方法,如果为0则会push一个nil值进行占位。

if (method_count == 0)
{
    LuaAPI.lua_pushnil(L);
}
else
{
    LuaAPI.lua_createtable(L, 0, method_count);
}

if (getter_count == 0)
{
    LuaAPI.lua_pushnil(L);
}
else
{
    LuaAPI.lua_createtable(L, 0, getter_count);
}

if (setter_count == 0)
{
    LuaAPI.lua_pushnil(L);
}
else
{
    LuaAPI.lua_createtable(L, 0, setter_count);
}

此时lua栈如图所示:

xlua源码分析(四) lua访问C#的值类型_第1张图片

RegisterFunc的第二个参数表示要操作的table所在的index,可以看到xlua的定义与图中所示的完全一致:

public const int OBJ_META_IDX = -4;
public const int METHOD_IDX = -3;
public const int GETTER_IDX = -2;
public const int SETTER_IDX = -1;

RegisterFunc的实现相当简单,就是往table里塞C#方法/属性的名字和包装函数:

public static void RegisterFunc(RealStatePtr L, int idx, string name, LuaCSFunction func)
{
    idx = abs_idx(LuaAPI.lua_gettop(L), idx);
    LuaAPI.xlua_pushasciistring(L, name);
    LuaAPI.lua_pushstdcallcfunction(L, func);
    LuaAPI.lua_rawset(L, idx);
}

EndObjectRegister要稍微复杂一些,它的声明是这样的:

public static void EndObjectRegister(Type type, RealStatePtr L, ObjectTranslator translator, LuaCSFunction csIndexer,
    LuaCSFunction csNewIndexer, Type base_type, LuaCSFunction arrayIndexer, LuaCSFunction arrayNewIndexer)
{
	...
}

这个函数的主要作用,就是设置object metatable的__index__newindex元方法,分别绑定gen_obj_indexergen_obj_newindexer生成的函数。这两个方法之前也分析过了,这里就不展开了。在绑定之前,EndObjectRegister要准备好调用环境,以gen_obj_indexer为例:

int top = LuaAPI.lua_gettop(L);
int meta_idx = abs_idx(top, OBJ_META_IDX);
int method_idx = abs_idx(top, METHOD_IDX);
int getter_idx = abs_idx(top, GETTER_IDX);
int setter_idx = abs_idx(top, SETTER_IDX);

//begin index gen
LuaAPI.xlua_pushasciistring(L, "__index");
LuaAPI.lua_pushvalue(L, method_idx);
LuaAPI.lua_pushvalue(L, getter_idx);

if (csIndexer == null)
{
    LuaAPI.lua_pushnil(L);
}
else
{
    LuaAPI.lua_pushstdcallcfunction(L, csIndexer);
}

translator.Push(L, type == null ? base_type : type.BaseType());

LuaAPI.xlua_pushasciistring(L, LuaIndexsFieldName);
LuaAPI.lua_rawget(L, LuaIndexes.LUA_REGISTRYINDEX);
if (arrayIndexer == null)
{
    LuaAPI.lua_pushnil(L);
}
else
{
    LuaAPI.lua_pushstdcallcfunction(L, arrayIndexer);
}

LuaAPI.gen_obj_indexer(L);

在调用gen_obj_indexer前的lua栈如下:

xlua源码分析(四) lua访问C#的值类型_第2张图片

后面的故事我们已经知道了,gen_obj_indexer会把栈上的这些值,作为upvalue吸收掉,最后只留下生成的函数在栈顶,然后__index显然指向它。其中,csindexer主要表示C#类重载下标操作符的行为,例如Vector3可以直接使用下标访问其xyz分量;而arrayindexer主要表示数组类型,例如Array可以通过下标访问其元素。

BeginClassRegister的逻辑与object的类似,它需要传入表示class field,static getter,static setter数量的3个参数:

public static void BeginClassRegister(Type type, RealStatePtr L, LuaCSFunction creator, int class_field_count,
    int static_getter_count, int static_setter_count)

同样只要有数量大于0的,就新建一个table备用,和object稍微不同的是,object metatable最后是设置在userdata上的,class metatable要设置在class table上,因此这里还要创建一个class table。class所包含的静态方法,无需放在metatable上,直接放在class table里即可。此时的lua栈如下:

xlua源码分析(四) lua访问C#的值类型_第3张图片

EndClassRegister函数的主要目的也是为了设置class metatable。gen_cls_indexer调用前的lua栈如下:

xlua源码分析(四) lua访问C#的值类型_第4张图片

继续看C#的Start函数:

luaenv.Global.Get("id", out f1);
luaenv.Global.Get("id", out f2);
luaenv.Global.Get("id", out f3);
luaenv.Global.Get("id", out f4);
luaenv.Global.Get("id", out f5);

luaenv.Global.Get("array_exchange", out farr);
luaenv.Global.Get("lua_access_csharp", out flua);
luaenv.Global.Get("exchanger", out ie);
luaenv.Global.Get("add", out add);

这里就是获取到lua的function和table,保存到对应的C#的interface和delegate变量上。再看Update函数,首先是把C#的Vector3 push到lua层:

f2(new Vector3(1, 2, 3)); // vector3

内部实现会调用到PushUnityEngineVector3这个函数上:

public void PushUnityEngineVector3(RealStatePtr L, UnityEngine.Vector3 val)
{
    if (UnityEngineVector3_TypeID == -1)
    {
        bool is_first;
        UnityEngineVector3_TypeID = getTypeId(L, typeof(UnityEngine.Vector3), out is_first);
        
    }
    
    IntPtr buff = LuaAPI.xlua_pushstruct(L, 12, UnityEngineVector3_TypeID);
    if (!CopyByValue.Pack(buff, 0, val))
    {
        throw new Exception("pack fail fail for UnityEngine.Vector3 ,value="+val);
    }
    
}

xlua_pushstruct的实现很简单,就是在C层创建一个指定大小的userdata,设置其metatable为C# struct的metatable:

typedef struct {
	int fake_id;
    unsigned int len;
	char data[1];
} CSharpStruct;

LUA_API void *xlua_pushstruct(lua_State *L, unsigned int size, int meta_ref) {
	CSharpStruct *css = (CSharpStruct *)lua_newuserdata(L, size + sizeof(int) + sizeof(unsigned int));
	css->fake_id = -1;
	css->len = size;
    lua_rawgeti(L, LUA_REGISTRYINDEX, meta_ref);
	lua_setmetatable(L, -2);
	return css;
}

实际分配的userdata大小要比传入的size大一些,这是因为剩余的部分需要用来存放fake_idlen这两个成员。这里传入的size大小为12,也就是刚好可以容纳一个Vector3的大小。到这里就可以猜到了,为了避免拆装箱导致的gc,这里肯定是把C#的值拷贝到lua层了。CopyByValue.Pack就是做这个的:

public static bool Pack(IntPtr buff, int offset, UnityEngine.Vector3 field)
{
    
    if(!LuaAPI.xlua_pack_float3(buff, offset, field.x, field.y, field.z))
    {
        return false;
    }
    
    return true;
}

xlua_pack_float3这个函数执行真正的拷贝逻辑:

LUALIB_API int xlua_pack_float3(void *p, int offset, float f1, float f2, float f3) {
	CSharpStruct *css = (CSharpStruct *)p;
	if (css->fake_id != -1 || css->len < offset + sizeof(float) * 3) {
		return 0;
	} else {
		float *pos = (float *)(&(css->data[0]) + offset);
		pos[0] = f1;
		pos[1] = f2;
		pos[2] = f3;
		return 1;
	}
}

f2对应的lua函数是有返回值的,它会把push进来的参数原封不动地返回出去,类似地也有CopyByValue.UnPack这样一个函数,负责把lua层的数据拷贝到C#层:

public static bool UnPack(IntPtr buff, int offset, out UnityEngine.Vector3 field)
{
    field = default(UnityEngine.Vector3);
    
    float x = default(float);
    float y = default(float);
    float z = default(float);
    
    if(!LuaAPI.xlua_unpack_float3(buff, offset, out x, out y, out z))
    {
        return false;
    }
    field.x = x;
    field.y = y;
    field.z = z;
    
    
    return true;
}

同样也是xlua_unpack_float3执行真正的拷贝:

LUALIB_API int xlua_unpack_float3(void *p, int offset, float *f1, float *f2, float *f3) {
	CSharpStruct *css = (CSharpStruct *)p;
	if (css->fake_id != -1 || css->len < offset + sizeof(float) * 3) {
		return 0;
	} else {
		float *pos = (float *)(&(css->data[0]) + offset);
		*f1 = pos[0];
		*f2 = pos[1];
		*f3 = pos[2];
		return 1;
	}
}

接下来看看如何将自定义的struct push到lua层:

f3(mystruct1); // custom complex value type

MyStruct的定义如下:

[GCOptimize]
[LuaCallCSharp]
public struct Pedding
{
    public byte c;
}

[GCOptimize]
[LuaCallCSharp]
public struct MyStruct
{
    public MyStruct(int p1, int p2)
    {
        a = p1;
        b = p2;
        c = p2;
        e.c = (byte)p1;
    }
    public int a;
    public int b;
    public decimal c;
    public Pedding e;
}

打上GCOptimize标签的struct,会自动生成代码,push struct时会调用到PushXLuaTestMyStruct这个函数,它和Vector3的版本很像:

public void PushXLuaTestMyStruct(RealStatePtr L, XLuaTest.MyStruct val)
{
    if (XLuaTestMyStruct_TypeID == -1)
    {
	    bool is_first;
        XLuaTestMyStruct_TypeID = getTypeId(L, typeof(XLuaTest.MyStruct), out is_first);
		
    }
	
    IntPtr buff = LuaAPI.xlua_pushstruct(L, 25, XLuaTestMyStruct_TypeID);
    if (!CopyByValue.Pack(buff, 0, val))
    {
        throw new Exception("pack fail fail for XLuaTest.MyStruct ,value="+val);
    }
	
}

25表示MyStruct所占的字节数。MyStruct由2个int,1个decimal,1个struct所组成,因此Pack分为四个步骤:

public static bool Pack(IntPtr buff, int offset, XLuaTest.MyStruct field)
{
    
    if(!Pack(buff, offset, field.a))
    {
        return false;
    }
    
    if(!Pack(buff, offset + 4, field.b))
    {
        return false;
    }
    
    if(!Pack(buff, offset + 8, field.c))
    {
        return false;
    }
    
    if(!Pack(buff, offset + 24, field.e))
    {
        return false;
    }
    
    return true;
}

同样地,Unpack也需要分成4个步骤,逐一把数据从lua层拷贝到C#:

public static bool UnPack(IntPtr buff, int offset, out XLuaTest.MyStruct field)
{
    field = default(XLuaTest.MyStruct);
    
    if(!UnPack(buff, offset, out field.a))
    {
        return false;
    }
    
    if(!UnPack(buff, offset + 4, out field.b))
    {
        return false;
    }
    
    if(!UnPack(buff, offset + 8, out field.c))
    {
        return false;
    }
    
    if(!UnPack(buff, offset + 24, out field.e))
    {
        return false;
    }
    
    return true;
}

下一行代码展示了如何把enum push到lua层:

f4(MyEnum.E1); //enum

MyEnum的定义如下:

[LuaCallCSharp]
public enum MyEnum
{
    E1,
    E2
}

相应的push函数为PushXLuaTestMyEnum,它和之前push struct稍稍有些不同:

public void PushXLuaTestMyEnum(RealStatePtr L, XLuaTest.MyEnum val)
{
    if (XLuaTestMyEnum_TypeID == -1)
    {
        bool is_first;
        XLuaTestMyEnum_TypeID = getTypeId(L, typeof(XLuaTest.MyEnum), out is_first);
        
        if (XLuaTestMyEnum_EnumRef == -1)
        {
            Utils.LoadCSTable(L, typeof(XLuaTest.MyEnum));
            XLuaTestMyEnum_EnumRef = LuaAPI.luaL_ref(L, LuaIndexes.LUA_REGISTRYINDEX);
        }
        
    }
    
    if (LuaAPI.xlua_tryget_cachedud(L, (int)val, XLuaTestMyEnum_EnumRef) == 1)
    {
        return;
    }
    
    IntPtr buff = LuaAPI.xlua_pushstruct(L, 4, XLuaTestMyEnum_TypeID);
    if (!CopyByValue.Pack(buff, 0, (int)val))
    {
        throw new Exception("pack fail fail for XLuaTest.MyEnum ,value="+val);
    }
    
    LuaAPI.lua_getref(L, XLuaTestMyEnum_EnumRef);
    LuaAPI.lua_pushvalue(L, -2);
    LuaAPI.xlua_rawseti(L, -2, (int)val);
    LuaAPI.lua_pop(L, 1);
    
}

由于enum的值是常量,因此拷贝到lua层的userdata只需要创建一次即可,创建完成之后在lua层进行缓存,下次C#层再push时,先从缓存中查找userdata。lua层拷贝enum到C#层的逻辑和struct类似,这里就不再展开了。

如果在lua层持有了C# struct的array,那么对array中的元素进行get/set也会触发到上述列举的这些方法,相关的封装代码在__tryArrayGet__tryArraySet中:

public partial class StaticLuaCallbacks
{
    internal static bool __tryArrayGet(Type type, RealStatePtr L, ObjectTranslator translator, object obj, int index)
    {
        if (type == typeof(UnityEngine.Vector2[]))
        {
            UnityEngine.Vector2[] array = obj as UnityEngine.Vector2[];
            translator.PushUnityEngineVector2(L, array[index]);
            return true;
        }
        ...
    }
    
    internal static bool __tryArraySet(Type type, RealStatePtr L, ObjectTranslator translator, object obj, int array_idx, int obj_idx)
    {
        if (type == typeof(UnityEngine.Vector2[]))
        {
            UnityEngine.Vector2[] array = obj as UnityEngine.Vector2[];
            translator.Get(L, obj_idx, out array[array_idx]);
            return true;
        }
        ...
    }
}

当然,lua层除了支持从userdata拷贝struct的值到C#之外,还可以直接通过构造一个table,将值拷贝到C# struct的对应字段上,比如Vector3,有这样一个方法:

public static void UnPack(ObjectTranslator translator, RealStatePtr L, int idx, out UnityEngine.Vector3 val)
{
    val = new UnityEngine.Vector3();
    int top = LuaAPI.lua_gettop(L);
    
    if (Utils.LoadField(L, idx, "x"))
    {
        
        translator.Get(L, top + 1, out val.x);
        
    }
    LuaAPI.lua_pop(L, 1);
    
    if (Utils.LoadField(L, idx, "y"))
    {
        
        translator.Get(L, top + 1, out val.y);
        
    }
    LuaAPI.lua_pop(L, 1);
    
    if (Utils.LoadField(L, idx, "z"))
    {
        
        translator.Get(L, top + 1, out val.z);
        
    }
    LuaAPI.lua_pop(L, 1);
    
}

只要table中包含x,y,z三个字段,就可以对应地拷贝到Vector3上了。

自此,我们算是比较系统地分析了xlua中值类型的实现。与tolua相比,两者都实现了无gc的值类型传递。不过xlua对值类型中的方法,默认使用wrap的方式,也就是说lua调用C# 值类型的方法,需要把数据拷贝到C#层,再进行函数调用,如果调用频繁的话,其性能开销就不甚理想了。而tolua的值类型,默认会在lua层实现一份类似的代码,lua层在调用时,完全是走的lua层的逻辑,不会涉及拷贝数据到C#层的逻辑,只有作为函数调用参数和返回值时,才涉及到数据的拷贝。这样做的好处,就是避免了在函数调用过程的频繁的数据拷贝开销,不方便的地方就是需要在lua层自己实现一遍C#的值类型,而使用wrap则只需要自动生成代码即可,没有额外的开发负担。

你可能感兴趣的:(xlua源码分析,lua,c#,xlua)