64位lua引擎如何支持32位luac编译出来的二进制字节码？

今天要研究wax的热更方案，重拾lua。面对64位lua的问题。阿里给出的方案是：分别编译。也就是说64位引擎只支持64位编译器生产的字节码。32位引擎只支持32位编译器产生的字节码。为此，阿里给出了一组编译脚本来解决这个问题，在我看来是小题大做了。
而且，这个方案有个小小的问题，那就是iOS应用目前还是一份代码同时编译arm64和arm32版本的（比如在iPhone 5上的APP安装得到的是32位的执行代码）。

我的解决办法是：直接修改一下lua的引擎就好了。
我们先来看为什么64位的引擎不能执行32位luac编译出来的字节码？

第一个是加载头的时候

void luaU_header (char* h)
{
 int x=1;
 memcpy(h,LUA_SIGNATURE,sizeof(LUA_SIGNATURE)-1);
 h+=sizeof(LUA_SIGNATURE)-1;
 *h++=(char)LUAC_VERSION;
 *h++=(char)LUAC_FORMAT;
 *h++=(char)*(char*)&x;                /* endianness */
 *h++=(char)sizeof(int);
 *h++=(char)sizeof(size_t);
 *h++=(char)sizeof(Instruction);
 *h++=(char)sizeof(lua_Number);
 *h++=(char)(((lua_Number)0.5)==0);        /* is lua_Number integral? */
}

其中的*h++=(char)sizeof(size_t);是平台依赖的，size_t在32位平台下是4字节，在64位平台下是8字节。
修改的办法就是改成：*h++=(char)sizeof(int);。

第二个地方是加载字符串的时候

static TString* LoadString(LoadState* S)
{
 size_t size;
 LoadVar(S,size);
 if (size==0)
  return NULL;
 else
 {
  char* s=luaZ_openspace(S->L,S->b,size);
  LoadBlock(S,s,size);
  return luaS_newlstr(S->L,s,size-1);        /* remove trailing '\0' */
 }
}

size的类型是size_t，而LoadVar的实现是这样的；

#define LoadVar(S,x)        LoadMem(S,&x,1,sizeof(x))

它根据size的类型从缓冲区获得数据，原因同上，这里它取了8个字节的长度。而实际上32位luac编译产生字节码的时候，这个长度只用了4个字节来表示。
修改的办法也很简单，改成：int size;即可。

其实，lua这种做法不够地道，字节码格式本应该使用一种平台无关的格式来定义才是。

那么，怎么让luac编译产生一个平台无关的格式呢？简单修改一下luac的实现也是可以办到的。
首先，我们需要假定就用4个字节表示字符串长度。（当然啦，你也可以假定字符串的长度就是8字节，不过，因为大部分现存系统上的luac都是32位编译的，他们没有被修改之前，产生的字节码中，字符串的长度是用4字节表示的。）

然后，修改一下这个方法：

static void DumpString(const TString* s, DumpState* D)
{
 if (s==NULL || getstr(s)==NULL)
 {
  size_t size=0;
  DumpVar(size,D);
 }
 else
 {
  size_t size=s->tsv.len+1;        /* include trailing '\0' */
  DumpVar(size,D);
  DumpBlock(getstr(s),size,D);
 }
}

如果你真正读懂了文章前面的部分，那么这里怎么改，应该很清楚了吧？
好了，重新编译出来的luac，无论你用32位方式编译，还是64位方式编译，最终得到的编译器（luac）编译的lua字节码，它都是能被上面修改过的引擎正确加载了。
再也不用折腾32位一个版本，64位一个版本了~。

我是怎么定位到这些需要修改的地方的呢？
首先，我们要有问题的环境，也就是一个64位编译出来的lua64运行引擎，一个32位luac32编译出来的字节码luac32.out。
然后，我们用这个lua64执行这个luac32.out。这时候，会出现第一个错误信息：
bad header in precompiled chunk
在源代码里搜索这个错误提示，没有找到任何的结果。于是，把错误提示缩小一些（因为，我们平时也也经常写"error:%s"这样的日志输出）。直到查找"bad header"的时候，定位到一处函数了LoadHeader，不需要费太多力气大概就知道是最终这个函数luaU_header的结果出错导致的错误日志。好，第一处修改点就是这么定位出来的了。
继续跑测试用例，这次直接crash了

malloc: *** mach_vm_map(size=8461182042380451840) failed (error code=3)
*** error: can't allocate region
*** set a breakpoint in malloc_error_break to debug

一看就是分配了一个非常非常大的内存了。这里，是需要一些灵感的，我自己看到这个错误的第一直觉是，加载字符串的时候出错了（不要问我为什么有这样的直觉，一般只有犯过错的人才有这样的直觉）。
这个错误没有什么日志信息可以辅助定位，大概只能单步调试一个函数一个函数的执行过去，看看到那个函数执行就报这个错了。
然后依次缩小范围。幸运的是，这只是一个很单纯的单线程程序，很快就可以定位到是LoadFunction-->f->source=LoadString(S)这个语句出现的问题了，果然和我的猜想一样。
就这样，问题搞定啦：）

64位lua引擎如何支持32位luac编译出来的二进制字节码？

其实，lua这种做法不够地道，字节码格式本应该使用一种平台无关的格式来定义才是。

你可能感兴趣的:(64位lua引擎如何支持32位luac编译出来的二进制字节码？)