C语言动态函数调用

背景

在远程调用中,服务器在收到请求后,需要通过查符号的手段,获取函数指针,然后调用客户端请求的函数。然而,不同函数参数个数、类型皆不相同,函数指针在定义时就需要明确类型,因此,没有一种定义,可以满足所有函数的调用。

实现

tpf的实现

最先想到的是参考目前项目中控制台手动输入函数时的实现方式,即tpf库的实现。tpf库在查找符号时,使用一个u32 *类型的变量充当函数指针(通过强制类型转换)。在调用时,将此指针强制转换为一个包含32个s32并且返回值是s32的函数指针。如果用户传递的参数不足32个,则后面的全部补0。也就是说,tplf的实现完全不考虑调用的函数原型是什么样,统一以一个原型去调用目标函数。
初看这段代码,函数指针类型与真正的函数定义不匹配,我个人认为应该是有问题的。比较奇怪的是,在实际测试中,发现这样并没有发生参数传递错误、函数内局部变量被覆盖等问题。
通过反汇编分析代码,得到了以下结论:
 调用时,根据函数指针的类型,将参数从右至左压入堆栈,堆栈地址逐步减小。
 在被调函数中,先保存调用者函数的栈底地址(push ebp),让后将ebp指针移动到被调用函数的栈底(mov %esp,%ebp)。即保证ebp指针永远指向当前函数的栈底。
如图所示:

在上图可以看出,通过ebp来区分调用者与被调用者的栈帧,使用esp来区分当前函数的局部变量,以及下一个调用函数的参数列表。在被调用函数中,使用ebp+参数偏移地址,去取调用者传递的参数。由于调用者在传递参数时,从右至左压入堆栈,因此,在左边的参数距离ebp较近。即使多传递了多余的参数,只不过多占用了一些堆栈而已,并不会对函数调用产生影响。
另外,我对函数需要传递char或者short类型的原型同样做了实验。通过分析汇编代码发现,这两种类型在编译之后依然按照4字节占用堆栈空间,因此不存在问题(大端、小端系统均没有问题)。
通过以上分析,tpf虽然使用了比较诡异的调用方式,但是针对参数个数小于32个的情况,均不会出现问题。如果参数大于32个,则会使得被调用函数访问到非法的参数栈(因为参数栈固定为32个4字节)。

其他实现

在网上也找了一些其他的开源代码实现,例如:dyncall、libffi等。这一类代码实现原理,需要用户调用其接口,告知每一个参数的类型。其实现原理,应该是采用汇编代码,根据参数类型,在运行态执行参数入栈操作。其致命缺陷,在于用户在调用时,必须明确参数个数以及每一个参数类型,无疑增大了用户API接口的编程工作量。

结论

综合考虑,使用tpf实现C语言动态函数调用。

你可能感兴趣的:(C语言)