内联函数和普通函数一样,区别仅仅是在被调用处直接使用机器码替换的形式。
直接采用机器码替换的目的是:减少因调用而造成的开销,加速执行效率。
很多编程语言包括:c,c++,python 都提供了内联函数的概念,他们的作用是相同的,都是通过“替换”代替“调用”,来加速程序的执行效率。下面让我们对内联函数的特性进一步剖析和验证。
inline void inlined_swapf(float *p1, float *p2)
{
float tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
上述为一个 C 语言编写的 内联函数,通过关键字 inline 定义该函数为内联函数。则当该函数被其他函数调用时,假设在指令 1、2中调用了该内联函数,则其执行的逻辑是:
void swapf(float *p1, float *p2)
{
float tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
上述是一个普通函数,则当该函数被其他函数调用时,假设在指令 1、2中调用了该非内联函数,则其执行的逻辑是:
既然内联函数可以提升效率,我们就比较下内联函数和非内联函数在相同情况下执行时间的情况。
测试平台为 ESP32, 但大部分平台都可以参考下述代码稍加更改进行验证。
// 交换值
inline void inlined_swapf(float *p1, float *p2)
{
float tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
// float 类型排序
void selection_sortf1(float a[], int n)
{
int i, j, mini;
for (i=0; i<n - 1; ++i) {
mini = i;
for (j=i+1; j<n; ++j) {
if (a[j] < a[mini]) {
mini = j;
}
}
inlined_swapf(a+i, a+mini);
}
}
// 交换值
void swapf(float *p1, float *p2)
{
float tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
// float 类型排序
void selection_sortf2(float a[], int n)
{
int i, j, mini;
for (i=0; i<n - 1; ++i) {
mini = i;
for (j=i+1; j<n; ++j) {
if (a[j] < a[mini]) {
mini = j;
}
}
swapf(a+i, a+mini);
}
}
void app_main(void)
{
printf("Hello world!\n");
float a[1024] = {1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 1.0, 2.0, 3.0};
volatile uint64_t total_time = esp_timer_get_time();
for (int i=0; i<50; i++) {
selection_sortf1(a, sizeof(a)/sizeof(float));
}
total_time = esp_timer_get_time() - total_time;
printf("inline: %llu\r\n", total_time);
total_time = esp_timer_get_time();
for (int i=0; i<50; i++) {
selection_sortf2(a, sizeof(a)/sizeof(float));
}
total_time = esp_timer_get_time() - total_time;
printf("no-inline: %llu\r\n", total_time);
}
程序测算时间:
Hello world!
inline: 2955830
no-inline: 2958393
结论:相同测试程序,内联函数运行的时间小于 非内联函数,即内联函数的确可以节省时间,提升运行效率。
适合声明为内联函数的场景:经常被调用的小函数。
不适合声明为内联函数的场景:含较大循环运算的函数、递归函数。
如上述示例的 inlined_swapf()
涉及的代码简单短小,在selection_sortf1()
中被调用的次数比较多,因此可以声明为 inline,而 selection_sortf1()
本身涉及大循环,不适合声明为内联函数。
注意事项:声明为内联的函数是在编译时生成成指令嵌入对应的指令块中,成为真正的内联函数,还是最终被编译成普通的函数调用,取决于编译器,具体是否真的处理为内联函数,可以使用反汇编进行查看。