c语言中动态库的使用(启动时链接和运行时链接)

背景

c语言中存在静态库(.a)和动态库(.so)。

静态库实际上是一些目标文件的集合,只用于链接生成可执行文件阶段。链接器会将程序中使用到函数的代码从库文件中拷贝到应用程序中,一旦链接完成生成可执行文件之后,在执行程序的时候就不需要静态库了。

特性:

  • 由于每个使用静态库的应用程序都需要拷贝所用函数的代码,所以静态链接的生成的可执行文件会比较大,多个程序运行时占用内存空间比较大(每个程序在内存中都有一份重复的静态库代码)
  • 由于运行的时候不用从外部动态加载额外的库了,速度会比共享库快一些
  • 更换一个静态库或者修改一个静态库后,需要重新编译应用程序

动态库也叫共享库(share object),在程序链接的时候只是作些标记,然后在程序开始启动运行的时候,动态地加载所需库(模块)。

特性:

  • 应用程序在运行的时候需要共享库
  • 共享库链接出来的可执行文件比静态库链接出来的要小得多,运行多个程序时占用内存空间比也比静态库方式链接少(因为内存中只有一份共享库代码的拷贝)
  • 由于有一个动态加载的过程所以速度稍慢
  • 更换动态库不需要重新编译程序,只需要更换相应的库即可

动态库和静态库各有特点,适用于不同的场合。本文主要阐述动态库的使用,重点在于显式运行时链接。


动态库的产生和使用

可以通过编译时使用-shared -fPIC参数产生动态库。

gcc -shared -fPIC -o libtest.so test.c

动态库生成之后,就可以使用-ltest -L. 的方式使用该动态库。

/* module.c */
#include 

int m_pr(void)
{
    printf("this is module1.\n");

    return 0;
}

/* module.h */
#ifndef LIB_H
#define LIB_H

int m_pr(void);

#endif

使用 gcc -shared -fPIC -o libmodule.so module.c生成动态库。

/* test.c */
#include 
#include "module.h"

int main(void)
{
    printf("------------------------\n");
        m_pr();
    printf("------------------------\n");

    return 0;
}

此时,直接使用 gcc test.c会报错:

> % gcc test.c 
/tmp/ccmkXs3N.o:在函数‘main’中:
test.c:(.text+0x16):对‘m_pr’未定义的引用
collect2: error: ld returned 1 exit status

很明显,程序不能找到m_pr的定义,程序在编译时就依赖于所使用的库。使用 gcc test.c -lmodule -L.编译生成可执行文件。运行结果如下:

./a.out: error while loading shared libraries: libabc.so: cannot open shared object file: No such file or directory

找不到该共享库,即程序启动时依赖于该共享库。执行export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/yao/test/so_lib把库的路径加到LD_LIBRARY_PATH里面就ok了,运行结果如下:

-> % ./a.out 
------------------------
this is module1.
------------------------

显式运行时链接动态库

显式运行时链接(explicit run-time linking),也叫运行时加载,可以使程序自己在运行时控制加载的指定的模块,并在不需要使用的时候卸载。

运行时加载使得程序的模块组织更加灵活,可以实现诸如插件、驱动等功能,实现了使用时才加载、使用完即卸载。其特性如下:

  • 不必从程序一开始就将其全部装载进来,减少了程序启动时间和内存使用
  • 程序不必重启就可以实现模块的增加、删除、更新等

在linux系统中,动态和一般的共享对象在文件格式上看并没有区别。它们的区别主要体现在加载和使用的方式上:

  • 共享对象是由动态链接器在程序启动之前负责装载和链接,由动态链接器自动完成,对应用程序来说是透明的
  • 动态库的装载是通过动态链接器提供的API完成的

动态链接器提供的API主要有4个:dlopen(), dlsym(), dlclose(), dlerror(),使用它们的时候需要包含 #include

dlopen()

void *dlopen(const char *filename, int flag);

打开一个动态库,并将其加载到进程的地址空间,完成初始化过程。

第一个参数是被加载动态库的路径。如果是绝对路径,函数会尝试直接打开此动态库,如果是相对路径,函数会按以下顺序查找该动态库文件:

  1. 查找环境变量LD_LIBRARY_PATH指定的目录
  2. 查找由 /etc/ld.so.cache里面指定的共享库路径
  3. /lib, /usr/lib

注意,如果把该参数设置为0,将会返回全局符号表的句柄。也就是说,我们可以在运行时找到全局符号表里的任何一个符号并执行它们。

第二个参数是函数符号的解析方式。取值可以是 RTLD_LAZY/RTLD_NOW|RTLD_GLOBAL,其中,RTLD_LAZY表示延迟绑定,当函数第一次被调用时才进行绑定,而RTLD_NOW则是模块被加载时就进行绑定。这两种绑定方式只能选择一个,而它们都可以与RTLD_GLOBAL一起使用,表示将被加载的模块的全局符号合并到进程的全局符号表中,使得以后加载的模块可以使用这些符号。

dlopen的返回值是被加载模块的句柄,供后面调用其他函数时使用。如果加载失败,返回 NULL。如果模块已经被加载过了,返回同一个句柄。

dlsym()

void *dlsym(void *handle, char *symbol);

找到指定句柄中的符号。

第一个参数是使用dlopen返回的句柄,第二个参数是所需要查找的符号,是一个以'\0'结尾的字符串。如果找到了该符号,返回符号的值,如果未找到符号,则返回 NULL

  • 如果查找的是个函数,返回函数的地址
  • 如果是变量,返回变量的地址
  • 如果是常量,返回常量的值

如果返回的常量值刚好是NULL或0,就需要调用dlerror()函数判断是否调用成功。如果返回NULL,则调用成功且符号找到。如果返回错误信息,则未找到该符号

dlclose()

int dlclose(void *handle);

dlopen作用相反,关闭打开的句柄,卸载已加载的某个模块。

系统会维持一个加载引用计数器,每次使用dlopen加载某个模块时,相应的计数器加1,每次使用dlclose卸载某个模块时,相应的计数器减1。只有当计数器值减到0时,模块才被真正地卸载掉。

dlerror()

char *dlerror(void);

每次调用dlopen, dlsym, dlclose之后都可以调用dlerror()来判断上一次调用是否成功。

  • 返回NULL,则上一次调用成功
  • 上一次调用失败,则返回相应的错误信息

例子

修改上述test.c为下:

/* test.c */
#include 
#include 

int (*module_pr)(void);

int main(void)
{
    void *h;

    printf("------------------------\n");
    h = dlopen("./libabc.so", RTLD_NOW|RTLD_GLOBAL);
    if (!h) {
        printf("dlopen error:%s\n", dlerror());
        return -1;
    }

    module_pr = dlsym(h, "m_pr");
    if (dlerror() != NULL) {
        printf("dlsym m_pr error:%s\n", dlerror());
        return -1;
    }

    module_pr();
    dlclose(h);
    dlerror();

    printf("------------------------\n");

    return 0;
}

执行 gcc test.c,报错如下:

-> % gcc test.c 
/tmp/ccM9fcKC.o:在函数‘main’中:
test.c:(.text+0x25):对‘dlopen’未定义的引用
test.c:(.text+0x35):对‘dlerror’未定义的引用
test.c:(.text+0x60):对‘dlsym’未定义的引用
test.c:(.text+0x6a):对‘dlerror’未定义的引用
test.c:(.text+0x73):对‘dlerror’未定义的引用
test.c:(.text+0x9d):对‘dlclose’未定义的引用
test.c:(.text+0xa2):对‘dlerror’未定义的引用
collect2: error: ld returned 1 exit status

修改为 gcc test.c -ldl编译通过,运行结果如下:

-> % ./a.out 
------------------------
this is module1.
------------------------

可见,程序编译时已经不再依赖动态库了,只有到运行时才动态加载所需要的库。


总结

在使用动态库时,可以选择显式运行时链接,但这样会增加一些代码。

对于服务器端的应用程序来说,显式运行时链接可以在程序不重启的情况下加载更新后的动态库,这对于7*24小时工作的服务器来说是至关重要的。

不同的项目可以根据实际情况选择不同的实现方式。

你可能感兴趣的:(c语言基础学习)