Linux 编译链接那些事儿(03)动态库库优化之清除符号表信息

1 符号表类型

在动态库中,符号表(Symbol Table)记录了库中定义的符号(函数、变量等)以及它们的属性和位置信息。这些符号表项描述了库中可供外部程序使用的符号。在 ELF(Executable and Linkable Format)文件格式中,常见的符号表类型主要包括以下几类:

  • .strtab:字符串表(String Table)用于存储符号表中的字符串名称。符号表中的符号条目通常使用字符串偏移来引用字符串表中的名称。该节提供了符号表中使用的字符串名称的存储位置。
  • .shstrtab:节名称字符串表(Section Name String Table)用于存储节名称的字符串。它包含了所有节的名称,以及这些节在文件中的偏移和大小。
  • .rel[a].text 或 .rel[a].data:重定位表(Relocation Table)用于存储需要进行重定位的代码段(.text)或数据段(.data)中的符号引用。这些表包含了需要修改的目标地址和对应的符号索引。
  • .plt 和 .got:过程链接表(Procedure Linkage Table)和全局偏移表(Global Offset Table)是用于支持动态链接的特殊节。.plt 包含了函数的跳转指令,用于在运行时进行动态函数调用。.got 则包含了全局变量的地址,用于在运行时进行全局变量的访问。
  • .debug:调试信息节,存储了编译器生成的调试信息,如源代码行号、变量名等。这些信息在调试器中用于源代码级别的调试和故障排除。
  • .bss:未初始化的数据节,通常用于存储未初始化的全局变量和静态变量。这些变量在程序加载时将被初始化为零值。
  • .symtab:该节存储的是静态符号表(Static Symbol Table),也称为符号表。它包含了编译时链接生成的符号信息,用于在编译和链接过程中进行符号解析和重定位。.symtab 中的符号表记录了可执行文件或共享对象中定义的函数、变量和其他符号的名称、类型、大小和地址等信息。这个符号表在链接过程中被使用,用于符号解析和符号重定位。
  • .dynsym:该节存储的是动态符号表(Dynamic Symbol Table)。它包含了在运行时动态链接过程中需要的符号信息。.dynsym 中的符号表记录了在可执行文件或共享对象中使用的外部函数、变量和其他符号的名称、类型、大小和地址等信息。这个符号表在动态链接器(比如 ld.so)加载共享对象时被使用,用于解析和链接共享对象的外部符号。

这些符号表节与符号的解析、重定位和调试等相关,确保程序能够正确链接和执行。具体的符号表节可能因不同的编译器、链接器和目标平台而异,因此在具体情况下,可使用工具如 readelf 或 objdump 来查看特定可执行文件或共享对象的符号表节和相关信息。

同时这些符号表类型共同组成了动态库的结构,使得库中的函数和变量能够被其他程序正确地引用和使用。这些符号表类型在编译、链接和加载过程中起着重要的作用,确保了符号的可见性和正确性。

说明:.symtab 和 .dynsym 两个符号表用于不同的链接和加载阶段。.symtab 在编译和链接时生成,并存储在可执行文件或共享对象中。.dynsym 则是在运行时由动态链接器根据需要加载和解析的。这两个符号表在链接和运行时,都扮演了重要的角色,确保符号的正确解析和链接,以支持程序的正常执行。

2 符号表移除

一般情况下,动态链接库(Dynamic Link Library,DLL)的优化中去除符号表通常指的是去除动态库中的符号表(Symbol Table)部分。符号表是动态库中记录符号信息的重要部分,包括函数、变量等的名称、类型、大小等信息。符号表在链接和调试过程中起着关键的作用,可以使外部程序正确地引用和使用库中的符号。然而,在某些情况下,为了减小动态库的体积并提高加载速度,可以选择将符号表从动态库中去除。这个过程称为去除符号表(Stripping Symbol Table)。

2.1 符号表移除原理说明

符号表的存在是为了在程序运行时提供符号的可见性和调试支持。而去除符号表的操作是通过 strip 命令实现的,它通过以下原理去除动态库文件中的符号表:

  1. 符号表位于动态库文件的特定节(section)中。strip 命令会解析 ELF(Executable and Linkable Format)格式的动态库文件,找到符号表所在的节。
  2. strip 命令根据指定的选项(比如--strip-all)将找到的符号表从节中移除。
  3. 移除符号表后,strip 命令会更新动态库文件的相关元数据,如节头表、段表等,确保文件的结构和格式保持正确。
  4. 移除符号表后,动态库文件的大小会减小,因为符号表通常占据了相当数量的空间。

注意:去除动态库文件中的符号表会导致调试信息的丢失,使得在出现问题时更难进行调试和故障排除。因此,在进行符号表去除操作时,需要权衡优化需求和调试需求,并根据具体情况进行决策。

2.2 strip命令详解

在 Linux 系统上,可以使用strip命令去除共享对象(.so)动态库文件中的符号表。strip 命令是 GNU Binutils 工具集的一部分,用于去除二进制文件中的调试信息和符号表。

要去除动态库文件中的符号表,可以在终端中运行以下命令:

# 是要去除符号表的动态库文件名
$strip -s .so
或者
$strip --strip-all .so

strip 命令在 Linux 系统中还有一些常用参数,可以根据需求选择适合的参数配置。以下是一些常用的 strip 命令参数及其说明:

  • -s,--strip-all:去除所有的符号表和调试信息。这是最常用的参数,用于最小化文件大小并移除所有符号表和调试信息。
  • --strip-debug:仅去除调试信息,保留符号表。使用此选项可以减小文件大小,但仍保留符号表以便进行符号级别的调试。
  • --strip-unneeded:去除未使用的符号表。此选项会移除未被动态库使用的符号,减小文件的大小。
  • --keep-file-symbols:保留文件级别的符号信息。使用此选项可以保留动态库中定义的全局变量和静态函数的符号信息,而移除其他非必要的符号。
  • --only-keep-debug:仅保留调试信息,移除所有其他内容。使用此选项可以将符号表和其他非调试信息全部移除,只保留调试信息。
  • -p,--preserve-dates:保留文件的修改时间戳。默认情况下,strip 命令会更新文件的修改时间戳为当前时间,而使用此选项可以保留原始的修改时间戳。

这些参数提供了不同的选项,可以根据具体需求选择合适的参数组合来优化动态库文件。

3 移除符号标的作用

移除符号表的操作在优化和保护方面具有一些重要的作用。以下是移除符号表的一些作用和说明:

  • 减小文件大小:符号表通常占据了动态库文件中相当数量的空间。通过移除符号表,可以显著减小文件的大小,尤其对于庞大的库文件来说,这可以节省存储空间,并有助于减少网络传输和加载时间。
  • 提高加载速度:符号表中包含了动态库中定义的所有符号信息,包括函数、变量等的名称、类型和大小等。当加载动态库时,系统需要解析并处理符号表,这可能会增加加载时间。通过移除符号表,可以减少加载时的解析和处理时间,从而提高动态库的加载速度。
  • 保护知识产权:符号表中包含了动态库中定义的符号的详细信息,包括函数和变量的名称。这些信息可能被恶意用户或竞争对手利用,进行逆向工程、代码分析或非法使用。通过移除符号表,可以降低对代码的逆向工程和分析的难度,有助于保护知识产权和代码的安全性。
  • 减少信息泄露风险:符号表中包含了函数和变量的名称,这可能会暴露一些敏感信息,如数据库连接信息、加密算法等。通过移除符号表,可以减少泄漏敏感信息的风险,增强代码的安全性。

注意:移除符号表会导致调试信息的丢失,这会使得在出现问题时更难进行调试和故障排除。因此,在进行符号表移除操作时,需要权衡优化需求和调试需求,并根据具体情况进行决策。在发布产品或分发代码之前,确保进行充分的测试和调试,并根据实际需求选择是否移除符号表。

你可能感兴趣的:(Linux,系统,python,linux,windows)