ELF 文件格式 ------- 符号表

1. 符号的数据结构

typedef struct elf64_sym {
  Elf64_Word st_name;		/* 该符号的名字在字符串表中的起始下标 */
  unsigned char	st_info;	/* 该符号的类型以及作用域信息 */
  unsigned char	st_other;	/* 暂未使用 */
  Elf64_Half st_shndx;		/* 该符号所在的 section 的下标,如 .data 节为 2 */
  Elf64_Addr st_value;		/* 该符号的值在该 section 中的偏移 */
  Elf64_Xword st_size;		/* 该符号的大小 */
} Elf64_Sym;

​ 上一篇文章分析节头表中分析到,节头表包含一个名字为 .symbol 的条目,该条目的 sh_entsize 成员不为 0,表明该条目指向的节中的内容是一张表,该表中的每一个条目的大小为 sh_entsize 个字节,通过 sh_size 成员可知道该节的总占用大小,因此就能够得出该节中一共有多少个条目:sh_size / sh_entsize 。符号表所在的二进制格式就不再展示了,本篇文章主要讲解符号表的意义

2. Symbol 节的意义

  • 符号的数据结构描述了一个符号的所有信息

    • st_name 该符号的名字所在字符串表的下标
    • st_info 该字段实际上由前 4 bit 与 后 4bit 共同组成,后面讲解该字段
    • st_other 暂未使用,可能未来会用
    • st_shndx 该符号对应节的下标,如 .data 节的下标为 2
    • st_value 对于可重定位目标文件,该字段表示该符号的值在 st_shndx 这个下标的 section 中的偏移
    • st_size 该符号所占用内存字节数
  • 由 st_name 就能够找到该符号的名字,通过 st_info 能够直到该符号的类型以及作用域,通过 st_shndx 能够找到该符号所在的节,通过 st_value 能够找到该符号在该节区中对应的机器码 ,根据 st_size 能够确定该符号在该节区中对应的机器码的大小

  • 重点分析 st_info 字段,该字段定义如下

    #define ELF_ST_BIND(x)		((x) >> 4)
    #define ELF_ST_TYPE(x)		(((unsigned int) x) & 0xf)
    
    /* bind */
    #define STB_LOCAL  0
    #define STB_GLOBAL 1
    #define STB_WEAK   2
    
    /* type */
    #define STT_NOTYPE  0
    #define STT_OBJECT  1
    #define STT_FUNC    2
    #define STT_SECTION 3
    #define STT_FILE    4
    #define STT_COMMON  5
    #define STT_TLS     6
    
  • 上述代码可以看出,st_info 的后 4 bit 表示该符号的 bind 信息,前 4 bit 表示该符号的 type 信息,由这两个信息组合成一个字段,表示该符号的类型以及该符号的作用域(不太准确)

  • 对于 static 类型的成员,其 bind 信息必然是 STB_LOCAL,函数的 type 是 STT_FUNC,变量的 type 是 STT_OBJECT

  • 对于本文件引用的外部符号,该符号通常是 GLOBAL 与 STT_NOTYPE,并且该符号所处于的节区的下标为特殊的 SHN_UNDEF,表明该符号是一个外部符号

  • 通过 symbol 节,能够描述可重定位文件中所有符号的信息,包括该符号的作用域、强还是弱符号,以及该符号是否是外部符号

  • 链接器通过该表,能够将多个可重定位文件链接成为一个可执行文件,当多个文件中定义了相同的符号时,链接器需要根据此表来做判断选择哪一个或者直接报错。

  • 为了让链接器能够修改引用外部符号的位置处的机器码,还需要一个重定位表,该表必然记录了需要修改的机器码在该文件中的位置(offset)以及被引用符号所在符号表的 index,有了需要被修改的位置,有了被引用符号所在该文件符号表的 index,就能够找到被引用符号的 symbol 信息,进而扫描全局符号表,看有没有与这个 symbol 信息相匹配的

3. 可重定位表

  • 经上述分析,对于一个文件引用一个外部符号时,汇编器会生成一个可重定位表,该表告诉链接器:本文件的这个位置需要被修改成正确定的值,并且该位置引用该符号的信息在符号表中的下表为 index

  • 有了这些信息,链接器就能够扫描全局符号表,看看其他文件到底有没有定义该符号,有的话,就修改这个位置并填入合适的值(与寻址方式有关,绝对寻址填符号的绝对地址,相对寻址填 该符号绝对地址 - 下一条指令的地址),没有找到,就报错呗ELF 文件格式 ------- 符号表_第1张图片

你可能感兴趣的:(elf,linux)