ELF文件详解

ELF文件详解
ELF文件分为四个部分:elf header,program header table,section header table,dynamic symbol table
其中节头表(section header table) 和 段头表(program header table) 中用到的数据相同,只是组织方式不同
一、ELF header
每个ELF文件都必须存在一个ELF_Header,这里存放了很多重要的信息用来描述整个文件的组织,如: 版本信息,入口信息,偏移信息等,程序执行也必须依靠其提供的信息

ELF文件详解_第1张图片
ELF文件详解_第2张图片
数据结构如下
ELF文件详解_第3张图片
e_xxx 和上面对应表如下图:
ELF文件详解_第4张图片
ELF文件详解_第5张图片
其中数据类型如下
ELF文件详解_第6张图片
二、Program header table 程序头表
存储so文件运行时所需要的信息,这部分信息会直接被linker使用,用于加载so文件,告诉系统如何在内存中创建映像,在图中也可以看出来,有程序头部表才有段,有段就必须有程序头部表,其中存放各个段的基本信息(包括地址指针)

ELF文件详解_第7张图片
ELF文件详解_第8张图片
节到段的映射
ELF文件详解_第9张图片
链接视图是以节(section)为单位,执行视图是以段(segment)为单位。链接视图就是在链接时用到的视图,而执行视图则是在执行时用到的视图。上图左侧的视角是从链接来看的,右侧的视角是执行来看的
段(Segment): 就是将文件分成一段一段映射到内存中,段中通常包括一个或多个节区
那么为什么需要节和段两种视图? 当ELF文件被加载到内存中后,系统会将多个具有相同权限(flg值)section合并一个segment。操作系统往往以页为基本单位来管理内存分配,一般页的大小为4096B,即4KB的大小。同时,内存的权限管理的粒度也是以页为单位,页内的内存是具有同样的权限等属性,并且操作系统对内存的管理往往追求高效和高利用率这样的目标。ELF文件在被映射时,是以系统的页长度为单位的,那么每个section在映射时的长度都是系统页长度的整数倍,如果section的长度不是其整数倍,则导致多余部分也将占用一个页。而我们从上面的例子中知道,一个ELF文件具有很多的section,那么会导致内存浪费严重。这样可以减少页面内部的碎片,节省了空间,显著提高内存利用率

ELF文件详解_第10张图片
readelf -S xxx # 用来查看可执行文件中有哪些section,如下图

readelf --segments xxx # 可以查看该文件的执行视图,下图红框部分为上图的节信息在段中的显示
ELF文件详解_第11张图片
最后加载进内存的只有program header table 程序头表里的load段,其他都只是描述信息,加载过程中用到,但是最后加载进去内存的只有load段

ELF文件详解_第12张图片
三、Section header table 节头部表
类似与程序头部表,但与其相对应的是节区(Section)
节区(Section): 将文件分成一个个节区,每个节区都有其对应的功能,如符号表,哈希表等

ELF文件详解_第13张图片
.relname和.relaname: 010Editor打开so,展现形式为下图,.rel.dyn 和 .rel.plt ,是用来重定向dyn和plt的,也就是静态情况下,存放偏移值,如果进行动态调试的时候,就会加上基址变成绝对地址(重定向)
下面第二张图中,左边红框就是偏移值,右边红框只要把基址加进来,就是绝对地址,把基址加进来的过程就是重定向的过程

ELF文件详解_第14张图片
ELF文件详解_第15张图片
.plt 程序链接表,用于做映射关系,拿到依赖so的绝对地址,做重定向的
ELF文件详解_第16张图片

四、Dynamic symbol table
这里是符号表,也就是会用到的所有函数名称表,包括自己写的函数和依赖的系统so中的函数,到时候.plt会对这部分重定向

你可能感兴趣的:(逆向)