Mach-O

前言:

     Mach-O(Mach Object)是macOS、iOS、iPadOS存储程序和库的文件格式。对应系统通过应用二进制接口(application binary interface,缩写为ABI)来运行该格式的文件。Mach-O格式用来替代BSD系统的a.out格式。Mach-O文件格式保存了在编译过程和链接过程中产生的机器代码和数据,从而为静态链接和动态链接的代码提供了单一文件格式。

MachO格式的常见文件有:

目标文件.o

库文件 .a静态库 .dylib动态库 .framework文件

二进制可执行文件 dyld动态链接器将依赖的动态库加载到内存 .dsym符号表

可执行文件调用过程

1. 调用`fork`函数,创建一个`process`

2. 调用`execve`或其衍生函数,在该进程上加载,执行我们的`Mach-O`文件

当我们调用时`execve`(程序加载器),内核实际上在执行以下操作:

    将文件加载到内存

    开始分析`Mach-O`中的`mach_header`,以确认它是有效的`Mach-O`文件

一. Mach-O文件结构

image.png

1. 查看MachO Headers

// 查看 Header,包括 Load commands

$ objdump --macho --private-headers LoginApp

$ otool -l ${MACHO_PATH}

// 只查看 Header 

$ objdump --macho --private-header LoginApp 

$ otool -h ${MACHO_PATH}

image.png
image.png

// 查看 __TEXT只读代码段  iOS7/8 苹果限制 text代码段为60M,现在放宽到500M

$ objdump --macho -d ${MACHO_PATH}

image.png

在 中定义了程序的入口函数(定义在LC_MAIN的Load command命令),告诉动态链接器去加载程序的入口

// grep代表搜索, -A 5:向下输出5行 

$ objdump --macho --private-headers LoginApp | grep "MAIN" -A 5

image.png

2.使用machoinfo工具查看MachO Headers简洁版

第一种使用方法:首先对machoinfo进行编译,生成一个查看MachO的文件,使用该文件查看其他MachO Headers信息,命令如下

$ ./machoinfo ${MACHO_PATH}

image.png

第二种使用方法:Edit Scheme 配置要查看的MachO文件路径,如下所示

被查看的MachO文件作为参数传入程序入口 int main(int argc,char *argv[]) 

image.png

配置完成之后,运行machoinfo工程,macho信息打印在Xcode 控制台

二. 符号表

 Symbol Table:就是用来保存符号。

 String Table:就是用来保存符号的名称。

 Indirect Symbol Table:间接符号表。保存使用的外部符号。更准确一点就是使 用的外部动态库的符号。是Symbol Table的子集。

2.1 Xcode 脚本输出重定位到终端

image.png
image.png
image.png
image.png

2.2全局符号和本地符号

我们在main函数上定义一个全局变量和一个静态变量

#import

int global_init_value = 10;

static int static_init_value = 9;

int main(int argc, char *argv[]) {  return 0;  }

查看符号表命令

$ objdump --macho --syms ${MACH_PATH}

image.png

可以看出全局变量是全局符号,静态全局变量是本地符号。怎么把全局符号变成本地符号呢?

//定义成全局变量

extern int hidden_y;

extern double default_y;

extern double protected_y;

int hidden_y __attribute__((visibility("hidden"))) = 99; //全局符号变成本地符号double default_y __attribute__((visibility("default"))) = 100;//defalut不改变符号状态

visibility属性,控制文件导出符号,限制符号可见性

-fvisibility:clang参数

default:用它定义的符号将被导出。

hidden:用它定义的符号将不被导出。

全局符号对整个项目可见,对引用这个项目的工程也可见;本地符号只对当前文件可见

如果我们在一个库的m文件中实现一个全局的global_object函数,我们可以在项目中通过extern void  global_object()之后正常使用,但是如果我们项目中也实现global_object函数,代码会优先调用本项目中的global_object方法,这里涉及到命名空间

two_levelnamespace & flat_namespace:

二级命名空间与一级命名空间。链接器默认采用二级命名空间,也就是除了会记录符号 名称,还会记录符号属于哪个Mach-O的,比如会记录下来_NSLog来自Foundation。

2.3导出符号

我们在main中使用NSLog,可知NSLog对于Foundation是导出符号,NSLog对于我们的项目是导入符号

查看导出符号命令

$ objdump --macho --exports-trie ${MACH_PATH}

image.png

可以看出我们的导出符号也就是我们的全局符号。

2.4间接符号表

间接符号表是我们使用的其他动态库的符号。

查看间接符号表命令

$ objdump --macho --indirect-symbols ${MACH_PATH}

image.png

我们strip的话,剥离本地符号,全局符号也就是导出符号不能被剥离。

2.5OC类是导出符号

OC是一门动态语言,默认是导出符号,所以可以根据符号来恢复符号表。

我们创建OC类,查看OC类和方法是本地符号还是全局符号(导出符号)

image.png

我们创建的oc类都是导出符号,如果我们不想让我们的类作为导出符号被外界使用,我们可修改link配置,隐藏导出符号

配置other linker flag参数如下

OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_CLASS_$_LGOneObject

OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_METACLASS_$_LGOneObject

重新查看导出符号如下图

image.png

配置other linker flag参数做一些其他操作

//  剥离符号命令

OTHER_LDFLAGS=$(inherited) -Xlinker -S

// 多个OC类 可以使用  -unexported_symbol_list

OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol_list -Xlinker _OBJC_CLASS_$_LGOneObject

//  -map 导出一些符号信息以及链接的其他库信息 

OTHER_LDFLAGS=$(inherited) -Xlinker -S -Xlinker -map -Xlinker /Users/wangning/Desktop/Symbol.text

2.6弱引用符号与弱定义符号 

Weak Symbol:

     Weak Reference Symbol: 表示此未定义符号是弱引用。如果动态链接器找不

到该符号的定义,则将其设置为0。链接器会将此符号设置弱链接标志。

     Weak defintion Symbol: 表示此符号为弱定义符号。如果静态链接器或动态链

接器为此符号找到另一个(非弱)定义,则弱定义将被忽略。只能将合并部分中的符号标

记为弱定义。

//  弱引用

void weak_import_function(void) __attribute__((weak_import));

// 弱定义

void weak_function(void)  __attribute__((weak));

把一个全局符号定义成 弱定义符号,并不影响它是一个导出符号

image.png

// -U 表示 弱引用符号 _weak_import_function  动态链接时候不用管

OTHER_LDFLAGS=$(inherited) -Xlinker -U -Xlinker _weak_import_function

2.7未定义符号

common符号,未初始化的全局符号,当找到定义的全局符号之后,会把未定义的符号删除,所以重复定义并不会报错

链接的时候会把一个未定义符号强制成定义符号,类似于弱定义符号

NSLog对当前使用的可执行文件来说是一个未定义符号

image.png

2.8间接符号表

间接符号表起别名,可以让引用的库文件提供给其他库使用

// -alias  给间接符号表起别名

OTHER_LDFLAGS=$(inherited) -Xlinker -alias -Xlinker _NSLog -Xlinker Cat_NSLog

image.png

Cat_NSLog作为重新导出符号提供给外部使用

image.png

2.9重定位符号表

重定位符号就是我们在调用别人的api时,在编译的时候需要记录一下放到重定位符号表中。重定位符号表里存放当前用到的符号,可以检测重定位符号表来查看.o文件中对某个api的使用情况

// 查看目标文件o的重定位

$ objdump --macho --reloc test.o

image.png
image.png

2.10Swift符号表

Swift 作为一门静态语言,其符号相关查看

image.png
image.png

总结:

macho文件是可读可写的,strip命令 可以修改macho的内容,也就是符号剥离。

Xcode中的断点也是可以读写到文件中,断点写入文件后,在文件中可以查看断点的绝对路径等相关信息

br read -f ${PATH}  // 读取文件中的断点

br write -f ${PATH} // 断点写入文件

br list strip

br enable strip

你可能感兴趣的:(Mach-O)