前言:
Mach-O(Mach Object)是macOS、iOS、iPadOS存储程序和库的文件格式。对应系统通过应用二进制接口(application binary interface,缩写为ABI)来运行该格式的文件。Mach-O格式用来替代BSD系统的a.out格式。Mach-O文件格式保存了在编译过程和链接过程中产生的机器代码和数据,从而为静态链接和动态链接的代码提供了单一文件格式。
MachO格式的常见文件有:
目标文件.o
库文件 .a静态库 .dylib动态库 .framework文件
二进制可执行文件 dyld动态链接器将依赖的动态库加载到内存 .dsym符号表
可执行文件调用过程
1. 调用`fork`函数,创建一个`process`
2. 调用`execve`或其衍生函数,在该进程上加载,执行我们的`Mach-O`文件
当我们调用时`execve`(程序加载器),内核实际上在执行以下操作:
将文件加载到内存
开始分析`Mach-O`中的`mach_header`,以确认它是有效的`Mach-O`文件
一. Mach-O文件结构
1. 查看MachO Headers
// 查看 Header,包括 Load commands
$ objdump --macho --private-headers LoginApp
$ otool -l ${MACHO_PATH}
// 只查看 Header
$ objdump --macho --private-header LoginApp
$ otool -h ${MACHO_PATH}
// 查看 __TEXT只读代码段 iOS7/8 苹果限制 text代码段为60M,现在放宽到500M
$ objdump --macho -d ${MACHO_PATH}
在 中定义了程序的入口函数(定义在LC_MAIN的Load command命令),告诉动态链接器去加载程序的入口
// grep代表搜索, -A 5:向下输出5行
$ objdump --macho --private-headers LoginApp | grep "MAIN" -A 5
2.使用machoinfo工具查看MachO Headers简洁版
第一种使用方法:首先对machoinfo进行编译,生成一个查看MachO的文件,使用该文件查看其他MachO Headers信息,命令如下
$ ./machoinfo ${MACHO_PATH}
第二种使用方法:Edit Scheme 配置要查看的MachO文件路径,如下所示
被查看的MachO文件作为参数传入程序入口 int main(int argc,char *argv[])
配置完成之后,运行machoinfo工程,macho信息打印在Xcode 控制台
二. 符号表
Symbol Table:就是用来保存符号。
String Table:就是用来保存符号的名称。
Indirect Symbol Table:间接符号表。保存使用的外部符号。更准确一点就是使 用的外部动态库的符号。是Symbol Table的子集。
2.1 Xcode 脚本输出重定位到终端
2.2全局符号和本地符号
我们在main函数上定义一个全局变量和一个静态变量
#import
int global_init_value = 10;
static int static_init_value = 9;
int main(int argc, char *argv[]) { return 0; }
查看符号表命令
$ objdump --macho --syms ${MACH_PATH}
可以看出全局变量是全局符号,静态全局变量是本地符号。怎么把全局符号变成本地符号呢?
//定义成全局变量
extern int hidden_y;
extern double default_y;
extern double protected_y;
int hidden_y __attribute__((visibility("hidden"))) = 99; //全局符号变成本地符号double default_y __attribute__((visibility("default"))) = 100;//defalut不改变符号状态
visibility属性,控制文件导出符号,限制符号可见性
-fvisibility:clang参数
default:用它定义的符号将被导出。
hidden:用它定义的符号将不被导出。
全局符号对整个项目可见,对引用这个项目的工程也可见;本地符号只对当前文件可见
如果我们在一个库的m文件中实现一个全局的global_object函数,我们可以在项目中通过extern void global_object()之后正常使用,但是如果我们项目中也实现global_object函数,代码会优先调用本项目中的global_object方法,这里涉及到命名空间
two_levelnamespace & flat_namespace:
二级命名空间与一级命名空间。链接器默认采用二级命名空间,也就是除了会记录符号 名称,还会记录符号属于哪个Mach-O的,比如会记录下来_NSLog来自Foundation。
2.3导出符号
我们在main中使用NSLog,可知NSLog对于Foundation是导出符号,NSLog对于我们的项目是导入符号
查看导出符号命令
$ objdump --macho --exports-trie ${MACH_PATH}
可以看出我们的导出符号也就是我们的全局符号。
2.4间接符号表
间接符号表是我们使用的其他动态库的符号。
查看间接符号表命令
$ objdump --macho --indirect-symbols ${MACH_PATH}
我们strip的话,剥离本地符号,全局符号也就是导出符号不能被剥离。
2.5OC类是导出符号
OC是一门动态语言,默认是导出符号,所以可以根据符号来恢复符号表。
我们创建OC类,查看OC类和方法是本地符号还是全局符号(导出符号)
我们创建的oc类都是导出符号,如果我们不想让我们的类作为导出符号被外界使用,我们可修改link配置,隐藏导出符号
配置other linker flag参数如下
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_CLASS_$_LGOneObject
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_METACLASS_$_LGOneObject
重新查看导出符号如下图
配置other linker flag参数做一些其他操作
// 剥离符号命令
OTHER_LDFLAGS=$(inherited) -Xlinker -S
// 多个OC类 可以使用 -unexported_symbol_list
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol_list -Xlinker _OBJC_CLASS_$_LGOneObject
// -map 导出一些符号信息以及链接的其他库信息
OTHER_LDFLAGS=$(inherited) -Xlinker -S -Xlinker -map -Xlinker /Users/wangning/Desktop/Symbol.text
2.6弱引用符号与弱定义符号
Weak Symbol:
Weak Reference Symbol: 表示此未定义符号是弱引用。如果动态链接器找不
到该符号的定义,则将其设置为0。链接器会将此符号设置弱链接标志。
Weak defintion Symbol: 表示此符号为弱定义符号。如果静态链接器或动态链
接器为此符号找到另一个(非弱)定义,则弱定义将被忽略。只能将合并部分中的符号标
记为弱定义。
// 弱引用
void weak_import_function(void) __attribute__((weak_import));
// 弱定义
void weak_function(void) __attribute__((weak));
把一个全局符号定义成 弱定义符号,并不影响它是一个导出符号
// -U 表示 弱引用符号 _weak_import_function 动态链接时候不用管
OTHER_LDFLAGS=$(inherited) -Xlinker -U -Xlinker _weak_import_function
2.7未定义符号
common符号,未初始化的全局符号,当找到定义的全局符号之后,会把未定义的符号删除,所以重复定义并不会报错
链接的时候会把一个未定义符号强制成定义符号,类似于弱定义符号
NSLog对当前使用的可执行文件来说是一个未定义符号
2.8间接符号表
间接符号表起别名,可以让引用的库文件提供给其他库使用
// -alias 给间接符号表起别名
OTHER_LDFLAGS=$(inherited) -Xlinker -alias -Xlinker _NSLog -Xlinker Cat_NSLog
Cat_NSLog作为重新导出符号提供给外部使用
2.9重定位符号表
重定位符号就是我们在调用别人的api时,在编译的时候需要记录一下放到重定位符号表中。重定位符号表里存放当前用到的符号,可以检测重定位符号表来查看.o文件中对某个api的使用情况
// 查看目标文件o的重定位
$ objdump --macho --reloc test.o
2.10Swift符号表
Swift 作为一门静态语言,其符号相关查看
总结:
macho文件是可读可写的,strip命令 可以修改macho的内容,也就是符号剥离。
Xcode中的断点也是可以读写到文件中,断点写入文件后,在文件中可以查看断点的绝对路径等相关信息
br read -f ${PATH} // 读取文件中的断点
br write -f ${PATH} // 断点写入文件
br list strip
br enable strip