1.探索macho文件
1.1macho简介
Mach-O(Mach Object)是macOS、iOS、iPadOS存储程序和库的文件格 式。对应系统通过应用二进制接口(application binary interface,缩写为 ABI)来运行该格式的文件。
Mach-O格式用来替代BSD系统的a.out格式。Mach-O文件格式保存了在 编译过程和链接过程中产生的机器代码和数据,从而为静态链接和动态 链接的代码提供了单一文件格式。
可执行文件调用过程
- 调用
fork
函数,创建一个process
- 调用
execve
或其衍生函数,在该进程上加载,执行我们的Mach-O
文件
当我们调用时execve
(程序加载器),内核实际上在执行以下操作: - 将文件加载到内存
- 开始分析
Mach-O
中的mach_header
,以确认它是有效的Mach-O
文件
1.2查看macho的头文件
objdump --macho --private-header macho文件
objdump --macho --private-header PayDemo
//输出结果
Mach header
magic cputype cpusubtype caps filetype ncmds sizeofcmds flags
MH_MAGIC_64 ARM64 ALL 0x00 EXECUTE 30 4120 NOUNDEFS DYLDLINK TWOLEVEL BINDS_TO_WEAK PIE
otool -h PayDemo //otool -h命令也可以读出
macho文件的结构
1.2macho中的代码段
int main(int argc, char *argv[]) {
return 0;
}
通过命令
objdump --macho -d 查看
objdump --macho -d macho文件
100003fa0: 55 pushq %rbp
100003fa1: 48 89 e5 movq %rsp, %rbp
100003fa4: 31 c0 xorl %eax, %eax
100003fa6: c7 45 fc 00 00 00 00 movl $0, -4(%rbp)
100003fad: 89 7d f8 movl %edi, -8(%rbp)
100003fb0: 48 89 75 f0 movq %rsi, -16(%rbp)
100003fb4: 5d popq %rbp
100003fb5: c3 retq
2.符号表
2.1符号表Symbol Table
Symbol Table:就是用来保存符号。
String Table:就是用来保存符号的名称。
Indirect Symbol Table:间接符号表。保存使用的外部符号。更准确一点就是使 用的外部动态库的符号。是Symbol Table的子集。
2.2全局符号和本地符号
我们在main函数上定义一个全局变量和一个静态变量
#import
int global_init_value = 10;
static int static_init_value = 9;
int main(int argc, char *argv[]) {
return 0;
}
通过objdump命令查看macho的符号表
objdump --macho --syms
0000000100003fa0 l d *UND*
0000000100003fa0 l d *UND* _main
0000000000000016 l d *UND*
0000000000000016 l d *UND*
0000000000000000 l d *UND* _global_init_value
0000000000000000 l d *UND*
0000000100000000 g F __TEXT,__text __mh_execute_header
0000000100004008 g O __DATA,__data _global_init_value
0000000100003fa0 g F __TEXT,__text _main
可以看出全局变量是全局符号,静态全局变量是本地符号
怎么把全局符号变成本地符号呢
//定义成全局变量
extern int hidden_y;
extern double default_y;
extern double protected_y;
int hidden_y __attribute__((visibility("hidden"))) = 99; //全局符号便成本地符号
double default_y __attribute__((visibility("default"))) = 100;//如果 //还是全局符号
visibility属性,控制文件导出符号,限制符号可见性
-fvisibility:clang参数
default:用它定义的符号将被导出。
hidden:用它定义的符号将不被导出。
全局符号对整个项目可见
如果我们在一个库的m文件中实现一个全局的global_object函数,我们可以在项目中通过extern void global_object()之后正常使用,但是如果我们项目中也实现global_object函数,代码会优先调用本项目中的global_object方法,这里涉及到命名空间
two_levelnamespace & flat_namespace:
二级命名空间与一级命名空间。链接器默认采用二级命名空间,也就是除了会记录符号 名称,还会记录符号属于哪个Mach-O的,比如会记录下来_NSLog来自Foundation。
2.3导出符号导出符号
我们在main中使用NSLog,可知NSLog对于Foundation是导出符号,NSLog对于我们的项目是导入符号
我们看一下我们自己的macho文件的导出符号
objdump --macho --exports-trie
//打印结果
Exports trie:
0x100000000 __mh_execute_header
0x100003F40 _global_object
0x100004048 _global_init_value
0x100003F60 _main
0x100004040 _default_y
我们可以看出我们的导出符号也就是我们的全局符号。
2.4间接符号表
间接符号表是我们使用的其他动态库的符号。
查看间接符号表
objdump --macho --indirect-symbols
//打印结果
Indirect symbols for (__TEXT,__stubs) 1 entries
address index name
0x0000000100003f86 23 _NSLog
Indirect symbols for (__DATA,__nl_symbol_ptr) 1 entries
address index name
0x0000000100004000 ABSOLUTE
Indirect symbols for (__DATA,__got) 1 entries
address index name
0x0000000100004008 25 dyld_stub_binder
Indirect symbols for (__DATA,__la_symbol_ptr) 1 entries
address index name
0x0000000100004010 23 _NSLog
我们strip的话,剥离本地符号,全局符号也就是导出符号不能被剥离。
2.5OC类是导出符号
我们创建OC类,查看OC类和方法是本地符号还是全局符号(导出符号)
objdump --macho --exports-trie
我们创建的oc类都是导出符号,如果我们不想让我们的类作为导出符号被外界使用我们应该怎么办呢?
2.6修改link配置,隐藏导出符号
配置other link flag参数如下
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_CLASS_$_LGOneObject
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_METACLASS_$_LGOneObject
重新查看导出符号
objdump --macho --exports-trie
Exports trie:
0x100000000 __mh_execute_header
0x100003F10 _global_object
0x100004170 _global_init_value
0x100003F30 _main
0x100004168 _default_y
可以看出我们的隐藏了导出符号OBJC_METACLASS_LGOneObject
2.7重定位符号表
重定位符号就是我们在调用别人的api时,在编译的时候需要记录一下放到重定位符号表中。
查看目标文件o的重定位
objdump --macho --reloc test.o
//打印结果
test.o:
Relocation information (__TEXT,__text) 2 entries
address pcrel length extern type scattered symbolnum/value
0000001c True long True BRANCH False _NSLog
0000000b True long False SIGNED False 3 (__DATA,__cfstring)
Relocation information (__DATA,__cfstring) 2 entries
address pcrel length extern type scattered symbolnum/value
00000010 False quad False UNSIGND False 2 (__TEXT,__cstring)
00000000 False quad True UNSIGND False ___CFConstantStringClassReference
Relocation information (__LD,__compact_unwind) 1 entries
address pcrel length extern type scattered symbolnum/value
00000000 False quad False UNSIGND False 1 (__TEXT,__text)
怎么生成目标文件可以在静态库查看