本文会主要讲述一下 App 启动过程,系统做的一些事情。
1 iOS 系统架构
iOS 系统可以分为四层,从下往上介绍:
- 第一层是 Darwin 层,是操作系统的核心,属于操作系统的内核态,包括了系统内核 XNU,驱动等,是开源的,可在 opensource.apple.com 找到。
- 第二层是核心框架层,包括 Metal、OpenGL 等。
- 第三层是应用框架层,比如 Cocoa Touch 框架。
- 第四层是用户体验层,包括用户能接触到的图形应用,如 SpringBoard(桌面系统,统一管理和分发系统接收到的触摸事件)、Spotlight。
上面提到 Darwin 层属于操作系统的内核态,而其余的三层,核心框架层、应用框架层、用户体验层属于用户态。
Darwin 的内核是 XNU,全称'XNU’s Not UNIX'。下面会着重介绍一下 XNU。如上图所示,XNU主要由 Mach、BSD、IOKit 组成。
3 Mach
3-1 Mach 基本介绍
Mach 是 XNU 内核的内环,属于微内核,只提供了处理器调度、进程间通信(IPC)、内存保护、虚拟内存管理、进程和线程的抽象等功能。
3-2 IPC
Mach 的核心功能是 IPC。此外在 Mach 中,所有东西都是属于对象范畴的,比如进程、线程、虚拟内存。对象间是不能直接相互调用的,必须通过消息传递的方式实现,消息会在两个端口之间传递。当处于用户态的核心框架层、应用框架层、用户体验层需要进行系统调用的时候,会调用 mach_msg_trap()
触发陷阱机制,切换到内核态,内核态中实现 mach_msg()
函数完成最后的工作。具体过程如下:
RunLoop 的核心就用到了 mach_msg()
,当没有接收到 port 消息时,内核会将线程置为等待状态,节省资源。
又比如说,在 Xcode 中运行一个 App,点击调试栏中的暂停按钮,可以看到主线程调用栈停留在 mach_msg_trap()
。
4 BSD
Mach 本身提供的 API 有限,额外功能需要 BSD 来实现,BSD 可以看做围绕 Mach 层的一个外环,提供了更高层次的抽象,提供了进程管理、文件系统、网络诸多功能。属于宏内核。
5 IOKit
IOKit 是硬件驱动程序的运行环境,包括电源、内存、CPU 等信息。为设备驱动提供了一个面向对象(C++)的框架。
这里简单讲一下 IOKit、SpringBoard 在触摸事件中起到的作用:
- 用户触摸屏幕,屏幕硬件将事件通过 mach port 发送给 IOKit
- IOKit 将触摸事件封装成 IOHIDEvent 对象,通过 mach port (进程端口通信)传递给 用户体验层的 SpringBoard
- SpringBoard 会判断,如果在桌面,则触发 SpringBoard 主线程的 RunLoop 的 source0 回调
- 如果是在应用呢,将触摸事件通过 IPC 传递给应用(source1),source1 唤醒 RunLoop,将事件分发给 source0,_UIApplicationHandleEventQueue 将 IOHIDEvent 包装成 UIEvent 向下分发
6 Mach、BSD 和微内核、宏内核、混合内核
前面的内容提到 Mach 属于微内核,BSD 属于宏内核,那为什么要这样安排呢?这里简单解释一下。
在微内核中,用户服务和内核服务是在不同的地址空间实现的。因此在用户态如果要进行系统调用的话,需要通过消息传递的方式进行通信,随之带来的缺点是消息传递会造成执行速度变慢。
优点:
- 健壮性:用户服务和内核服务是相互独立的,用户服务的崩溃不会影响到内核服务。
- 扩展性强:添加新的功能,只需要建立一个新的服务到用户空间即可,内核空间不需要做出修改。
- 占用内存小:内核是常驻内存当中,因为内核服务只有一些最基本的功能,所占内存空间小。
而在宏内核中,用户服务和内核是在同一空间中实现的。因此不需要经过消息传递,执行速度比微服务快。但是微内核所拥有的优点,则变成了宏内核的劣势。
既然微内核和宏内核,各自有优点,那何不把两个结合一下,各取所长呢。这就是混合内核了。大致做法是,混合内核会把一些不经常使用的内核模块从内核中移出,从而降低了内核的复杂程度。
XNU 采用的就是微内核 Mach 和宏内核 BSD 的混合内核。
7 XNU 加载 App
介绍完 iOS 的系统架构以及 Darwin 的内核 XNU。我们就开始将 iOS 应用启动期间发生的那些事。
启动程序可以总体概括为以下几个步骤:
- Kern 创建进程,并装载主程序和 dyld,设置栈环境,最后将启动的任务交给 dyld
- 根据栈环境,dyld 自举(bootstrap),最后传递给 dyld 主函数
- dyld 链接主程序,进行核心系统库、objc 自举,最后交给主程序的主函数
- 主程序进入 main 函数,开始主程序的运行
在这里,我们先讲讲在 App 启动过程中,Kernel 内核加载部分,也就是上面说到的第一个步骤。
XNU 首先加载作为可执行文件的 Mach-O 文件来完成的。Mach-O 文件可以在 ipa 中找到。
7-1 Mach-O
首先我们来看一下 Mach-O 文件的结构,可以使用 MachOView 解析。
Mach-O 文件主要包含了三部分信息,Header、Load Command、Data。
Header 里包含 CPU 信息,以及 Load Command 的信息,告诉你如何加载 Command。
Load Command 的作用是告诉操作系统应当如何加载文件中的 Data。系统内核 Kernel 和动态链接器 dyld 都会使用到。
7-2 加载过程
内核在加载过程中,主要干了下面这些事:
- fork 新进程(UNIX 特性)
- 为 Mach-O 分配内存
- 加载解析 Mach-O 文件
- 读取 Mach-O Header
- 根据 Header 中关于 Command 的信息,遍历Command 并执行部分 Command(如分配虚拟内存,创建主线程,代码签名检查),将 Mach-O 映射到内存
- 从内核态切换至用户态的 Dyld 继续加载
从源码地址 ,可以找到入口函数 execve
。
感兴趣的同学,可以依照下面的代码调用顺序,大致看一看每个函数的实现,这样子对整个过程会有更深刻的理解。
- execve
- __mac_execve
- exec_activate_image
- ex_imgact 调用 exec_mach_imgact
- load_machfile
- parse_machfile
这里,选择几段重要的源码来介绍一下,先来看看其中的 __mac_execve
函数。
int __mac_execve(proc_t p, struct __mac_execve_args *uap, int32_t *retval)
{
// 1. 申请内存
MALLOC(bufp, char *, (sizeof(*imgp) + sizeof(*vap) + sizeof(*origvap)), M_TEMP, M_WAITOK | M_ZERO);
// 2. 根据入参 uap 的字段初始化 imgp 的参数
imgp->ip_user_fname = uap->fname;
......
// 3. fork 子进程
imgp->ip_new_thread = fork_create_child(old_task,
NULL,
p,
FALSE,
p->p_flag & P_LP64,
task_get_64bit_data(old_task),
TRUE);
// 4. 加载解析 Mach-O 文件
error = exec_activate_image(imgp);
// 5. 设置进程的主线程
thread_t main_thread = imgp->ip_new_thread;
}
再看看 parse_machfile
函数。
static
load_return_t
parse_machfile(...)
{
// 将 Mach-O 中 load commands 加载进 kernel
addr = kalloc(alloc_size);
...
// 遍历所有 commands,处理需要的部分
while (ncmds--) {
// 根据 header 的信息去获取 command, 进行加载
ncmds = header->ncmds;
// 通过一个起始地址加上偏移量来获取 command 指针
lcp = (struct load_command *)(addr + offset);
switch(lcp->cmd) {
case LC_SEGMENT_64:
// 是最主要的加载命令,指导内核如何设置新运行的进程的内存空间
// 将文件中的段映射到进程地址空间
......
load_segment(......);
......
case LC_MAIN:
// 初始化栈布局和寄存器
......
load_main(......);
......
case LC_LOAD_DYLINKER:
// 注意这里只是通过强转获取 command 指针,没有 load
......
dlp = (struct dylinker_command *)lcp;
......
case LC_UUID:
// Kernel 将 UUID 复制到内部表示 mach 目标的数据中
// 一个唯一的 128 位 ID,匹配一个二进制文件及对应的符号
......
ret = load_uuid((struct uuid_command *) lcp,
(char *)addr + cmds_size,
result);
......
case LC_CODE_SIGNATURE:
// Mach-O 包含了代码签名,如果签名和代码本身不匹配,内核会立刻将进程杀死
......
ret = load_code_signature(
(struct linkedit_data_command *) lcp,
vp,
file_offset,
macho_size,
header->cputype,
result,
imgp);
......
case LC_ENCRYPTION_INFO:
// 加密的二进制文件
......
ret = set_code_unprotect(
(struct encryption_info_command *) lcp,
addr, map, slide, vp, file_offset,
header->cputype, header->cpusubtype);
......
}
}
if (ret == LOAD_SUCCESS) {
......
// 当其他命令全部加载成功后,最后执行调用 dyld
ret = load_dylinker(dlp, dlarchbits, map, thread, depth,
dyld_aslr_offset, result, imgp);
}
}
接下来启动的任务,就交到 dyld 手上。下一篇文章会说说 dyld。
参考资料
- 戴铭专栏-33 | iOS 系统内核 XNU:App 如何加载?
- 深入理解RunLoop
- 宏内核、微内核和混合内核
- 微内核和宏内核
- 书籍《深入解析 MAC OS X & IOS 操作系统》