iOS 启动优化探索

概念

冷启动是指, App 点击启动前,它的进程不在系统里,需要系统新创建一个进程分配给它启动的情况。这是一次完整的启动过程。

热启动是指 ,App 在冷启动后用户将 App 退后台,在 App 的进程还在系统里的情况下,用户重新启动进入 App 的过程,这个过程做的事情非常少。

App 的启动主要包括三个阶段:
1、main() 函数执行前;
2、main() 函数执行后;
3、首屏渲染完成后。

注:App 的启动时间,指的是从用户点击 App 开始,到用户看到第一个界面之间的时间

main() 函数执行前

在 main() 函数执行前,系统主要会做下面几件事情:

  1. 加载可执行文件(App 的.o 文件的集合);
  2. 加载动态链接库,进行 rebase 指针调整和 bind 符号绑定;
  3. Objc 运行时的初始处理,包括 Objc 相关类的注册、category 注册、selector 唯一性检查等;
  4. 初始化,包括了执行 +load() 方法、attribute((constructor)) 修饰的函数的调用、创建 C++ 静态全局变量。

相应地,这个阶段对于启动速度优化来说,可以做的事情包括:

  1. 减少动态库加载。每个库本身都有依赖关系,苹果公司建议使用更少的动态库,并且建议在使用动态库的数量较多时,尽量将多个动态库进行合并。数量上,苹果公司建议最多使用 6 个非系统动态库。
  2. 减少加载启动后不会去使用的类或者方法。
  3. +load() 方法里的内容可以放到首屏渲染完成后再执行,或使用 +initialize() 方法替换掉。因为,在一个 +load() 方法里,进行运行时方法替换操作会带来 4 毫秒的消耗。不要小看这 4 毫秒,积少成多,执行 +load() 方法对启动速度的影响会越来越大。
  4. 控制 C++ 全局变量的数量。

main() 函数执行后

main() 函数执行后的阶段,指的是从 main() 函数执行开始,到 appDelegate 的 didFinishLaunchingWithOptions 方法里首屏渲染相关方法执行完成

首页的业务代码都是要在这个阶段,也就是首屏渲染前执行的,主要包括了:

  • 首屏初始化所需配置文件的读写操作;
  • 首屏列表大数据的读取;
  • 首屏渲染的大量计算等。

首屏渲染完成后

首屏渲染后的这个阶段,主要完成的是,非首屏其他业务服务模块的初始化、监听的注册、配置文件的读取等。

从函数上来看,这个阶段指的就是截止到 didFinishLaunchingWithOptions方法作用域内执行首屏渲染之后的所有方法执行完成。简单说的话,这个阶段就是从渲染完成时开始,到 didFinishLaunchingWithOptions 方法作用域结束时结束。

这个阶段用户已经能够看到 App 的首页信息了,所以优化的优先级排在最后。但是,那些会卡住主线程的方法还是需要最优先处理的,不然还是会影响到用户后面的交互操作。

明白了 App 启动阶段需要完成的工作后,我们就可以有的放矢地进行启动速度的优化了。这些优化,包括了功能级别和方法级别的启动优化。接下来,我们就从这两个角度展开看看。

功能级别的启动优化

功能级别的启动优化,就是要从 main()函数执行后这个阶段下手。
优化的思路是: main()函数开始执行后到首屏渲染完成前只处理首屏相关的业务,其他非首屏业务的初始化、监听注册、配置文件读取等都放到首屏渲染完成后去做.

方法级别的启动优化

经过功能级别的启动优化,也就是将非首屏业务所需的功能滞后以后,从用户点击 App 到看到首屏的时间将会有很大程度的缩短,也就达到了优化 App 启动速度的目的。

通常情况下,耗时较长的方法主要发生在计算大量数据的情况下,具体的表现就是加载、编辑、存储图片和文件等资源。

那么,你觉得是不是只需要优化对资源的操作就可以了呢?

当然不是。就像 +load()方法,一个耗时 4 毫秒,100 个就是 400 毫秒,这种耗时用户也是能明显感知到的。

比如,我以前使用的 ReactiveCocoa框架(这是一个 iOS 上的响应式编程框架),每创建一个信号都有 6 毫秒的耗时。这样,稍不注意各种信号的创建就都被放在了首屏渲染完成前,进而导致 App 的启动速度大幅变慢。

对 App 启动速度的监控

- 第一种方法是,定时抓取主线程上的方法调用堆栈,计算一段时间里各个方法的耗时.

Xcode 工具套件里自带的 Time Profiler ,采用的就是这种方式。

  • 定时间隔设置得长了,会漏掉一些方法,从而导致检查出来的耗时不精确;
  • 而定时间隔设置得短了,抓取堆栈这个方法本身调用过多也会影响整体耗时,导致结果不准确。

这个定时间隔如果小于所有方法执行的时间(比如 0.002 秒),那么基本就能监控到所有方法。但这样做的话,整体的耗时时间就不够准确。一般将这个定时间隔设置为 0.01 秒。这样设置,对整体耗时的影响小,不过很多方法耗时就不精确了。但因为整体耗时的数据更加重要些,单个方法耗时精度不高也是可以接受的,所以这个设置也是没问题的。

总结来说,定时抓取主线程调用栈的方式虽然精准度不够高,但也是够用的。

第二种方法是,对 objc_msgSend 方法进行 hook 来掌握所有方法的执行耗时.

hook 方法的意思是,在原方法开始执行时换成执行其他你指定的方法,或者在原有方法执行前后执行你指定的方法,来达到掌握和改变指定方法的目的。

hook objc_msgSend 这种方式的优点是非常精确,而缺点是只能针对 Objective-C 的方法。当然,对于 c 方法和 block 也不是没有办法,你可以使用 libffiffi_call 来达成hook,但缺点就是编写维护相关工具门槛高。

综上,如果对于检查结果精准度要求高的话,我比较推荐你使用 hook objc_msgSend 方式来检查启动方法的执行耗时。

如何做一个方法级别启动耗时检查工具来辅助分析和监控?

使用 hook objc_msgSend 方式来检查启动方法的执行耗时时,我们需要实现一个称手的启动时间检查工具。那么,我们应该如何实现这个工具呢?

现在,我就一步一步地和你说说具体怎么做。

首先,你要了解为什么 hook 了 objc_msgSend 方法,就可以 hook 全部 Objective-C 的方法?

Objective-C 里每个对象都会指向一个类,每个类都会有一个方法列表,方法列表里的每个方法都是由selector函数指针metadata组成的。

objc_msgSend 方法干的活儿,就是在运行时根据对象和方法selector去找到对应的函数指针,然后执行。也就是说,objc_msgSend 是 Objective-C 里方法执行的必经之路,能够控制所有的 Objective-C 的方法。

objc_msgSend 本身是用汇编语言写的,这样做的原因主要有两个:

  • 一个原因是,objc_msgSend 的调用频次最高,在它上面进行的性能优化能够提升整个 App 生命周期的性能。而汇编语言在性能优化上属于原子级优化,能够把优化做到极致。所以,这种投入产出比无疑是最大的。

  • 另一个原因是,其他语言难以实现未知参数跳转到任意函数指针的功能

现在,苹果公司已经开源了 Objective-C 的运行时代码。你可以在苹果公司的开源网站,找到 objc_msgSend 的源码。

objc_msgSend 全架构实现源代码文件列表

列出的是所有架构的实现,包括 x86_64 等。objc_msgSend 是 iOS 方式执行最核心的部分,编程领域的宝藏,值得你深入探究和细细品味。

objc_msgSend方法执行的逻辑是:先获取对象对应类的信息,再获取方法的缓存,根据方法的 selector 查找函数指针,经过异常错误处理后,最后跳到对应函数的实现。

按照这个逻辑去看源码会更加清晰,更容易注意到实现细节。阅读 objc_msgSend 源码是编写方法级耗时工具的一个必要的环节,后面还需要编写一些对应的汇编代码。

接下来,我们再看看怎么 hook objc_msgSend 方法?

Facebook 开源了一个库,可以在 iOS 上运行的 Mach-O 二进制文件中动态地重新绑定符号,这个库叫 fishhook。你可以在 GitHub 上,查看fishhook 的代码。

fishhook 实现的大致思路是,通过重新绑定符号,可以实现对 c 方法的 hookdyld 是通过更新 Mach-O 二进制的__DATA segment 特定的部分中的指针来绑定lazynon-lazy 符号,通过确认传递给 rebind_symbol里每个符号名称更新的位置,就可以找出对应替换来重新绑定这些符号。

下面,我针对 fishhook 里的关键代码,和你具体说下fishhook 的实现原理。

你可能感兴趣的:(iOS 启动优化探索)