iOS底层原理(六):性能优化

前言
性能优化包括:卡顿检测和优化、耗电优化、启动优化、安装包瘦身几部分组成

一、卡顿检测和优化

1. 屏幕成像原理
  • CPU计算完成后,将结果交给GPU渲染,GPU会把渲染的结果放到帧缓存中,视频控制器从帧缓存中读取,并显示到屏幕上,如下图所示:
image.png
2. 显示器的显示原理
电子枪扫描
  • 显示器的电子枪按照上面方式,从上到下一行行扫描,扫描完成后显示器就呈现一帧画面,随后电子枪回到初始位置继续下一次扫描。为了把显示器的显示过程和系统的视频控制器进行同步,显示器(或者其他硬件)会用硬件时钟产生一系列的定时信号。

  • 电子枪换到新的一行,准备进行扫描时,显示器会发出一个HSync水平同步信号(horizonal synchronization) ;而当一帧画面绘制完成后,电子枪回复到原位,准备画下一帧前,显示器会发出一个VSync垂直同步信号(vertical synchronization)

  • 接收到VSync垂直同步信号后,App主线程就会在CPU中计算显示内容,例如视图的创建、布局计算、图片解码、文本绘制等等,然后将结果提交给GPU渲染,由GPU进行变换、合成、渲染,然后将渲染结果提交到帧缓冲区中,等待下一次VSync垂直同步信号到来之时,显示到屏幕上。

3. 卡顿产生的原因
  • 由于垂直同步的机制,如果在一个VSync垂直同步信号时间内,CPU 或者 GPU 没有完成内容提交,则那一帧就会被丢弃,等待下一次机会再显示,而这时显示屏会保留之前的内容不变。这就是界面卡顿的原因

  • 所以无论CPU 和 GPU 哪个阻碍了显示流程,都会造成掉帧现象。开发时也需要分别对 CPU 和 GPU 压力进行评估和优化。

4. 卡顿优化
(1).CPU优化:
  • 尽量使用轻量级的对象,例如用不到事件处理的地方 ,可以考虑使用CALayer代替UIView
  • AutoLayout会比直接设置frame消耗更多的CPU资源
  • 图片的Size最好和UImageView的size保持一致,尽量不要动态缩放(contentMode)
  • 控制线程最大并发数量
  • 尽量把耗时操作放到子线程中,例如:图片解码、图片绘制、文本处理等
  • 不要用JPEG图片,应当使用PNG图片
  • 在tableViewCell高度需要自适应时,需要缓存高度,以避免重复无意义的计算,可以使用字典或者NSCache缓存,或者UITableView-FDTemplateLayoutCell
(2).GPU优化:
  • 尽量避免短时间内大量图片显示,尽可能将多张图片合成一张进行显示
  • GPU能处理的最大纹理尺寸是4096x4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
  • 尽量减少视图数量和层次
  • 减少透明的视图,不透明的就设置opaque为YES
  • 尽量避免离屏渲染
  • 在cellForRowAtIndexPath:回调的时候只创建实例,快速返回cell,不绑定数据。在willDisplayCell: forRowAtIndexPath:的时候绑定数据(赋值)
  • 少用clearColor,maskToBounds,阴影效果等。
(3).尽量避免离屏渲染:

在OpenGL中,GPU有两种渲染方式:

  • On-Screen Rendering: 当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作
  • Off-Screen Rendering: 离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作

离屏渲染消耗性能的原因:

  • 需要创建新的缓冲区
  • 离屏渲染的整个过程,需要多次切换上下文环境:先是从当前屏幕切换到离屏,等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕

哪些操作会触发离屏渲染:

  • 光栅化,例如:layer.shouldRasterize = YES;
  • 遮罩,例如:layer.mask
  • 圆角,同时设置layer.maskToBounds = YESlayer.cornerRadius大于0就会触发离屏渲染,可以考虑通过CoreGraphics绘制圆角,或者叫美工提供圆角图片
  • 阴影,例如:layer.shadowXXX,可以用layer.shadowPath代替
5. 卡顿检测
  • 思路:在RunLoop中增加一个Observer,通过监听RunLoop状态切换的耗时,已达到监控卡顿的目的

  • 可以参考微信团队的卡顿监控方案

二、耗电优化

  • 尽可能降低CPU、GPU功耗

  • 少用定时器

  • 优化I/O操作

    • 尽量不要频繁写入小数据,最好批量一次性写入
    • 读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API,用dispatch_io系统会优化磁盘访问
    • 数据量比较大的,建议使用数据库,例如SQLite、CoreData
  • 网络优化

    • 减少、压缩网络数据
    • 如果多次请求的结果是相同,尽量使用缓存
    • 使用断点续传,否则网络不稳定时可能重复下载
    • 网络不可用时,不要尝试执行网络请求
    • 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间
    • 批量传输,比如下载视频时,不要传输很小的数据包,直接下载整个文件或者一大块一大块的下载;如果下载广告,一次性多下载一些,然后在慢慢展示;
  • 定位优化

    • 如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法,定位完成后,会自动让定位硬件断点
    • 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务
    • 尽量降级定位精度,尽量不要使用精度最高的
    • 尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion:
  • 硬件检测优化

    • 用户移动、摇晃、倾斜设备时,会产生动作motion事件,这些事件由加速器、陀螺仪、磁力计等硬件检测,在不需要检测的场合,及时关闭这些硬件

三、启动优化

1. APP的启动
  • APP的启动分为冷启动热启动

    • 冷启动:从零开始启动APP
    • 热启动:APP已经在内存中了,再次点击图标启动APP
  • 热启动的速度已经非常快了,所以启动优化主要针对于冷启动

2. 查看APP的启动时间
  • 通过添加环境变量可以打印出APP的启动时间:Product -> Scheme -> Edit Scheme -> Run -> Arguments

  • 在环境变量Environment Variables中增加:DYLD_PRINT_STATISTICSYES,然后运行APP,即可在控制台中打印出来

  • 如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为YES

3. APP启动的三大阶段

APP启动分为三大阶段:dyld加载可执行文件和动态库、Runtime初始化OC结构、dyld调用main函数及代理方法,如下图所示

三大阶段

(1).dyld
  • dyldApple动态链接器,全称是dynamic link editor,可以用来装载Mach-O文件,包括可执行文件、动态库

  • 启动APP时,dyld所做的事情有:

    • 装载APP的可执行文件,同时会递归加载所有依赖的动态库

    • 当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步处理

(2).runtime
  • 启动APP时,runtime所做的事情有:

    • 调用map_images进行可执行文件内容的解析和处理

    • load_images中调用call_load_methods,调用所有ClassCategory的+load方法

    • 进行各种objc结果的初始化,包括注册Objc类、初始化类对象等等

    • 调用C++静态初始化器和__attribute__((constructor))修饰的函数

  • 到此为止,可行文件和动态库中所有的符号,包括Class、Protocol、Selector、IMP等等,都已经按格式成功加载到内存中,被runtime所管理了

(3).main
  • 所有初始化工作完成后,dyld就会调用main函数,然后调用UIApplicationMain函数,`然后就是``AppDelegateapplication:didFinishLaunchingWithOptions:```方法
(4).总结
  • APP的启动由dyld主导,将可执行文件加载到内存中,顺便加载所有依赖的动态库

  • 然后runtime负责将可执行文件等加载成objc定义的结构

  • 所有初始化工作结束后,dyld就是调用main函数,进而调用application:didFinishLaunchingWithOptions:方法

4. APP启动优化

根据不同的阶段,进行不同的优化:

  • dyld

    • 减少动态库、合并一些动态库,定期清理不必要的动态库
    • 减少Objc类、分类的数量、减少Selector数量,定期清理不必要的类和分类
    • 减少C++虚函数数量
    • Swift尽量使用struct
  • runtime

    • 用+initialize方法和dispatch_once取代所有的attribute((constructor))、C++静态构造器、ObjC的+load
  • main

    • 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中
    • 按需加载

四、安装包瘦身

安装包IPA主要由可执行文件、资源组成,所以安装包瘦身也是从这两方面考虑

(1). 对于资源的瘦身,包括图片、音频、视频等

  • 采取无损压缩

  • 去除没有用到的资源:https://github.com/tinymind/LSUnusedResources

(2). - 对可行性文件瘦身

  • 编译器优化

    • Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default设置为YES

    • 去掉异常支持Enable C++ Exceptions、Enable Objective-C Exceptions设置为NOOther C Flags添加为-fno-exceptions

  • 去除未使用代码

    • 利用AppCode检测未使用代码,打开AppCode后在,在菜单栏->Code->Inspect Code

    • 或者编写LLVM插件检测出重复代码、未被调用的代码

    • 生成LinkMap文件,可以查看可执行文件的具体组成,可以借助第三方工具解析LinkMap文件,如下图所示

image.png

你可能感兴趣的:(iOS底层原理(六):性能优化)