iOS全解15: iOS编译原理

iOS全解8:启动优化、性能优化、App后台保活、崩溃检测

内容目录

1、 基础解释
2、 iOS 设备的CPU架构
3、 ARM处理器指令集
4、 i386|x86_64 指令集
5、 Xcode中指令集
6、 编译器 LLVM、解释器

一般可以将编程语言分为两种,

wiki:编译语言、直译式语言
百度:编译型语言(编译器处理)、直译语言(解释器处理)

解释器:是在运行时才去解析代码,获取一段代码后就会将其翻译成目标代码(就是字节码:Bytecode),然后一句一句地执行目标代码。解释器可以在运行时去执行代码,说明它具有动态性,程序运行后能够随时通过增加和更新代码来改变程序的逻辑。

编译器:把一种编程语言(原始语言)转换为另一种编程语言(目标语言),编译生成一份完整的机器码再去执行。

大多数编译器由两部分组成:前端和后端。
  • 前端:负责词法分析,语法分析,生成中间代码;
  • 后端:以中间代码作为输入,进行行架构无关的代码优化,接着针对不同架构生成不同的机器码。

前端/后端 依赖统一格式的 中间代码(IR),使得前后端可以独立的变化。新增一门语言只需要修改前端,而新增一个CPU架构只需要修改后端即可。

Objective C/C/C++使用的编译器前端是clang,swift是swift,后端都是LLVM。

1、基础解释:

程序编译一般需经几个步骤:预处理、编译、汇编、链接。

编译:是将将人类可读的程序代码文本 --> 翻译成为 --> 计算机可以执行的二进制指令机器码。即:源程序 --> 目标程序

编译器前端 Clang:预处理 --> 词法分析 --> 语法分析 --> 生成IR(Clang Code Generator)

编译器后端 LLVM:对IR优化 --> 目标代码--> 汇编器 --> 机器码(LLVM Code Generator)--> 链接 --> Mac-O文件

可执行文件

(executable file) 指的是可以由操作系统进行加载执行的文件。在不同的操作系统环境下,可执行程序的呈现方式不一样。在windows操作系统下,可执行程序可以是 .exe文件 .sys文件 .com等类型文件。

可执行程序

(executable program,EXE File)是可在操作系统存储空间中浮动定位的二进制可执行程序。它可以加载到内存中,由操作系统加载并执行。特定的CPU指令集(如X86指令集)对应的不同平台之间的可执行程序不可直接移植运行。

2、iOS 设备的CPU架构

2.1、在模拟器上支持:

模拟器32位处理器 iPhone4s-5: i386 架构
模拟器64位处理器 iPhone5s-8 Plus:x86_64 架构
(ios模拟器没有arm指令集)

2.2、在真机设备上支持:

真机32位处理器:armv7、armv7s
真机64位处理器:arm64
armv6: iPhone、iPhone 2、iPhone 3G、iPod Touch(第一代)、iPod Touch(第二代)
armv7: iPhone 3Gs、iPhone 4、iPhone 4s、iPad、iPad 2
armv7s:iPhone 5、iPhone 5c (静态库只要支持了armv7,就可以在armv7s的架构上运行)
arm64: iPhone 5s、iPhone 6、iPhone 6 Plus、iPhone 6s、iPhone 6s Plus、iPad Air、iPad Air2、iPad mini2、iPad mini3

3、ARM处理器指令集

几乎所有手机处理器都基于ARM处理器的,ARM处理器特点是体积小、低功耗、低成本、高性能,所以在嵌入式系统中应用广泛
armv6|armv7|armv7s|arm64都是ARM处理器的指令集
这些指令集都是向下兼容的

4、i386|x86_64 指令集:i386和x86_64 是Mac处理器的指令集

  • i386是针对intel通用微处理器32位处理器的
  • x86_64是针对x86架构的64位处理器
    所以当使用iOS模拟器的时候会遇到i386|x86_64(ios模拟器没有arm指令集)
命令查看静态库支持的架构:

通过 lipo -info - 》 拖入模拟器或者真机.framework的路径 查看静态库支持的架构(以下是终端命令)
$ lipo -info - .framework的路径

5、Xcode中指令集(相关选项Build Setting中设置)

•   Architectures(架构)
•   Valid Architectures(有效架构)
•   Build Active Architecture Only(只构建活动架构)
Pasted Graphic 1.png
5.1. Architectures(架构)

指定工程被编译成支持哪些指令集类型.
支持的指令集越多,就会编译出很多个指令集代码的数据包,对应生成二进制包就越大,也就是ipa包越大。
所以现在支持 iPhone5 以上,只需要 arm64 就行了,armv6|armv7|armv7s 这三个都可以干掉了。

5.2. Valid Architectures(有效架构)

限制可能被支持指令集的范围.
xcode编译出来的二进制包类型最终从这些类型产生,而编译出哪些指令集的包,将由Architectures与Valid Architectures这些交集来确定,面会举例说明.

5.3. Build Active Architecture Only(只构建活动架构)

指定只对当前连接设备所支持的指令集编译。
当设置为YES时是为了debug编译的速度更快,它只会编译当前的architecture版本。
当设置为NO时,会编译所有的版本,所以一般debug设置为YES,release设置为NO以适应不同设备。

6. 编译器 LLVM

2000年,伊利诺伊大学厄巴纳-香槟分校(简称UIUC)这所享有世界声望的一流公立研究型大学的 Chris Lattner(他的 twitter @clattner_llvm ) 开发了一个叫作 Low Level Virtual Machine 的编译器开发工具套件,后来涉及范围越来越大,可以用于常规编译器,JIT编译器,汇编器,调试器,静态分析工具等一系列跟编程语言相关的工作,于是就把简称 LLVM 这个简称作为了正式的名字。Chris Lattner 后来又开发了 Clang,使得 LLVM 直接挑战 GCC 的地位。2012年,LLVM 获得美国计算机学会 ACM 的软件系统大奖,和 UNIX,WWW,TCP/IP,Tex,JAVA 等齐名。
Chris Lattner 生于 1978 年,2005年加入苹果,将苹果使用的 GCC 全面转为 LLVM。2010年开始主导开发 Swift 语言。

LLVM是构架编译器(compiler)的框架系统,以C++编写而成,用于优化以任意程序语言编写的程序的编译时间(compile-time)、链接时间(link-time)、运行时间(run-time)以及空闲时间(idle-time),对开发者保持开放,并兼容已有脚本。

LLVM计划启动于2000年,最初由美国UIUC大学的Chris Lattner博士主持开展。2006年Chris Lattner加盟Apple Inc.并致力于LLVM在Apple开发体系中的应用。Apple也是LLVM计划的主要资助者。

目前LLVM已经被苹果IOS开发工具、Xilinx Vivado、Facebook、Google等各大公司采用。

LLVM是一个模块化和可重用的编译器和工具链技术的集合,Clang 是 LLVM 的子项目,是 C,C++ 和 Objective-C 编译器,目的是提供惊人的快速编译,比 GCC 快3倍,其中的 Clang Static Analyzer 主要是进行语法分析,语义分析和生成中间代码,当然这个过程会对代码进行检查,出错的和需要警告的会标注出来。LLVM 核心库提供一个优化器,对流行的 CPU 做代码生成支持。lld 是 Clang / LLVM 的内置链接器,clang 必须调用链接器来产生可执行文件。

引用:两篇入门文章 Blogs 还有一个关于代码规范的插件
1、LLVM & Clang 入门
2、Clang Plugin 之 Debug
其他
iOS 性能优化总结
iOS 持续交付之 Fastlane



iOS编译

在苹果公司使用的编译器是 LLVM,相比于 Xcode 5 版本前使用的 GCC,编译速度提高了 3 倍。同时,苹果公司也反过来主导了 LLVM 的发展,让 LLVM 可以针对苹果公司的硬件进行更多的优化。

总结来说,LLVM 是编译器工具链技术的一个集合。而其中的 lld 项目,就是内置链接器。编译器会对每个文件进行编译,生成 Mach-O(可执行文件);链接器会将项目中的多个 Mach-O 文件合并成一个。

LLVM 的编译过程非常复杂。如果你有兴趣的话,可以通过官方手册查看完整的编译过程。

总结下编译的几个主要过程:

  • 首先,你写好代码后,LLVM 会预处理你的代码,比如把宏嵌入到对应的位置。
  • 预处理完后,LLVM 会对代码进行词法分析和语法分析,生成 AST 。AST 是抽象语法树,结构上比代码更精简,遍历起来更快,所以使用 AST 能够更快速地进行静态检查,同时还能更快地生成 IR(中间表示)。
  • 最后 AST 会生成 IR,IR 是一种更接近机器码的语言,区别在于和平台无关,通过 IR 可以生成多份适合不同平台的机器码。对于 iOS 系统,IR 生成的可执行文件就是 Mach-O。

编译器:每个文件进行编译 -> Mach-O(可执行文件)
链接器:项目中的多个 Mach-O 文件 -> 合并成一个

编译的主要过程:
Source Code --> AST --> IR --> (机器码:指令集)armv7/64/x86 CUP的指令集(Mach-O文件)

源码、抽象语法树、中间表示语言



引用:资源链接
  • Clang
  • LLVM
  • iOS编译:从命令行运行分析器
  • 检查项
  • Clang常见的误报问题及处理方法
  • Clang静态分析器:Clang Static Analyzer
  • 开源地址
  • GNU

参考内容:
深入浅出iOS编译
iOS编译过程的原理和应用
iOS汇编快速入门上篇

你可能感兴趣的:(iOS全解15: iOS编译原理)