LLVM-Clang 学习笔记

1.先来看看什么是 LLVM?

LLVM 是 Low Level Virutal Machine的简称,它是个编译器框架,用于优化以任意程序语言编写的程序的编译时间(compile-time)、链接时间(link-time)、运行时间(run-time)以及空闲时间(idle-time).在2000年, Chris Lattner开发了这一套编译器工具库套件.后来随着 LLVM的发展,LLVM可以用于常规编译器,JIT编译器,汇编器,调试器,静态分析工具等一系列跟编程语言相关的工作。

Chris Lattner:
熟悉 Swift 的开发者肯定知道这位大神的名字,他于2010年开始编写 Swift 语言,而且一个人实现了 Swift 的大部分基础架构.他也是 LVVM 以及 Clang的主要开发者.

2.GCC -> LLVM

GCC是 Xcode早期使用的一个强大的编译器.这个编译器被移植到各种系统中,其中就是 Mac OSX 操作系统,所以这就反映在 Xcode中,在早期的 Xcode 调试代码的一个工具就是 GDB,它是GNU调试器.

why换成LLVM呢?

Apple(包括中后期的NeXT) 一直使用GCC作为官方的编译器。GCC作为开源世界的编译器标准一直做得不错,但Apple对编译工具会提出更高的要求。
一方面,是Apple对Objective-C语言(甚至后来对C语言)新增很多特性,但GCC开发者并不买Apple的帐——不给实现,因此索性后来两者分成两条分支分别开发,这也造成Apple的编译器版本远落后于GCC的官方版本。另一方面,GCC的代码耦合度太高,不好独立,而且越是后期的版本,代码质量越差,但Apple想做的很多功能(比如更好的IDE支持)需要模块化的方式来调用GCC,但GCC一直不给做。甚至最近,《GCC运行环境豁免条款 (英文版)》从根本上限制了LLVM-GCC的开发。 所以,这种不和让Apple一直在寻找一个高效的、模块化的、协议更放松的开源替代品.原文链接

版本 | 编译器版本
----|------|----
Xcode3之前 | GCC
Xcode3 | GCC与 LLVM混合编译器
Xcode4 | LLVM-GCC 成为默认编译器
Xcode4.2 | LLVM3.0成为默认编译器
Xcode5 | LLVM5.0, 完成 GCC到LLVM的过渡

3.LLVM 与 Clang

Clang是一个C、C++、OC语言的轻量级编译器。源代码发布于BSD协议下。Clang是由C++编写,基于LLVM,发布于LLVM BSD许可证下的编译器。它与GNU C语言规范几乎完全兼容,并增加了额外的特性。

如果说 LLVM是 iOS 的编译器是不太准确的,但说clang 是 iOS 的编译器这也不太准确,因为 clang 是编译器前端(下图中的 Frontend).那编译器又什么?

简单来说,编译器就是把我们的 C,C++,OC 代码转成 hard code, 在这个过程中,编译器会对代码做各种分析来保证没有无法编译的错误.


LLVM-Clang 学习笔记_第1张图片
Three-Phase编译器架构

这里就要说一下LLVM的三层架构:

1.Frontend: 这第一层就是 clang, 它支持将多种输入语言(c family)经过一系列处理后生成汇编代码(LLVM JR).

2.Commer Optimizer:这第二层是一个优化器,对 LLVM JR 做优化.

3.Backend:第三层对不同的平台再将汇编转成 machine code.

LLVM-Clang 学习笔记_第2张图片
摘自孙源在 MDCC2016的 session

作为一个 iOS 开发者,个人在学习中主要关注在第一层,对第二层第三层只做了解(hello world level).
当按下 Xcode上Run这个按钮之后,我们的编译器做了什么呢?

1.预处理(Prepreocess): import, macro, 预处理指令...

2.词法分析:(Lexical Analysis):将预处理过的代码文本转化成Toke流

3.语法分析:(Semantic Analysis):验证语法是否正确,生成语意节点,组合成抽象语法树.(AST)

4.静态分析:(static Analysis):类型检查,找出非语法错误.

5.代码生成:(CodeGen-IR):生成 LLVM-JR(汇编)



TO DO:
1.clang插件的使用和研究;
2.lldb 调试器的深入学习;

参考文章:

1.孙源在 MDCC2016的 session链接
2.Objc-CN链接

你可能感兴趣的:(LLVM-Clang 学习笔记)