LLVM 编译器 原理解析, 插件编写

前言

  • 官网地址 : LLVM
  • LLVM项目是模块化,可重用的编译器以及工具链技术的集合
  • 创始人,亦是Swift之父 Chris Lattner

编译器

  • GCC
  • LLVM
  • Clang
    编译器原理: 将代码首先进过编译器前端,目的是将代码规范化(词法分析,语法分析),检查错误等操作,
    然后生成编译中间代码(LLVM IR),然后经过编译器后端不同架构生成对应的机器码(x86,PC,ARM不同处理器生成不同的机器码)
  • LLVM架构展示:


    LLVM架构展示

Clang

  • Clang 属于LLVM项目的一个子项目,基于LLVM架构的C/C++ / Objective-C 编译器前端
  • Clang
  • 相比GCC,有如下优点:
    1.编译速度快 3倍
    2.占用内存小 1/5左右
    3.模块化设计 易于IDE集成
    4.诊断信息可读性强 提示信息更加友善

OC源文件的编译过程

  1. 查看编译过程指令
    clang -ccc-print-phases main.m

    编译过程

  2. 查看preprocessor(预处理)的结果,替换全局变量,词法/语法分析等
    clang -E main.m

    编译预处理

    • 词法分析指令:(作用是每个单词会生成一个token)
      clang -fmodules -E -Xclang -dump-tokens main.m
      词法分析
    • 生成语法树
      clang -fmodules -fsyntax-only -Xclang -ast-dump main.m
      语法树
  3. 生成中间代码
    LLVM IR 有三种标识形式,但本质上是等价的,好比水可以是气态,液态,固态

    • text,便于阅读的文本格式,类似汇编语言,扩展名是.ll
      clang -S -emit-llvm main.m
    • 内存格式
    • 二进制格式,扩展名.bc
      clang -c -emit-llvm main.m
      中间代码text格式
    • IR的基本语法:
1.注释是以;开头的
2.全局标识符以@开头,局部标识符以%开头
3.alloca,在当前函数栈帧中分配内存
4. i32,  32bit,4个字节的意思
5. align 内存对齐
6. store,写入数据
7. load 读取数据

更多指令

未完待续....

你可能感兴趣的:(LLVM 编译器 原理解析, 插件编写)