汇编基础(一)

语言的发展

机器语言: 由0和1组成的机器指令. 如:0101 0001 1101 0110
汇编语言(assembly language): 使用符号代替机器语言,也称为符号语言,如:mov ax,bx
高级语言: C\C++\Java\OC\Swift,更加接近人类的自然语言 如:int a = b;

我们的代码在终端设备上是这样的过程:

汇编基础(一)_第1张图片
汇编.png
  • 汇编语言机器语言一一对应,每一条机器指令都有与之对应的汇编指令
  • 汇编语言可以通过编译得到机器语言机器语言可以通过反汇编得到汇编语言
  • 高级语言可以通过编译得到汇编语言 \ 机器语言,但汇编语言\机器语言几乎不可能还原成高级语言

汇编语言的特点

  • 可以直接访问、控制各种硬件设备,比如存储器、CPU等,能最大限度地发挥硬件的功能

  • 能够不受编译器的限制,对生成的二进制代码进行完全的控制

  • 目标代码简短,占用内存少,执行速度快

  • 汇编指令是机器指令的助记符,同机器指令一一对应。每一种CPU都有自己的机器指令集\汇编指令集,所以汇编语言不具备可移植性

  • 知识点过多,开发者需要对CPU等硬件结构有所了解,不易于编写、调试、维护

  • 不区分大小写,比如mov和MOV是一样的

汇编的用途

  • 编写驱动程序、操作系统(比如Linux内核的某些关键部分)
  • 对性能要求极高的程序或者代码片段,可与高级语言混合使用(内联汇编)
  • 软件安全,病毒分析与防治,逆向\加壳\脱壳\破解\外挂\免杀\加密解密\漏洞\黑客
  • 理解整个计算机系统的最佳起点和最有效途径
  • 为编写高效代码打下基础
  • 弄清代码的本质
    • 函数的本质究竟是什么?
    • sizeof
    • ++a + ++a + ++a 底层如何执行的?
    • 编译器到底帮我们干了什么?
    • DEBUG模式和RELEASE模式有什么关键的地方被我们忽略
    • ......

越底层越单纯!真正的程序员都需要了解的一门非常重要的语言,汇编!

汇编语言的种类

  • 目前讨论比较多的汇编语言有
    • 8086汇编(8086处理器是16bit的CPU)
    • Win32汇编
    • Win64汇编
    • ARM汇编(嵌入式、Mac、iOS)
    • ......
  • 我们iPhone里面用到的是ARM汇编,但是不同的设备也有差异.因CPU的架构不同.
架构 设备
armv6 iPhone, iPhone2, iPhone3G, 第一代、第二代 iPod Touch
armv7 iPhone3GS, iPhone4, iPhone4S,iPad, iPad2, iPad3(The New iPad), iPad mini, iPod Touch 3G, iPod Touch4
armv7s iPhone5, iPhone5C, iPad4(iPad with Retina Display)
arm64 iPhone6s , iphone6s plus,iPhone6, iPhone6 plus,iPhone5S ,iPad Air, iPad mini2
  • 因为学习所以建议先从最为经典的8086开始
    • 结构简洁,容易理解
    • 指令简单,便于记忆
    • 原理相通

几个必要的常识

  • 要想学好汇编,首先需要了解CPU等硬件结构
  • APP/程序的执行过程
  • 硬件相关最为重要是CPU/内存
  • 在汇编中,大部分指令都是和CPU与内存相关的
汇编基础(一)_第2张图片
APP/程序的执行过程.png

总线

汇编基础(一)_第3张图片
CPU
  • 每一个CPU芯片都有许多管脚,这些管脚和总线相连,CPU通过总线跟外部器件进行交互
  • 总线:一根根导线的集合
  • 总线的分类 1.地址总线 2.数据总线 3.控制总线
    汇编基础(一)_第4张图片

举个例子

汇编基础(一)_第5张图片

  • 地址总线

    • 它的宽度决定了CPU的寻址能力
    • 8086的地址总线宽度是20,所以寻址能力是1M( 2^20 )
      0x00000000000000000000 最小地址
      0x111111111111111111111最大地址 间隔2^20
  • 数据总线

    • 它的宽度决定了CPU的单次数据传送量,也就是数据传送速度
    • 8086的数据总线宽度是16,所以单次最大传递2个字节的数据

8088的数据总线宽度是8,8086的数据总线宽度是16,分别向内存中写入89D8H如下图:注意:这里是16进制,后方的H是单词Hexadecimal的意思

汇编基础(一)_第6张图片
汇编基础(一)_第7张图片
  • 控制总线
    • 它的宽度决定了CPU对其他器件的控制能力、能有多少种控制

做个小练习

汇编基础(一)_第8张图片

内存

汇编基础(一)_第9张图片
各类存储区的逻辑连接
汇编基础(一)_第10张图片
各类存储器的逻辑连接-物理地址对应图
汇编基础(一)_第11张图片
各类存储器的物理地址情况
  • 内存地址空间的大小受CPU地址总线宽度的限制。8086的地址总线宽度为20,可以定位2^20个不同的内存单元(内存地址范围0x00000~0xFFFFF),所以8086的内存空间大小为1MB

  • 0x00000~0x9FFFF:主存储器。可读可写

  • 0xA0000~0xBFFFF:向显存中写入数据,这些数据会被显卡输出到显示器。可读可写

  • 0xC0000~0xFFFFF:存储各种硬件\系统信息。只读

寄存器

内部部件之间由总线连接

汇编基础(一)_第12张图片
CPU的典型构成

  • 对程序员来说,CPU中最主要部件是寄存器,可以通过改变寄存器的内容来实现对CPU的控制
  • 不同的CPU,寄存器的个数、结构是不相同的(8086是16位结构的CPU)
  • 8086有14个寄存器
    • 都是16位的寄存器
    • 可以存放2个字节


      汇编基础(一)_第13张图片
      8086内部寄存器

通用寄存器

AX、BX、CX、DX这4个寄存器通常用来存放一般性的数据,称为通用寄存器(有时也有特定用途),通常,CPU会先将内存中的数据存储到通用寄存器中,然后再对通用寄存器中的数据进行运算

假设内存中有块红色内存空间的值是3,现在想把它的值加1,并将结果存储到蓝色内存空间

    *   CPU首先会将红色内存空间的值放到AX寄存器中:mov ax,红色内存空间
    *   然后让AX寄存器与1相加:add ax,1
    *   最后将值赋值给内存空间:mov 蓝色内存空间,ax

AX、BX、CX、DX这4个通用寄存器都是16位的,上一代8086的寄存器都是8位的,为了保证兼容, AX、BX、CX、DX都可分为2个独立的8位寄存器来使用
* H代表高位寄存器
* L代表低位寄存器

汇编基础(一)_第14张图片

字和字节

在汇编的数据存储中,有2个比较常用的单位
字节:byte,1个字节由8bit组成,可以存储在8位寄存器中
:word,1个字由2个字节组成,这2个字节分别称为字的高字节和低字节

  • 比如数据20000(4E20H,0100111000100000B),高字节的值是78,低字节的值是32



    1个字可以存在1个16位寄存器中,这个字的高字节、低字节分别存储在这个寄存器的高8位寄存器、低8位寄存器中

你可能感兴趣的:(汇编基础(一))