第18章 X86汇编程序基础

感觉本章知识太给力了,关如下例子就可让自己好好捉摸。


第18章 X86汇编程序基础

18.1 

汇编指令说明例子


.section .data

.section .text

.globl _start

_start:

movl $1, %eax

movl $4, %ebx 

int $0x80



.section .data

汇编程序中以.开头的名称并不是指令的助记符,不会被翻译成机器指令,而是给汇编器一些特

殊的指示,称为汇编指示(Assembler Directive)或伪操作(Pseudo-operation),由于它不

是真正的指令所以加个“伪”字。.section 指示把代码划分成若干个段(Section),程序被操作

系统加载执行时,每个段被加载到不同的地址,具有不同的读、写、执行权限。.data 段保存程

序的数据,是可读可写的,C程序的全局变量也属于.data 段。本程序中没有定义数据,所

以.data 段是空的。

.section .text

.text 段保存代码,是只读和可执行的,后面那些指令都属于这个.text 段。

.globl _start

_start是一个符号(Symbol),符号在汇编程序中代表一个地址,可以用在指令中,汇编程序

经过汇编器的处理之后,所有的符号都被替换成它所代表的地址值。在C语言中我们通过变量名

访问一个变量,其实就是读写某个地址的内存单元,我们通过函数名调用一个函数,其实就是

跳转到该函数第一条指令所在的地址,所以变量名和函数名都是符号,本质上是代表内存地址

的。

.globl指示告诉汇编器,_start这个符号要被链接器用到,所以要在目标文件的符号表中给它特

殊标记(在第 5.1 节 “目标文件”会讲到)。_start就像C程序的main 函数一样特殊,是整个程序

的入口,链接器在链接时会查找目标文件中的_start符号代表的地址,把它设置为整个程序的

入口地址,所以每个汇编程序都要提供一个_start符号并且用.globl声明。如果一个符号没有

用.globl指示声明,就表示这个符号不会被链接器用到。

_start:

_start在这里就像C语言的语句标号一样。汇编器在处理汇编程序时会计算每个数据对象和每条

指令的地址,当汇编器看到这样一个标号时,就把它下面一条指令的地址作为_start这个符号

所代表的地址。而_start这个符号又比较特殊,它所代表的地址是整个程序的入口地址,所以

下一条指令movl $1, %eax 就成了程序中第一条被执行的指令。

movl $1, %eax

这是一条数据传送指令,CPU内部产生一个数字1,然后传送到eax 寄存器中。mov 的后缀l表

示long,说明是32位的传送指令。CPU内部产生的数称为立即数(Immediate),在汇编程序

中,立即数前面要加$,寄存器名前面要加%,以便跟符号名区分开。

这是一条数据传送指令,CPU内部产生一个数字1,然后传送到eax 寄存器中。mov 的后缀l表

示long,说明是32位的传送指令。CPU内部产生的数称为立即数(Immediate),在汇编程序

中,立即数前面要加$,寄存器名前面要加%,以便跟符号名区分开。

movl $4, %ebx

和上一条指令类似,生成一个立即数4,传送到ebx 寄存器中。

int $0x80

前两条指令都是为这条指令做准备的,执行这条指令时发生以下动作:

1. int 指令称为软中断指令,可以用这条指令故意产生一个异常,上一章讲过,异常的处理

和中断类似,CPU从用户模式切换到特权模式,然后跳转到内核代码中执行异常处理程

序。

2. int 指令中的立即数0x80是一个参数,在异常处理程序中要根据这个参数决定如何处理,

在Linux内核中,int $0x80 这种异常称为系统调用(System Call)。内核提供了很多系统

服务供用户程序使用,但这些系统服务不能像库函数(比如printf)那样调用,因为在执

行用户程序时CPU处于用户模式,不能直接调用内核函数,所以需要通过系统调用切

换CPU模式,通过异常处理程序进入内核,用户程序只能通过寄存器传几个参数,之后就

要按内核设计好的代码路线走,而不能由用户程序随心所欲,想调哪个内核函数就调哪个

内核函数,这样保证了系统服务被安全地调用。在调用结束之后,CPU再切换回用户模

式,继续执行int 指令后面的指令,在用户程序看来就像函数的调用和返回一样。

3. eax 和ebx 寄存器的值是传递给系统调用的两个参数,eax 的值是系统调用号,1表

示_exit 系统调用,ebx 的值则是传给_exit 系统调用的参数,也就是退出状态。_exit 这个

系统调用会终止掉当前进程,而不会返回它继续执行。以后我们会讲到其它系统调用,也

是由int $0x80 指令引发的,eax 的值是系统调用的编号,不同的系统调用需要的参数个数

也不同,比如有的需要ebx 、ecx 、edx 三个寄存器的值做参数,大多数系统调用完成之后

是会返回用户程序继续执行的,本例的_exit 系统调用比较特殊。


18.2

低地址保存的是整数的低位,这种字节序(Byte Order)称为小端(Little Endian)



你可能感兴趣的:(第18章 X86汇编程序基础)