第3章 程序的机器级表示

3.1 程序编码

程序计数器:%rip,给出下一条执行的指令。

整数寄存器:

整数寄存器

%rbx、%rbp和%r12~%r15为被调用者保存寄存器。意思是被调用者要么保存这些寄存器的值,返回时再还原,要么不更改这些寄存器的值。
除了栈指针%rsp,其他寄存器都为调用者保存寄存器。意思是调用者已经保存了,被调用者随便用,随便改。

条件码寄存器

CF:进位标志
ZF:零标志
SF:符号标志
OF:溢出标志

一组向量寄存器

存放一个或多个整数或浮点数值。#3.2 数据格式


第3章 程序的机器级表示_第1张图片
数据格式

64位系统中指针为8字节,4字。

3.3 操作数格式

第3章 程序的机器级表示_第2张图片
操作数格式

+括号后类似于指针。

3.4 数据传送

mov:S,D D<-S
movabs:立即数传往寄存器。
movz(5种小传大):零扩展
movs(6种小传大):符号扩展
clt:%eax符号扩展到%rax

3.5 压入和弹出栈

push:S 先将%rsp-对应长度,再将S存入%rsp指向处。
pop:D 将%rsp指向处的值弹出到D,在将%rsp+对应长度。

3.6 算数和逻辑

lea:LEA S,D加载有效地址S的地址存入D,若S为运算,则将运算的值存入D(本书中一般都为算数)。
inc、dec、neg、not:D 自加自减取负取补。
add、sub、imul、xor、or、and:S,D 算数和逻辑运算存到D
sal、shl、sar、shr:移位运算,算数右移和逻辑右移的差别是补符号位还是补0。

3.7 控制

cmp:S1,S2 S2-S1
test:S1,S2 S1&S2
set:D 根据条件码的组合设定一个字节的值。对应条件根据后缀推测。

3.8 跳转

jmp:固定跳转
j:S 条件跳转,条件根据后缀推测。
cmov:S,R条件传送,条件根据后缀推测。

3.9 do-while

loop:
    body-statement
    t = text-expr;
    if (t)
        goto loop;

3.10 while

跳转到中间

    goto test;
loop:
    body-statement
test:
    t = text-expr;
    if (t)
        goto loop;

guarded-do

翻译成do-while再翻译成goto
t = text-expr;
if (!t)
    goto done;
loop:
    body-statement
    t = text-expr;
    if (t)
        goto loop;
done:
较高的优化选项使用这一种。

3.11 for

翻译成while再翻译成对应形式。

3.12 switch

使用跳转表。

转移控制

call调用
ret返回,返回寄存器%rax

3.13 变长数组

定长数组可以用lea计算偏移量,而变长数组需要用乘法计算,虽然乘法的性能比较低,但这是不能避免的。

struct和union

struct和成员的关系是has,struct的大小通常>=成员大小的和。
union和成员的关系是is,union的大小为最大字段的大小。

3.14 对齐

按最大的数据类型确定对齐方式,连续比最大数据类型小的类型一次补齐,尾部补齐。

3.15 缓冲区溢出攻击

一些函数不检查数组的长度,写入过长的数组可能会超过分配的空间,然后会覆盖栈中更向底的数据。若是写入数组中某一串覆盖了返回值,而这一串代表了你的攻击代码的起始地址,当前程序返回时不会返回至原本的位置,而是返回到了你的攻击代码,继而运行攻击代码。

3.16 对抗缓冲区溢出攻击

栈随机化

在程序的起始处使用一定长度的空间,这个长度每次运行时都不同,注入代码很难找到想要的返回值地址。
可以使用空操作雪橇(nop sled)暴力破解,方法是枚举所有可能的长度。

栈破坏检测

在栈中任意局部缓冲和栈状态之间插入canary值,若canary被改变则认为栈被破坏。

限制可执行代码区域

内存保护中的“NX”位(No-Execute),栈可被标记为可读和可写。

你可能感兴趣的:(第3章 程序的机器级表示)