PowerPC 体系结构分为三个级别(或者说是“book”)。通过对体系结构以这种方式进行划分,为实现可以选择价格/性能比平衡的复杂性级别留出了空间,同时还保持了实现间的代码兼容性。
Book I. 用户指令集体系结构
定义了通用于所有 PowerPC 实现的用户指令和寄存器的基本集合。这些是非特权指令,为大多数程序所用。
Book II. 虚拟环境体系结构
定义了常规应用软件要求之外的附加的用户级功能,比如高速缓存管理、原子操作和用户级计时器支持。虽然这些操作也是非特权的,但是程序通常还是通过操作系统调用来访问这些函数。
Book III. 操作环境体系结构
定义了操作系统级需要和使用的操作。其中包括用于内存管理、异常向量处理、特权寄存器访问、特权计时器访问的函数。Book III 中详细说明了对各种系统服务和功能的直接硬件支持。
PowerPC 体系结构本身支持字节(8 位)、字(16 位)、双字(32 位) 和四字(64 位) 数据类型。PowerPC 实现还可以处理最长 128 字节的多字节字符串操作。32 位 PowerPC 实现支持 4-gigabyte 的有效地址空间,而 64 位 PowerPC 实现支持 16-exabyte 的有效地址空间。所有存储都可以字节寻址。
PowerPC 的应用级寄存器分为三类:通用寄存器(general-purpose register,GPR)、浮点寄存器(floating-point register [FPR] 和浮点状态和控制寄存器 [Floating-Point Status and Control Register,FPSCR])和专用寄存器(special-purpose register,SPR)。让我们来分别看一下这三类寄存器。
用户指令集体系结构(Book I)规定,所有实现都有 32 个 GPR(从GPR0 到 GPR31)。GPR 是所有整数操作的源和目的,也是所有加载/存储操作的地址操作数的源。GPR 还提供对 SPR 的访问。所有 GRP 都是可用的,只有一种情况例外:在某些指令中,GPR0 只是代表数值 0,而不会去查找 GPR0 的内容。
Book I 规定,所有实现都有 32 个 FPR(从 FPR0 到 FPR31)。FPR 是所有浮点操作的源和目的操作数,可以存放 32 位和 64 位的有符号和无符号整数,以及单精度和双精度浮点数。FPR 还提供对 FPSCR 的访问。
注意,嵌入式微处理器实现时经常不提供对浮点指令集的直接硬件支持,或者只是提供一个附加浮点硬件的接口。很多嵌入式应用程序很少或者根本不需要浮点算法,而当需要的时候,对 PowerPC 浮点指令执行进行软件仿真就足够了。在嵌入式微处理器中,硬件中省去浮点(支持)而为实现带来的芯片面积和功率的减少是至关重要的。
浮点状态和控制寄存器(FPSCR)捕获浮点操作的状态和异常结果,FPSCR 还具有控制位,以支持特定的异常类型和对四种舍入模式之一的选择。对 FPSCR 的访问要通过 FPR。
SPR 给出处理器核心内部资源的状态并对其进行控制。不需要系统服务的支持就可以由应用程序读写的 SPR 包括计数寄存器(Count Register)、链接寄存器(Link Register)和整型异常寄存器(Integer Exception Register)。需要系统服务的支持才可以由应用程序读写的 SPR 包括时基(Time Base)和其他各种可能支持的计时器。
bclr
转移到 LR 中的值。lswx
和 stswx
)中传输的字节数。bcctr
转移到 CTR 中的值。stwcx
或者 stdcx
) 的结果。还有一组指令可以操纵特定的 CR 位、特定的 CR 字段或者整个 CR,通常为了测试而将几个条件组合到同一个位中。
表 1 列出了不同的指令类别以及每类的指令类型。
表 1. 指令类别
指令类别 | 基本指令 |
---|---|
Branch | branch, branch conditional, branch to LR, branch to CTR |
Condition register | crand, crnor, creqv, crxor, crandc, crorc, crnand, cror, CR move |
Storage access | load GPR/FPR, store GPR/FPR |
Integer arithmetic | add, subtract, negate, multiply, divide |
Integer comparison | compare algebraic, compare algebraic immediate, compare logical,compare logical immediate |
Integer logical | and, andc, nand, or, orc, nor, xor, eqv, sign extension, countleading zeros |
Integer rotate/shift | rotate, rotate and mask, shift left, shift right |
Floating-point arithmetic | add, subtract, negate, multiply, divide, square root, multiply-add,multiply-subtract, negative multiply-add, negative multiply-subtract |
Floating-point comparison | compare ordered, compare unordered |
Floating-point conversion | round to single, convert from/to integer word/doubleword |
FPSCR management | move to/from FPSCR, set/clear FPSCR bit, copy FPSCR field to CR |
Cache control | touch, zero, flush, store |
Processor management | system call, move to/from special purpose registers, mtcrf, mfcr |
所有指令的编码长度都是 32 位。PowerPC 的位编号方式与大部分其他定义相反:第 0 位是最重要的位,第 31 位是最不重要的位。指令首先由一个字段中较高的 6 位进行解码,这 6 位称为 主要操作码(primary opcode)。其余 26 位包含的字段分别是操作数说明、立即(immediate)操作数以及扩展的操作码(opcode),而且这些还可能是保留的位或字段。表 2 列出了 PowerPC 定义的基本指令格式。
表 2. PowerPC 指令格式
格式 | 0 | 6 | 11 | 16 | 21 | 26 | 30 | 31 |
---|---|---|---|---|---|---|---|---|
D-form | opcd | tgt/src | src/tgt | immediate | ||||
X-form | opcd | tgt/src | src/tgt | src | extended opcd | |||
A-form | opcd | tgt/src | src/tgt | src | src | extended opcd | Rc | |
BD-form | opcd | BO | BI | BD | AA | LK | ||
I-form | opcd | LI | AA | LK |
如前所述,这些指令格式各有其变种。不过,这些格式是对大部分 PowerPC 指令集编码结构的最好描述。
PowerPC 为控制流程提供了一组指令,包括:
所有的转移指令都具备保存后继顺序指令地址的能力,包括到链接寄存器的转移。条件寄存器 32 位中的任意一位都可以指定为条件转移的条件,并可以指定 CR 位是否必须为 0 或 1 时转移条件才成立。
PowerPC 提供了一组用于对 CR 的特定位执行布尔操作和对 CR 字段进行拷贝的指令。它允许组合多个转移条件,这样可以减少代价高昂的条件转移的数量。表 3 列出了 PowerPC CR 逻辑指令。
表 3. PowerPC CR 逻辑指令
助记符 | 指令名 |
---|---|
crand | CR logical and |
crandc | CR logical and with complement |
creqv | CR logical equivalent |
crnand | CR logical not and |
crnor | CR logical not or |
cror | CR logical or |
crorc | CR logical or with complement |
crxor | CR logical xor |
很多指令用于执行运算操作,包括 add、substract、negate、compare、multiply 和 divide。很多格式用于立即值、溢出检测以及进位和借位。各实现中 multiply 和 divide 的执行是不同的,因为这些通常是多周期指令。表 4 列出了 PowerPC 整数运算指令。
表 4. PowerPC 整数运算指令
助记符 | 指令名 |
---|---|
add[o][.] | add [& record OV] [& record CR0] |
addc[o][.] | add carrying [& record OV] [& record CR0] |
adde[o][.] | add extended [& record OV] [& record CR0] |
addi | add immediate |
addis | add immediate shifted |
addic[.] | add immediate carrying [& record CR0] |
addme[o][.] | add to minus one [& record OV] [& record CR0] |
addze[o][.] | add to zero [& record OV] [& record CR0] |
divd[o][.] | divide doubleword [& record OV] [& record CR0] |
divdu[o][.] | divide doubleword unsigned [& record OV] [& record CR0] |
divw[o][.] | divide word [& record OV] [& record CR0] |
divwu[o][.] | divide word unsigned [& record OV] [& record CR0] |
mulhd[.] | multiply high doubleword [& record CR0] |
mulhdu[.] | multiply high doubleword unsigned [& record CR0] |
mulhw[.] | multiply high word [& record CR0] |
mulhwu[.] | multiply high word unsigned [& record CR0] |
mulld[o][.] | multiply low doubleword [& record OV] [& record CR0] |
mulli | multiply low immediate |
mullw[o][.] | multiply low word [& record OV] [& record CR0] |
neg[o][.] | negate [& record OV] [& record CR0] |
subf[o][.] | subtract from [& record OV] [& record CR0] |
subfc[o][.] | subtract from carrying [& record OV] [& record CR0] |
subfe[o][.] | subtract from extended [& record OV] [& record CR0] |
subfi | subtract from immediate |
subfis | subtract from immediate shifted |
subfic[.] | subtract from immediate carrying [& record CR0] |
subfme[o][.] | subtract from to minus one [& record OV] [& record CR0] |
subfze[o][.] | subtract from to zero [& record OV] [& record CR0] |
PowerPC 提供了一组完整的逻辑操作(指令),还支持对符号的扩展以及对 GPR 中前置零的统计。表 5 列出了 PowerPC 逻辑指令。
表 5. PowerPC 逻辑指令
助记符 | 指令名 |
---|---|
and[.] | and [& record CR0] |
andc[.] | and with complement [& record CR0] |
andi. | and immediate & record CR0 |
andis. | and immediate shifted & record CR0 |
eqv[.] | equivalent [& record CR0] |
nand[.] | not and [& record CR0] |
nor[.] | not or [& record CR0] |
or[.] | or [& record CR0] |
orc[.] | or with complement [& record CR0] |
oris | or immediate shifted |
ori | or immediate |
xor[.] | xor [& record CR0] |
xoris | xor immediate shifted |
xori | xor immediate |
cntlzd[.] | count leading zeros doubleword [& record CR0] |
cntlzw[.] | count leading zeros word [& record CR0] |
extsb[.] | extend sign byte [& record CR0] |
extsh[.] | extend sign halfword [& record CR0] |
extsw[.] | extend sign word [& record CR0] |
PowerPC 提供了一组健壮而强大的循环和移位操作(指令),如表 6 所列。
表 6. PowerPC 循环和移位指令
助记符 | 指令名 |
---|---|
rldc[.] | rotate left doubleword then clear [& record CR0] |
rldcl[.] | rotate left doubleword then clear left [& record CR0] |
rldcr[.] | rotate left doubleword then clear right [& record CR0] |
rldicl[.] | rotate left doubleword immediate then clear left [& record CR0] |
rldicr[.] | rotate left doubleword immediate then clear right [& record CR0] |
rldimi[.] | rotate left doubleword immediate then mask insert [& record CR0] |
rlwimi[.] | rotate left word immediate then mask insert [& record CR0] |
rlwinm[.] | rotate left word immediate then and with mask [& record CR0] |
rlwnm[.] | rotate left word then and with mask [& record CR0] |
sld[.] | shift left doubleword [& record CR0] |
slw[.] | shift left word [& record CR0] |
srad[.] | shift right doubleword [& record CR0] |
sradi[.] | shift right doubleword immediate [& record CR0] |
sraw[.] | shift right word [& record CR0] |
srawi[.] | shift right word immediate [& record CR0] |
srd[.] | shift right doubleword [& record CR0] |
srw[.] | shift right word [& record CR0] |
PowerPC 提供了一组健壮的浮点运算、比较和转换操作(指令)。与软件支持一道,PowerPC 浮点运算完全符合 ANSI/IEEE 标准 754-1985 规范。在所有运算和比较操作中都支持单精度和双精度浮点格式。
虽然浮点数以双精度格式存储于 FPR 中,但是,有一组单精度运算指令,可以执行运算操作并将最终结果舍入为单精度,同时检测进行单精度操作时可能会发生的异常(比如指数溢出、下溢和失去精度)。
可以启用或禁用具体种类的浮点异常来支持设陷(trapping) 环境。表 7 列出了基本的和可选的 PowerPC 浮点指令集。
表 7. PowerPC 浮点指令
助记符 | 指令名 |
---|---|
fmr[.] | FP move [& record CR1] |
fneg[.] | FP negate [& record CR1] |
fabs[.] | FP absolute value [& record CR1] |
fnabs[.] | FP negative absolute value [& record CR1] |
fadd[s][.] | FP add [single] [& record CR1] |
fsub[s][.] | FP subtract [single] [& record CR1] |
fmul[s][.] | FP multiply [single] [& record CR1] |
fdiv[s][.] | FP divide [single] [& record CR1] |
fsqrt[s][.] | FP square root [single] [& record CR1] |
fmadd[s][.] | FP multiply-add [single] [& record CR1] |
fmsub[s][.] | FP multiply-subtract [single] [& record CR1] |
fnmadd[s][.] | FP negative multiply-add [single] [& record CR1] |
fnmsub[s][.] | FP negative multiply-subtract [single] [& record CR1] |
fcmpo | FP compare ordered |
fcmpu | FP compare unordered |
fsel[.] | FP select [& record CR1] |
frsp[.] | FP round to single [& record CR1] |
fcfid[.] | FP convert from integer doubleword [& record CR1] |
fctid[z][.] | FP convert to integer doubleword [& round to zero] [& record CR1] |
fctiw[z][.] | FP convert to integer word [& round to zero] [& record CR1] |
fres[.] | FP reciprocal estimate single [& record CR1] |
frsqrte[.] | FP reciprocal square root estimate [& record CR1] |
表 8 列出了基本的 PowerPC FPSCR 处理指令集。
表 8. PowerPC FPSCR 处理指令集
助记符 | 指令名 |
---|---|
mcrfs | move to CR from FPSCR |
mffs[.] | move from FPSCR |
mtfsb0[.] | move to FPSCR bit 0 |
mtfsb1[.] | move to FPSCR bit 1 |
mtfsf[.] | move to FPSCR field |
mtfsfi[.] | move to FPSCR field immediate |
所有加载和存储指令的执行都使用 GPR 或者 GPR 和指令中的立即字段作为存储器访问的地址说明符。用指令生成的数据有效地址来更新基址寄存器(也就是 RA)是大部分加载和存储指令的一个可选项。
有用于以下方面的指令:
特殊的存储器访问指令包括:
lmw
和 stmw
,可以操作最多 31 个 32 位字。lwarx
(加载字并预留变址)ldarx
(加载双字并预留变址)stwcx
(存储字条件变址)stdcx
(存储双字条件变址)lwarx
/ ldarx
执行加载并设置处理器内部的预留位,编程模型不必明确了解这些行为。如果设置了预留位,相应的存储指令 stwcx.
/ stdcx.
执行条件存储,并清除预留位。