标签: powerpc指令集e600 |
分类: PowerPC平台 |
第一部分 PowerPC 精简指令集计算机(RISC)简介
PowerPC 体系结构是一种精减指令集计算机(Reduced Instruction Set Computer,RISC)体系结构,定义了 200 多条指令。PowerPC 之所以是 RISC,原因在于大部分指令在一个单一的周期内执行,而且通常只执行一个单一的操作(比如将内存加载到寄存器,或者将寄存器数据存储到内存)。
PowerPC 体系结构分为三个级别(或者说是“book”)。通过对体系结构以这种方式进行划分,为实现可以选择价格/性能比平衡的复杂性级别留出了空间,同时还保持了实现间的代码兼容性。
Book I. 用户指令集体系结构(Power ISA User Instruction Set Architecture)
定义了通用于所有 PowerPC 实现的用户指令和寄存器的基本集合。这些是非特权指令,为大多数程序所用。
Book II. 虚拟环境体系结构(Power ISA Virtual Environment Architecture)
定义了常规应用软件要求之外的附加的用户级功能,比如高速缓存管理、原子操作和用户级计时器支持。虽然这些操作也是非特权的,但是程序通常还是通过操作系统调用来访问这些函数。
Book III. 操作环境体系结构(Power ISA Operating Environment Architecture)
定义了操作系统级需要和使用的操作。其中包括用于内存管理、异常向量处理、特权寄存器访问、特权计时器访问的函数。Book III 中详细说明了对各种系统服务和功能的直接硬件支持。
由于我目前手上的开发板是基于e600内核,所以我在学习PowerPC指令集的过程中,顺便总结了e600内核常用的指令集,如果大家发现我总结的指令集有错误或者不准确的地方,欢迎留言指出来,O(∩_∩)O~
第二部分 e600指令集
飞思卡尔的e600内核实现了booke内核构架中64位指令集的中的32位指令(即在e600的32位寄存器中,第0位相当于booke中的64寄存器的第32位,第31位相当于booke中64寄存器的第63位),E600内核采用大端编码方式,指令的第0位是MSB(Most Significant Bit)位,第31位是LSB(Least Significant Bit)。
e600内核指令的高6位字段(第0-5位)被称为OPCD字段(Primary Opcode Field),根据OPCD字段的不同,PowerPC的指令集分为以下几类。
2.1 I-form指令格式
该类是无条件转移指令。
0-5 6-29 30 31
OPCD LI AA LK
AA=0,表示LI中存放的是相对地址LI*4,基址是当前指令的地址
AA=1,表示LI中存放的是绝对地址LI*4
LK=1,表示转移到目的地址的同时,将当前指令的下一条指令存入LR寄存器
LK=0,仅仅表示跳转到目的地址,而不用修改LR寄存器
例如:
b LI//AA=0, LK=0
解释:跳转到目的地址:LI*4+当前指令的地址
ba LI//AA=1,LK=0
解释:跳转到:LI*4
bl LI//AA=0,LK=1
解释:跳转到目的地址:LI*4+PC,同时把PC+4放入LR寄存器
备注:PC放的是当前指令的地址。
bla LI//AA=1,LK=1
解释:跳转到目的地址:LI*4,同时把PC+4放入LR寄存器
给出一段汇编指令示例:
0x1000051c
……
0x10000568:4b ff ff ff b5 对应汇编:bl 10000051c
0x1000056c:38 00 00 00 对应汇编:li r0,0
解释:
bl 10000051c
4b ff ff ff b5,其中的LK=0xed。
将LK*4符号扩展到32为对应的真值为-0x4c,而当前指令的地址为0x1000056c,所以跳转的目标地址就是0x1000056c+(-0x4c)=0x1000051c即为print函数的入口地址。
因此如果想获得下一条指令的有效地址可以使用下面的汇编代码:
bl invstr //将当前指令的下一条指令PC+4放入LR寄存器
invstr:mflr r6 //将LR寄存器的内容放入r6寄存器中
2.2 B-Form指令格式
该类为有条件转移指令
0-5 6-10 11-15 16-29 30 31
OPCD BO BI BD AA LK
包含下面4条指令:
bc BO, BI, BD //AA=0 LK=0
bca BO, BI, BD //AA=1 LK=0
bcl BO, BI, BD //AA=0 LK=1
bcla BO, BI, BD //AA=1 LK=1
解释:AA和LK的含义同上,下面详细介绍一下BO,BI,BD字段的含义。
BO字段:从6位至10位,共5 bit:
BO[0]为1:表示根据CTR寄存器是否为0进行转移;
为0:根据CR寄存器的相应字段和BI字段中的条件进行转移。
BO[1]为1:指定的条件为真时转移
为0:指定的条件为假时转移
BO[2]为1:执行bc指令时,CTR寄存器保持不变
为0:执行bc指令时,CTR寄存器自减
BO[3]为1:CTR寄存器为0时进行条件转移
为0:CTR寄存器非0时进行条件转移
BO[4]为1:bc指令将被判断为执行转移功能,处理器将预取转移指令目标地址后面的几条指令,并将预先取得的指令放入缓冲对列。
为0:bc指令不被判断为执行转移功能,不预取转移指令目标地址后面的几条指令
BI字段(11-15bit)的功能:
BI[0-2]的值n(n在0到7之间):指出CR寄存器中的CRn字段的状态作为指令跳转条件
BI[3-4]的值表述指令跳转条件,具体如下:
00 使用LT(小于)状态作为指令的转移条件
01 使用GT(大于)状态作为指令的转移条件
10 使用EQ(等于)状态作为指令的转移条件
11 使用SO(溢出)状态作为指令的转移条件
BD字段(16-29bit):指出转移的目标地址
现在我们给我几个例子:
bc 16,0,BD
解释:
BO[0]为1:表示根据CTR寄存器是否为0进行转移,和CR寄存器无关了;
BO[2]为0:执行bc指令时,CTR寄存器自减;
BO[3]为0:CTR寄存器为非0时进行条件转移;
BO[4] 为0:bc指令不被判断为执行转移功能,不预取转移指令目标地址后面的几条指令
综上,该指令的意思是将CTR寄存器自减,如果CTR不为0则跳转到BD指示的地址处。
可以使用指令助记符bdnz BD表示,CTR寄存器自减,如果CTR不为0则跳转到BD指示的地址处
bc 4,2,BD
BO[0]为0根据CR寄存器的相应字段和BI字段在中的条件进行转移。
BO[1]为0:指定的条件为假时转移
BO[2]为1:执行bc指令时,CTR寄存器保持不变
BI[0-2]的值为0:指出CR寄存器中的CR0中的状态作为指令跳转条件
BI[3-4]的值为10:使用EQ(等于)状态作为指令的转移条件
综上,该指令的意思是说只有比较结果不等于0,就转移
可以使用指令助记符:bne BD 来代表bc 4,2,BD。
备注:目标地址是相对地址,还是绝对地址要看AA标识是否置位。
常用的指令助记符lt(小于), le(小于等于),eq(等于),so(溢出),+(转移被静态预测为真,选择转移),-(转移被静态预测为假,不选择转移)等等。
在Powerpc指令集中常用的条件转移指令只有bc,bcl,以前的转移指令beq,ndnz,ble等等都是助记符。
2.3 SC-Form指令
该指令主要用来实现系统调用,只有“sc”这一条汇编,比较简单
2.4 D-Form指令
该指令一定包含一个立即数。
指令格式如下:
0-5 5-10 11-15 16-31
OPCD RS/RT RA D
RS/RT:存放该条指令运算结果的寄存器的索引
RA:存放源数据的寄存器索引
D:存放该指令需要的另一个立即数数据源
该指令格式包含两类:
1. 对存储器或者寄存器进行读写的指令
2. 立即数的算术运算和逻辑运算指令
典型指令如下:
2.4.1 Load Word and Zero指令
lwz RT, D(RA)
语义:
if RA=0 then b=0
else b=(RA)
EA=b+extsign(D)
RT=32个连续的0 连上 MEM(EA,4)
解释:
extsign(D):表示D符合扩展到32bit(因为D是16 bit,参与运算的是32bit)
MEM(EA,4):表示从EA地址处取得32位数据
该指令的目的就是将RA+D指定的地址中读取一个32位的数据,然后将此数据传递给RT寄存器。
此外还有对16 bit 和8 bit进行操作的lhz,lbz指令
2.4.2 STore Word指令
stw RS, D(RA)
和lwz指令想反,将寄存器RS中的32位数存到RA+D指向的内存单元处
备注:立即数D参与的寻找计算,都需要将D符号扩展至32位。
2.4.3 Load Word and Zero with Update指令
lwzu RT,D(RA)
解释:将D+RA指向的内存单元的值放入RT索引的寄存器,然后将RA寄存器的值更新为RA+D
2.4.5 Store Word with Update指令
stwu RS,D(RA)
同lwzu相反。
备注:这两条指令可以实现数据栈的压栈和出栈操作,另外还有对8位和16位数据进行操作的指令lbzu,stbu和sthu,lhzu指令,格式通上。
2.4.6 介绍两条批处理指令
Load Multiple Word指令:
lmw RT,D(RA)
语义:
if RA = 0 then b <- 0
else b <-(RA)
EA <-b + EXTS(D)
r <-RT
do while r ≤ 31
GPR(r) <- 32个连续0 || MEM(EA, 4) //||表示字符串的连接,例如a||b就是ab
r <- r + 1
EA <- EA + 4
endwhile
解释:将RA+D地址处的数据依次传递到RT至31中,传递的32位数据量32-RT个
Store Multiple Word指令
stmw RS,D(RA)
解释:将RS至R31的(32-RS)个数据依次传递到RA+D指向的内容地址处。
备注:使用这两个寄存器时要注意存储器的边界检查和所使用到的通用寄存器是否需要备份。
2.4.7 Compare Immediate指令
cmpi BF,L,RA,SI
语义:
n <- BF表示的数值
if L = 0 then a <- EXTS((RA)32:63)
else a <- (RA)
if a < EXTS(SI) then c <-0b100 //小于时设置CRn(0)为1
else if a > EXTS(SI) then c <- 0b010 //大于时设置CRn(1)为1
else c <- 0b001 //等于时设置CRn(2)为1
CR寄存器中的: 4×BF+32:4×BF+35 <- c || XER寄存器中SO位 // ||表示字符连接
解释:
将寄存器RA与立即数SI进行比较,然后将比较指令产生的状态放入CR寄存器的不同字段中,CR寄存器有8个CRn字段(n从0至7),可以由三bit位的BF段指定。
L:表示是进行32位还是64的比较。对于e600而言,只有L=0的比较。
备注:
解释一下CR寄存器,e600中32位CR寄存器用来存放指令执行之后的状态,该寄存器分为8个字段。分别为CR0,CR1,…,CR7。每个字段都由4bit组成。
各个字段CRn(n从0至7)都可以表示响应指令执行的结果:
比如整数的加减及逻辑运算,使用CR0来存放状态,CR0的四个bit位的含义如下:
CR0(0):用来表示LT(小于),当整型指令运算结果为负时置1;
CR0(1):用来表示GT(大于),当整型指令运算结果为正时置1;
CR0(2):用来表示EQ(等于),当整型指令运算结果为0时置1;
CR0(3):用来表示SO(溢出),当整型指令运算结果溢出时置1;
同理浮点数的运算使用CR1来保存运算状态,保存过程同上,e600的比较指令可以使用CR寄存器的全部的CRn(n从0至7)来保存运算的结果。一般在比较指令cmp之后都会有一个条件跳转指令,比如bc指令。其中cmp指令可以指定由CR寄存器的CRn段来保存结构,比如上面的cmpi指令就用BF来指定CRn字段,一般而言bc指令就会更新cmp中相同的CRn段来决定条状。
2.4.8 Compare Logical Immediate指令
cmpli BF,L,RA,UI和cmpli的指令的用法相同,所不同的是cmpli 是无符号数直接的比较,而cmpi是有无符号之间的比较。
2.4.9 Trap Word Immediate指令
twi TO,RA,SI
解释:该指令称之为陷阱(trap)指令,该指令对一些Trap条件进行测试,如果条件成立,则处理器进入系统的trap程序,然后对trap事件进行处理。
TO字段(有5位),第0至4位此次表示:
LTS:(有符号式比较:小于)
GTS:(有符号数比较:大于)
EQ:(有符号数比较:等于)
LT:(无符号数比较:小于)
GT:(无符号数比较大于)
比如:如果用户将TO设置为1,并且RA中的有符号数小于立即数SI(符合扩展之后),则处理器进程Trap处理程序。
备注:如果把立即数SI换成寄存器索引RB,则tw TO,RA,RB就是X-Form形式。
tw 31, r0, r0就是一个无条件trap指令,可用助记符“trap”表示。
另外,D-Form指令包含了很多用于算术和逻辑运算的指令,这些指令都是需要一个立即数的,由于这些立即数都是在指令中的,这样在e600内核中,这些立即数的长度只能限制在16位。为了能顺利的处理32位的立即数,e600内核中的D-Form指令可以在立即数的计算时把立即数左移16位,这样我们就可以用两条指令就可以把一个立即数放到一个通用计算器中。
例如:
读取一个word(0x12345678)到目的寄存器:
lis RA,0x12345678@h // 高16位(0x1234)偏移16位后变成0x12340000放进RA
ori RB, RA, 0x12345678@l // RA与低16位(0x5678)相或后构成完整数据放进RA
备注:PowerPC指令中,i后缀表示立即数,s后缀表示左移16位。例如addi、addis、ori、oris等。这段代码也可以用来读取某个变量的值,只需要把立即数替换成变量名。
从某个地址(0x56789abc)读取数据
lis RA,0x56789abc@ha //调整后的高16位(0x5679)偏移16位后变成(0x56790000)放进RA
lwz RB, 0x56789abc@l (RA) //RA加上低16位(0xffff9abc) 构成完整数据地址,然后将其内容放进RB
注意:
用于算术运算的操作数(包括addi的操作数)时,@l获取的是符号扩展的低16位数据(0xffff9abc) ,因此高16位必须进行根据bit15进行调整,而不能简单的使用@h来获取。
2.5 X-Form指令
E600中X-Form指令的数量最多,D-form指令的每一个指令在X-Form中都有对应的指令。除此之外,X-Form指令还有一些专用的指令。
X-Form的指令格式如下:
0-5 6-10 11-15 16-20 21-30 31
OPCD TS/RT RA RB XO Rc
X-Form的指令格式与
D-Form指令格式:
0-5 5-10 11-15 16-31
OPCD RS/RT RA D
相比,只是将D-Form指令中的D字段差分为RB,XO和Rc字段。
X-Form中的RB和RS字段存放源操作数寄存器的索引
RT字段存放目的操作数的索引;
RA字段既可以存放源操作数寄存器的索引,而言可以存放目的操作数的索引;
Rc字段置1表示当前指令的运算结果将改变CR寄存器中的相应CRn段,具有“.”的后缀的指令,其Rc位置1。
典型的X-Form指令如下:
存储器访问类指令:lbzx, lhzx, lhax, lwzx,stbx, sthx, stwx, lbzux,lhzux,lwzux,stbux,sthux,stwux指令等,这些指令和D-Form中的lbz,lhz,lha,lwz,stb,sth,stw,lbzu,lhzu,lwzu,stub,sthu,stwu一一对应,所不同的是D-Form使用的立即数,换成了X-Form使用的寄存器索引。
字节序列交换指令:lhbrx,lwbrx,sthbrx,stwbrx指令,这些指令的作用是调整字节序列。
比较类指令和trap指令:cmp,cmpl,tw指令
算术逻辑运算指令:and,or,xor,nand,nor,eqv指令
Count Leading Zeros Word 指令:cntlzw RA,RS
备注:该指令找出RS寄存器中从左边开始第一个不为0的位,然后将该位所在的位序(从0开始)存入RA中;
2.6 XL-Form指令
XL-Form指令支持条件转移指令,与B-Form类条件转移指令:
B-Form指令格式
有条件转移指令
0-5 6-10 11-15 16-29 30 31
OPCD BO BI BD AA LK
不同,该类指令使用LR寄存器或者CTR寄存器,而不适用16位的立即数作为跳转目标。
XL-Form指令格式:
0-5 6-10 11-15 16-18 19-20 21-30 31
OPCD BO BI ~ BH 16或者528 LK
所支持的指令格式:
bclr BO,BI,BH //LK=0,21-30字段值为16
bclrl BO,BI,BH //LK=1,21-30字段值为16
bcctr BO, BI,BH //LK=0,21-30字段值为528
bcctrl BO, BI, BH //LK=1,21-30字段值为528
X-Form类指令的BO,BI字段值和B-Form类中的BO,BI字段含义相同,LK置1表示跳转指令执行后,LR寄存器指向下一条指令的地址(当前指令地址+4),BH字段用于静态分支预测。
当条件满足时,bclr和bclrl指令使用LR寄存器进行长条状,而bcctr,bcctrl指令使用CTR寄存器进行长跳转。
于B-Form指令类似,X-Form指令也使用了很多助记符,比如:
blr 相当于 bclr 20, 0
备注:XL-Form指令和I-Form指令协作完成指令的跳转
例子如下:
XL-Form指令还可以支持CR寄存器不同段CRn的与,或,异或,同或操作,指令格式如下:
0-5 6-10 11-15 16-20 21-30 31
OPCD BT BA BB 257/449/193/225/0 ~
这里举出以下几种指令:
crand BT,BA,BB //第21-30字段为257,BT<-BA&BB
cror BT,BA,BB //第21-30字段为449,BT<-BA|BB
crxor BT,BA,BB //第21-30字段为193,BT<-BA同或BB
crnand BT,BA,BB //第21-30字段为255,BT<-!(BA&BB)
mcrf BF,BFA //第21-30字段为0,将CR的BFA字段拷贝到BF字段
2.7 XFX-Form,XFL-Form,XS-Fomr,XO-Form类指令
XFX-Form指令格式:
0-5 6-10 11-20 21-30 31
OPCD RT spr/tbr XO ~
包括mrspr, mfspr, mrcrf, mfcr, mtocrf等等
XO-Form指令用来支持带进位的算术运算指令和乘除法指令格式:
0-5 6-10 11-15 16-20 21 22-30 31
OPCD RT RA RB OE XO Rc
有下面几类指令:
1:addo.,subfo.,addco.,subfo. 指令,此类指令将会影响CA,SO,OV位和CR0字段;
2:addeo.,subfeo.,addzeo.,subfzeo. 指令,此类指令除会影响CA,SO,OV位和CR0字段外,还可以将CA位参与运算;
3:mullw,divw指令,此类指令用作乘除运算;
4:A-Form指令用作浮点运算,典型指令有fadd,fsub,fmul,fdiv。
2.8 M-Form指令
M-Form指令主要作用是对选定的字段做循环左移,并做一些相应掩码操作,该类指令时PowerPC指令的精华,包含了一组非常强大的指令。
这里主要介绍三条指令:
2.8.1 Rotate Left Word Immediate then AND with Mask指令
rlwinm RA,RS,SH,MB,ME (Rc=0)
rlwinm. RA,RS,SH,MB,ME (Rc=1)
指令字段:
0-5 6-10 11-15 16-20 21-25 26-30 31
21 RS RA SH MB ME Rc
解释:寄存器RS的内容循环左移立即数SH位,然后跟立即数MB和ME形成的MASK相与后放进RA
备注:
MASK形成的规则是,如果MB小于等于ME,则MB到ME之间的位全部置1,包括这两位,形成MASK;否则,MB到ME之间的位清0,其他位包括这两位置1,形成MASK。
例子1:
从立即数0x12345678(RS)中抽取bit 20-23,并左移16位,从而得到0x06000000.
rlwinm rA, rS, 16, 4, 7
具体过程:0x12345678循环左移16位得到0x56781234,然后与MASK:0x0f00 0000 (MASK[4,7])相与。
该指令可以用来抽取C语言代码或者寄存器中的位域。
例子2:
清除立即数0x12345678(RS)的bit28-31,并左移24位,从而得到0x0012 3456
rlwinm rA, rS, 24, 8, 31
具体过程如下:0x12345678循环左移24位得到0x78123456,然后与MASK:0x00ff ffff (MASK[8,31])相与。
例子3:
清除立即数0x12345678(RS)的bit 6,从而得到0x10345678
rlwinm rA, rS, 0, 7, 5
具体过程:0x12345678循环左移0位,仍是0x56781234,然后与MASK0xfdff ffff (MASK[7,5])相与。
功能:该指令可以用来清除C语言代码或者寄存器中的位域。
2.8.2 Rotate Left Word then AND with Mask指令
rlwnm RA,RS,RB,MB,ME (Rc=0)
rlwnm. RA,RS,RB,MB,ME (Rc=1)
指令:
0-5 6-10 11-15 16-20 21-25 26-30 31
23 RS RA RB MB ME Rc
解释:
类似于上一条指令,只是把左移的位数放到了寄存器RB中
2.8.3 Rotate Left Word Immediate then Mask Insert指令
rlwimi RA,RS,SH,MB,ME (Rc=0)
rlwimi. RA,RS,SH,MB,ME (Rc=1)
格式:
0-5 6-10 11-15 16-20 21-25 26-30 31
20 RS RA SH MB ME Rc
解释:寄存器RS的内容循环左移立即数SH位,然后跟立即数MB和ME形成的MASK相与,再把RA的内容跟立即数MB和ME形成的MASK的补码相与,即清掉RA中MASK对应的位,最后把处理后的RS和RA的内容相或,放入RA中
备注:
MASK形成的规则是,如果MB小于等于ME,则MB到ME之间的位全部置1,包括这两位,形成MASK;否则,MB到ME之间的位清0,其他位包括这两位置1,形成MASK。
例子:
抽取0x87654321(RS)的bit 24-31,用以对立即数0x12345678(RA)的bit 8-15进行先清除后置位的操作,从而得到0x12215678.
rlwimi rA, rS, 16, 8, 15
具体过程:0x87654321(RS)循环左移16位得到0x43218765,然后与MASK0x00ff 0000 (MASK[8,15])相与得到0x0021 0000;再把0x12345678(RA)与MASK0x00ff 0000 (MASK[8,15])的补码0xff00 ffff相与,得到0x1200 5678; 最后0x0021 0000跟0x1200 5678相与,得到0x12215678。
功能:该指令可以用来清除C语言代码或者寄存器中的某个位域,然后对该位域进行赋值的操作。
第三部分:总结
PowerPC处理器采用RISC定长指令集,所以它的指令集不多,但是这些基本的指令集可以衍生出很多复杂的指令集,而令我们这些初学PowerPC指令集的人望而生畏,但是即便如此,我们仍然应该耐着性子把这些指令认真的读一遍,这样我们才能了解PowerPC指令集。