实验五:Tomasulo算法

一、实验目的

  1. 加深对指令级并行性及其开发的理解。
  2. 加深对Tomasulo算法的理解。
  3. 掌握Tomasulo算法在指令流出、执行、写结果各阶段对浮点操作指令以及load和store指令进行什么处理。
  4. 掌握采用了Tomasulo算法的浮点处理部件的结构。
  5. 掌握保留站的结构。
  6. 给定被执行代码片段,对于具体某个时钟周期,能够写出保留站、指令状态表以及浮点寄存器状态表内容的变化情况。

二、实验内容及步骤
首先要掌握Tomasulo模拟器的使用方法。(见本章第二节)

  1. 假设浮点功能部件的延迟时间为加减法2个时钟周期,乘法10个时钟周期,除法40个时钟周期,Load部件2个时钟周期。
    (1)对于下面的代码段,给出当指令MUL.D即将确认时,保留站、load缓冲器以及寄存器状态表中的内容。
    L.DF6,24(R2)
    L.DF2,12(R3)
    MUL.DF0,F2,F4
    SUB.DF8,F6,F2
    DIV.DF10,F0,F6
    ADD.DF6,F8,F2

(2)按步进方式执行上述代码,利用模拟器的“小三角按钮”的对比显示功能,观察每一个时钟周期前后各信息表中内容的变化情况。
周期1:取出第一条指令L.D F6, 34(R2),地址偏移量34写入LOAD部件中的LOAD1并且将LOAD1名存入寄存器字段F6中。

周期2:取出第二条指令L.D F2, 45(R3),地址偏移量45写入LOAD部件中的LOAD2并且将LOAD2名存入寄器字段F2中,同时第一条指令开始执行,LOAD1上写入绝对地址。
周期3:取出第三条指令MUL.D F0, F2,F4,第一条指令完成取值并且准备在下一个时钟周期写入寄存器F6,第二条指令开始执行,LOAD2上写入绝对地址。同时,保留站中存入第三条指令待运算的操作数和操作,因为F2中内容需要Load,所以先写进保留站的Qj中,F4可以直接取就直接存进Vk中。寄存器F0中Qi写入保留站中待运算命令的名称。
周期4:取出第四条指令SUB.D F8,F6,F2,第二条指令执行完成,同时第一条指令完成写入结果M1到寄存器表F6中的值并在指令状态表中第一条指令填入写结果周期4。同样在保留站中存入第四条指令的待运算操作数和操作,F6是之前写入的值为M1所以存入Vj,F2是要等待Load的值尚未准备好所以存入Qk中为Load2,同时寄存器表中F8中Qi存入将要给它赋值的指令名称。Load部件中LOAD1行清空。
周期5:取出第五条指令DIV.D F10,F0,F6,第二条指令写结果M2到寄存器F2的值中,Load部件表中LOAD2行清空。同时,因为F2的值M2已经准备好了,所以在保留站中第一行的Qk转为Vk为M2,第四行同理。保留站中继续存入第五条指令的待运算操作数和操作,因为F0需要Mult1的值,所以保留站最后一行Qj先填入对应寄存器指令名称。
周期6:取出第六条指令ADD.D F6,F8,F2,因为所需数据都已经在之前的周期中写回结果,所以第三条和第四条指令在第六个周期开始执行并在指令状态中更新,相关的操作数和操作符被存入保留站,同理因为F8的结果正在由Sub执行,所以Qj先写为Sub所在的保留站Add1,同时在寄存器表中F6(第六条指令将要写入的寄存器)的改变Qi为指令执行的保留站号Add2。然后因为SUB和MULT都已经取到值了,可以开始执行了,就分别更新保留站中的time列。
周期7:因为SUB只需2个周期就可以执行完,所以SUB的Time由上个周期的1变成2时就代表指令完成,故第四条SUB指令执行完成,更新指令状态,并且准备写入寄存器表中Qi为Add1的寄存器中,即F8。保留站中的MULT指令继续执行,DIV指令继续等待MULT。
周期8:SUB指令执行完后在下个周期写结果M3到寄存器F8,同时保留站Add1中存放的指令的位置清空,MULT条指令继续执行。因为F8也有了ADD所需要的数据,所以更新Add2中的Vj为M3
周期9:ADD(第六条)指令开始执行。MULT指令继续执行。
周期10:ADD指令执行完成在下个周期准备写结果到F6,MULT指令继续执行。
周期11:ADD指令写结果M4到寄存器F6中,清空保留站中原来存放ADD指令的位置。MULT指令继续执行。
周期12~15:MULT指令继续执行,直到完成。
周期16:MULT指令写结果M5到寄存器F0,保留站中原来存放指令的位置清空。
周期17~56:DIV指令开始执行,直到执行完毕。
周期57:第五条指令执行结束后写结果M6到F10,保留站中原来存放指令的位置清空,执行完毕。
2. 对于与上面相同的延迟时间和代码段。
(1)给出在第3个时钟周期时,保留站的内容.

(2)步进5个时钟周期,给出这时保留站、load缓冲器以及寄存器状态表中的内容。

(3)再步进10个时钟周期,给出这时保留站、load缓冲器以及寄存器状态表中的内容。

  1. 假设浮点功能部件的延迟时间为加减法3个时钟周期,乘法8个时钟周期,除法40个时钟周期。自己编写一段程序(要在实验报告中给出),重复上述步骤2的工作。

(1)给出在第3个时钟周期时,保留站的内容.

(2)步进5个时钟周期,给出这时保留站、load缓冲器以及寄存器状态表中的内容。

(3)再步进10个时钟周期,给出这时保留站、load缓冲器以及寄存器状态表中的内容。

你可能感兴趣的:(计算机系统结构,计算机系统结构)