实验二:流水线及流水线中的冲突

一、实验目的

  1. 加深对计算机流水线基本概念的理解。
  2. 理解MIPS结构如何用5段流水线来实现,理解各段的功能和基本操作。
  3. 加深对数据冲突、结构冲突的理解,理解这两类冲突对CPU性能的影响。
  4. 进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。

二、实验内容和步骤
首先要掌握MIPSsim模拟器的使用方法。见文档《MIPSsim使用手册》。

  1. 启动MIPSsim。

  2. 根据预备知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(用鼠标双击各段,就可以看到各流水寄存器的内容)

  3. 熟悉MIPSsim模拟器的操作和使用方法。
    可以先载入一个样例程序(在本模拟器所在的文件夹下的“样例程序”文件夹中),然后
    分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察CPU中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。

  4. 选择配置菜单中的“流水方式”,使模拟器工作于流水方式下。

  5. 观察程序在流水线中的执行情况,步骤如下:
    (1)选择MIPSsim的“文件”→“载入程序”选项来加载pipeline.s(在模拟器所在文件夹下的“样例程序”文件夹中)。
    (2)关闭定向功能。这是通过在“配置”→“定向”(使该项前面没有“√”号)来实现的。
    (3)用单步执行一周期的方式(“执行”菜单中)或用F7执行该程序,观察每一周期中,各段流水寄存器内容的变化、指令的执行情况(“代码” 窗口)以及时钟周期图。
    (4)当执行到第13个时钟周期时,各段分别正在处理的指令是:

  IF:LW $r4, 60($6)
  ID:ADDI $r3,$r0,25
  EX:ADDI $r1,$r1,-1 
  MEM:ADDI $r6,$r0,8
  WB:ADD  $r2,$r1,$r0 

画出这时的时钟周期图。

  1. 这时各流水寄存器中的内容为:
IF/ID.IR: 0x8CC4003C // IF 与 ID 之间的指令寄存器存放的机器码
IF/ID.NPC: 0x00000030 // IF 与 ID 之间的指令程序计数器存放的下一条指令地址
ID/EX.A: 0x0000000000000000 // ID 与 EX 之间的第一操作数寄存器存放的是 0
ID/EX.B: 0x0000000000000000 // ID 与 EX 之间的第二操作数寄存器存放的是 0
ID/EX.Imm: 0x0000000000000019 // 将 25 存入 ID 与 EX 之间的立即数寄存器
ID/EX.IR: 0x20030019 // ID 与 EX 之间的指令寄存器存放的机器码
EX/MEM.ALUo: 0x0000000000000004 // EX 与 MEM 之间的 ALU 计算结果为 4
EX/MEM.IR: 0x2020FFFF // EX 与 MEM 之间的指令寄存器存放的机器码
MEM/WB.LMD: 0x0000000000000000 // MEM 与 WB 之间的数据寄存器存放从存储器读出的数据 0
MEM/WB.ALUo: 0x0000000000000008 // 存放从 EX/MEM.ALUo 传过来的计算结果是8
MEM/WB.IR: 0x20060008 // MEM 与 WB 段之间的指令寄存器存放的机器码
  1. 观察和分析结构冲突对CPU性能的影响,步骤如下:
    (1)加载structure_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。
    (2)执行该程序,找出存在结构冲突的指令对以及导致结构冲突的部件。
存在结构冲突的指令:fadd
导致结构冲突的部件:浮点加法器

(3)记录由结构冲突引起的停顿时钟周期数,计算停顿时钟周期数占总执行周期数的百分比;52个周期,结构冲突引起的停顿35个周期,占比为67.31%
(4)把浮点加法器的个数改为4个。
(5)再次重复上述(1)~(3)的工作。

结构冲突指令:fadd
停顿时钟周期:2个,总执行周期:19个,停顿周期占比:10.53%

(6)分析结构冲突对CPU性能的影响,讨论解决结构冲突的方法。

问题分析:结构冲突是硬件资源满足不了指令重叠执行的要求而发生的冲突。该冲突会导致流水线停顿,从而影响 CPU 性能。
解决方案:从前几个问题可以发现,当多添加加法器之后,结构停顿周期数明显减少,占周期总数的百分比明显降低。因此,在流水线处理机中设置相互独立的指令寄存器和数据寄存器,或者将统一的Cache分成独立的指令 Cache 和数据 Cache,即可解决结构冲突。
  1. 观察数据冲突并用定向技术来减少停顿,步骤如下:
    (1)全部复位。
    (2)加载data_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。
    (3)关闭定向功能。这是通过在“配置”→“定向”(使该项前面没有“√”号)来实现的。
    (4)用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突。
4,6,7,9,10,13,14,17,18,20,21,25,26,28,29,32,33,36,37,39,40,44,45,47,48,51,52,55,56,58,59周期发生了冲突

(5)记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算停顿时钟周期数占总执行周期数的百分比。

总时钟周期数:65
RAW停顿:31    占周期总数的百分比:47.69231%

(6)复位CPU。
(7)打开定向功能。这是通过在“配置”→“定向”(使该项前面有一个“√”号)来实现的。
(8)用单步执行一周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突,并与(3)的结果进行比较;

51013182225303437发生了冲突

(9)记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数。计算采用定向技术后性能提高的倍数。

停顿时钟周期数:9 总时钟周期数:43 占比:20.93%。性能提高了1.51倍。

你可能感兴趣的:(计算机系统结构,计算机系统结构)