xjsc01

西北工业大学计算机组成原理实验报告——verilog后两次

在单周期CPU的基础上开发实现流水线CPU

说明：

1. 该PDF带有大纲功能，点击大纲中的对应标题，可以快速跳转。

2. 目录层级为：

一、一级标题

（二）二级标题

（3）三级标题

4.四级标题

e)五级标题

3. 波形分析见实验过程中对应实现的末尾。

实验要求：

掌握CPU流水线执行指令的过程和原理;
对CPU流水线的各种冒险问题和解决方法有深入的了解;
学习使用Verilog HDL语言实现流水线处理器，并进行调试，使其通过仿真;
提高自己设计和解决更复杂硬件系统的能力;
培养对硬件设计的兴趣。

实验过程：

（一）不考虑冒险的流水线搭建

把单周期的CPU升级为流水线的CPU，最重要的是使得各个阶段互相独立，互不影响。由于触发器仅仅在时钟上升沿的时候写入数据，在其他时刻数据均不发生变化，所以可以通过4级流水线寄存器把原来的数据通路分为5级

四级流水线寄存器的名字以上一级以及下一级的名称来命名：

首先列表分析各个寄存器所需要保存的数据：

流水线寄存器	保存数据	保存控制信号
if_id	instruction, pc_add_4	未译码，无
id_exe	pc_add_4, a, b, imm32, num_write, rs, rt	op(操作码), aluop, s_b, mem_write, reg_write, s_data_write, is_load_word
exe_mem	pc_add_4, b, c, num_write	mem_write, reg_write, s_data_write, rs, rt, op
mem_wb	pc_add_4, c, dm_data, num_write	reg_write, s_data_write, op

然后使用verilog对四个流水线寄存器进行实现。

为了增强可读性，我单独定义了4个流水线寄存器，每一个流水线寄存器中的所有信号全部列出。

eg.对于if_id流水线寄存器如下：

module if_id(

input clock,

input reset,

input write_enable,

output reg [31:0] instruction,

output reg [31:0] pc_add_4,

input [31:0] nxt_instruction,

input [31:0] nxt_pc_add_4

);

always @(posedge clock) begin

if (!reset)

begin

instruction <= 32'b0;

pc_add_4 <= 32'b0;

end

else if(write_enable)

begin

instruction <= nxt_instruction;

pc_add_4 <= nxt_pc_add_4;

end

endmodule

其他寄存器采用类似的方法进行定义。

这一种定义的原因：

①可读性更好，可以通过对应名称确定流水线寄存器中这一项的作用，而不必去计算每一个功能对应的位。

②如果在后面需要增加新的控制信号，那么可以直接增加，旧有的内容不需要改变，便于进行增量式设计。

对于顶层模块，参考下图，对元器件进行连接。

在顶层模块定义线网，按照如下格式：

这样可以通过前面的标识符表示区分这一个线网究竟是哪一个阶段的，使得可读性更好。

对于if_id流水线寄存器的连线如下：

if_id IF_ID(

//out

.clock(clock),

.reset(reset),

.write_enable(IF_ID_write_enable),//表示是否对寄存器进行写

.instruction(ID_instruction), //表示把寄存器的instruction与ID级的相连

.pc_add_4(ID_pc_add_4),

//in 这一个寄存器的下一个指令由IF给出

.nxt_instruction(IF_instruction),//该D触发器的D端的数据。

//当下一个时钟上升沿到来的时候，使用这些值来更新原有的值。

.nxt_pc_add_4(IF_pc_add_4)

);

其余结构的连线详细见平台提交的代码。

对于多路选择器，由于在数据通路中使用的频次很高，所以使用更为简单的条件运算符进行实现：

.nxt_num_write(

(ID_s_num_write == 2'b00) ? ID_instruction[20:16] :

(ID_s_num_write == 2'b01) ? ID_instruction[15:11] :

(ID_s_num_write == 2'b10) ? 31:

波形分析：

为了便于展现流水线CPU各个指令的传输，采用不同阶段的OP字段进行表示。

汇编代码：

addi $2, $zero, 1

addiu $3, $zero, 1

andi $4, $zero, 1

ori $5, $zero, 1

addi $6, $zero, 1

addiu $7, $zero, 1

得到的波形：

在波形中可以看到，一条指令随着时间的流逝，在流水级中不断向后方传递，每当到达一个新的周期，就会有新的指令被取入，这大大加快了指令的执行。

（二）处理流水线中的数据冒险

（1）数据冒险总体概述

在流水线中，指令被分成五个阶段(IF，ID，EXE，MEM，WB)，每个阶段都有独立的硬件执行，所以指令的不同阶段可以并行执行。

但是流水线中会遇到一些问题，即后续指令需要使用前一个指令的执行结果，而前一个指令还没有写回的时候，会产生数据冒险。

在这种情况下，如果不进行干预，后续指令无法获得前一个指令的正确结果，导致计算错误或结果不确定。

进行干预有多种选择，如果使用阻塞，那么执行的结果的正确性可以保证，但是会严重影响流水线的速度，所以要尽可能采用旁路机制，以实现对于数据冒险的处理，如果由于某些情况无法通过旁路处理，则还要进行阻塞。

（2）产生数据冒险的情况分析

在这里假设前面的指令的需要写入的寄存器单元的编号与后面的指令需要的编号相同：

首先，画出流水线的时空图，对于可能出现的数据冒险进行分析：

TIME		CC1	CC2	CC3	CC4	CC5	CC6	CC7	CC8	CC9
前面的指令		IF	ID	EX	MEM	WB
后面的指令	一阶		IF	ID	EX	MEM	WB
	二阶			IF	ID	EX	MEM	WB
	三阶				IF	ID	EX	MEM	WB
	四阶					IF	ID	EX	MEM	WB

在MIPS的指令集体系架构中，数据写回寄存器全部是在WB阶段发生的，现在对上图进行分析：

一阶指令：读取寄存器数据在CC3进行，但是前面的指令在CC5才可以写回数据，所以会产生冒险。
二阶指令：读取寄存器数据在CC4进行，但是前面的指令在CC5才可以写回数据，所以会产生冒险。
三阶指令：这里需要进行具体分析，如果寄存器支持先写后读，那么在同一个周期中，三阶指令的ID可以读取到前一条指令的WB写回的数据。
但是在本次实验中，规定所有的写操作全部是在时钟周期的上升沿进行的，所以在CC5这一个周期仍然会发生冒险。
四阶指令：对于四阶指令，读取数据在CC6，已经在前面的指令的WB阶段之后，所以并不会发生冒险。

从上所述：前三阶的指令会发生数据冒险。第四阶以及之后的指令不会发生数据冒险。

（3）解决数据冒险详细分析

1.对于后面的指令为一阶指令：

进行分类讨论：

a)前面的指令为EXE型

如表：

TIME		CC1	CC2	CC3	CC4	CC5	CC6
前面的指令（A）		IF	ID	EXE	MEM	WB
后面的指令(B)	一阶		IF	ID	EXE	MEM	WB

在下面记前面的指令为A，后面的二阶指令为B

在表中可以看到，A在CC3阶段得到运算结果，在CC4可以从EXE/MEM流水线寄存器中读出A写入寄存器堆的数据。

B指令在CC4需要数据进行运算，所以可以采用MEM-EXE旁路策略。

b)前面的指令为MEM型

如表：

TIME		CC1	CC2	CC3	CC4	CC5
前面的指令（A）		IF	ID	EXE	MEM	WB
后面的指令(B)	一阶		IF	ID	EXE	MEM

在表中可以看到，A在CC4阶段得到运算结果，在CC5可以从MEM/WB流水线寄存器中读出A写入寄存器堆的数据。

这一个时候，对于B指令进行细分。

若B在EXE阶段需要得到数据，那么必须阻塞一个周期，同时进行WB-EXE旁路。
若B在MEM阶段需要得到数据（sw指令），那么可以不进行阻塞，直接进行WB-MEM旁路策略。

2.对于后面的指令为二阶指令：

TIME		CC1	CC2	CC3	CC4	CC5	CC6	CC7
前面的指令（A）		IF	ID	EXE	MEM	WB
后面指令（B）	二阶			IF	ID	EXE	MEM	WB

在下面记前面的指令为A，后面的二阶指令为B

如果A是EXE型，那么结果在CC3的末尾产生，在CC4以及CC5周期均可以提前得到A写回的值。
如果A是MEM型，那么结果在CC4的末尾产生，在CC5周期可以提前得到A写回的值。

为了简单起见，对于A指令，不论是EXE型还是MEM型，都可以从A的WB级把A需要更改的寄存器的值旁路到B的EXE阶段，使得在B执行的时候使用的值是A运算出来的最新的结果，即WB-EXE旁路。

3. 对于后面的指令为三阶指令：

TIME		CC1	CC2	CC3	CC4	CC5	CC6	CC7	CC8
前面的指令（A）		IF	ID	EXE	MEM	WB
后面的指令(B)	三阶				IF	ID	EXE	MEM	WB

在下面记前面的指令为A，后面的二阶指令为B

在图中可以看到，无论A是EXE型还是MEM型指令，在CC5的WB阶段可以得到A指令写入寄存器的值。

对于B，无法在CC6以及CC7阶段进行旁路，因为在CC6和CC7阶段，A的相关信息已经不在流水线中了，所以无法完成旁路。

但是在CC5阶段可以进行旁路。可以把A的MEM/WB流水线寄存器中的写入寄存器堆的数据旁路到B的ID级流水线寄存器，这样，后面的指令就可以使用A指令运算得到的值了，即使用WB-ID旁路策略。

（4）解决数据冒险总体分析

根据上一个步骤，现在把解决数据冒险进行以下总体概括：

1. 总体方案：

前面指令	EXE			MEM
后面指令	一阶	二阶	三阶	一阶	二阶	三阶
EXE	MEM-EXE	WB-EXE	WB-ID	等待一个周期 WB-EXE	WB-EXE	WB-ID
MEM				WB-MEM

2. 多种冒险冲突分析：

为了分析方便，给指令起以下名字：

NO.1	A
NO.2	B
NO.3	C
NO.4	D

这四条指令顺序执行。

对于同一个寄存器单元，如果D指令与C构成一阶冒险，那么就必须采用一阶冒险的旁路策略。即使D与B或者A存在冒险，也无需考虑，因为C指令的值是最新的，要把最新的值进行旁路。
同理，对于同一个寄存器单元，如果D指令与B构成二阶冒险，那么无需考虑指令D与A的关系，直接按照二阶冒险进行处理。

综上所述，冒险的处理有着优先级，即先考虑一阶冒险，然后考虑二阶冒险，最后考虑三阶冒险。

（5） WB2EXE以及MEM2EXE的处理

WB2EXE以及MEM2EXE是可以处理一阶（第一条指令为EXE型）以及二阶的冒险

根据之前的分析，

如图，s_forwardA3或者s_forwardA4选择0，表示MEM-EXE旁路；选择1表示WB旁路；选择2表示不进行旁路，直接使用ID/EXE流水线寄存器中的值。

根据“（4）解决数据冒险总体分析”中的分析，如果具有一阶的冒险，那么直接进行MEM-EXE旁路，如果具有与二阶的冒险，那么进行WB-MEM旁路。

判断是否冒险我认为有三个要素：

后面的指令需要的寄存器编号与前面的指令的目的寄存器号（可能为rt或者rd，在ID阶段之后可以确定）一致；
前面的指令改写的寄存器号不为0；
前面的指令写寄存器信号有效。

我在实际的代码中，通过if-else判断来决定优先级。

always @(*) begin //对于A3的值进行控制

if(MEM_reg_write == 1 && MEM_num_write != 0//判断我上文中提到的三个条件

&& MEM_num_write == EXE_rs)//如果产生一阶的数据冒险

s_forwardA3 = 0;

else if(WB_reg_write == 1 && WB_num_write != 0

&& WB_num_write == EXE_rs) //如果产生二阶的数据冒险

s_forwardA3 = 1;

else

s_forwardA3 = 2;//不产生冒险

end

always @(*) begin //对于B3的值进行控制

if(MEM_reg_write == 1 && MEM_num_write != 0//判断我上文中提到的三个条件

&& MEM_num_write == EXE_rt) //如果产生一阶的数据冒险

s_forwardB3 = 0;

else if(WB_reg_write == 1&& WB_num_write != 0

&& WB_num_write == EXE_rt) //如果产生二阶的数据冒险

s_forwardB3 = 1;

else

s_forwardB3 = 2; //不产生冒险

end

波形分析：

编写具有WB2EXE以及MEM2EXE冒险的汇编代码对CPU进行测试：

addi $1, $zero, 5

addi $1, $zero, 6

addi $2, $1, 0 #上面是测试MEM到EXE

addi $1, $zero, 5

sll $zero, $zero, 0

addi $2, $1, 0 #此处测试WB到EXE

波形如下

对于汇编指令第三行，其与第一行构成二阶冒险，与第二行构成一阶冒险，在这里应该优先使用一阶冒险，所以应该从MEM阶段进行旁路。对应波形图中s_forwardA3为0

对于汇编指令第六行，与第四行构成二阶数据冒险，波形图中s_forwardA3为1，从WB进行旁路

其余情况没有数据冒险，所以s_forwardA3 = 2’b10，表示不进行旁路，使用从ID阶段寄存器文件中得到的值。

（6）WB2ID的实现

这一个旁路是专门针对三阶冒险进行的。

如果检测到WB需要写入寄存器的编号与ID的寄存器编号一致且不为0，那么就进行这一个旁路。

优先级分析：

按照“（4）解决数据冒险总体分析”中的分析，这一种旁路应该是优先级最底的。在对于WB2ID直接实现就好，不需要特殊判断是不是有一阶或者二阶冒险。

在图中可以看到：如果当前指令有一级或者是二级冒险，那么在ID阶段得到的值在后面会被忽略（后面的MUX不会选择ID/EXE阶流水线寄存器中的值），即一二级冒险的优先级由于数据通路的设计，高于三级冒险。所以在此处发现冒险之后可以直接旁路，而不必关心有没有一二级冒险。

s_ forwardB3的控制模块：

always @(*) begin

if(WB_reg_write == 1 && WB_num_write != 0

&& WB_num_write == ID_rs)

s_forwardA2 = 0;

else

s_forwardA2 = 1;

end

always @(*) begin

if(WB_reg_write == 1 && WB_num_write != 0

&& WB_num_write == ID_rt)

s_forwardB2 = 0;

else

s_forwardB2 = 1;

end

波形分析：

编写汇编代码，其中具有三阶冒险。

addi $1, $zero, 5

sll $zero, $zero, 0

addi $2, $1, 0 #与第一行的指令构成三阶冒险

波形如下：

可以看到，在ID级的指令为前三行的代码不会出现冒险，所以旁路到ID级的多路选择器的选择信号为2，对应gpr中读出来的数据。对于第四条指令，与第一条汇编指令发生三阶冒险，所以选择信号为1.以读取最新的值。

备注：MUX选择信号为1：WB-ID；选择信号为2：从gpr中读取。

（7）halt+WB2EXE的实现

在前面的讨论中，除了前面的指令为lw指令的情况下的一阶冒险没有考虑完之外，其他的冒险已经考虑完成。

对于前面的指令为lw并且为一阶冒险的情况，分为两种情况进行讨论。

1.如果后面的指令为EXE型指令（非sw指令）

根据下表：

TIME		CC1	CC2	CC3	CC4	CC5
前面的指令（A）		IF	ID	EXE	MEM	WB
后面的指令(B)	一阶		IF	ID	EXE	MEM

必须阻塞一个周期，然后实现WB-EXE旁路。

在之前的讨论中，已经实现了WB到EXE的旁路，所以为了应对这一种情况，仅仅需要添加阻塞逻辑就可以了。

为了实现阻塞的效果，需要进行以下操作：

保持PC不变（使得原来在IF的指令在下一个周期仍然在IF进行执行）
保持IF_ID不变（使得原来在ID的指令在下一个周期仍然在ID进行执行）
使得ID_EXE清零（这一条指令为空指令，把流水线寄存器清零就可以实现把“空指令”的写寄存器以及写存储器的控制信号清零，从而对系统没有任何的影响，相当于是执行了空指令）

同时需要注意I型指令，I型指令的rt是I型指令写入的寄存器号，而不是I型指令执行所需要用到的信号，所以I型指令的rt并不参与冒险判断。

always @(*) begin

if((//满足条件即阻塞

EXE_is_load_word && EXE_num_write != 0

&& EXE_num_write == ID_rt //检查rt字段是否与前面的指令要写的寄存器相同

&& ID_op != `instruction_op_ADDI//对于I型指令，不关心rt

&& ID_op != `instruction_op_ADDIU

&& ID_op != `instruction_op_ANDI

&& ID_op != `instruction_op_ORI

&& ID_op != `instruction_op_LUI

&& ID_op != `instruction_op_SW

&& ID_op != `instruction_op_LW

)

(

EXE_is_load_word && EXE_num_write != 0

&& EXE_num_write == ID_rs //检查rs字段是否与前面要写的寄存器号相同

)

begin//阻塞的逻辑，保持PC以及IF_ID寄存器不变，把ID_EXE清零

IF_ID_write_enable = 0;

PC_write_enable = 0;

ID_EXE_flush = 1;

end

else

begin

IF_ID_write_enable = 1;

PC_write_enable = 1;

ID_EXE_flush = 0;

end

波形分析：

首先编写以下的汇编代码

addi $1, $zero, 5

sw $1, 0($zero)

lw $2, 0($zero)

addi $3, $2, 0 #与第三条指令有数据冒险

波形如下：

从波形中可以看到，在第四条指令位于ID级的时候，发生了阻塞，导致PC在第五条指令处停滞了两个周期。

在波形图的倒数第3行，表示旁路信号。在阻塞了一个周期之后，正常旁路。倒数第2行可以看出，寄存器中的值仍然为初始值0，但是通过旁路，在a_latest中得到了正确的值（第三条汇编指令写入的5）

2.如果后面的指令为sw型指令

在这个时候可以通过WB-MEM进行实现，由数据通路图可以知道，如果有这样一种冒险，那么优先级是最高的。

具体实现如下：

always @(*) begin

if(

WB_op == `instruction_op_LW //判断前一条指令为lw

&& MEM_op == `instruction_op_SW //判断后一条指令为sw

&& WB_num_write != 0

&& WB_num_write == MEM_rt

)

s_forwardB4 = 1;

else

s_forwardB4 = 0;

end

波形分析：

首先编写如下的汇编代码：

addi $1, $zero, 5

sw $1, 0($zero)

lw $2, 0($zero)

sw $2, 4($zero)

得到以下的波形结果：

在波形图中，可以看到，在最后一条sw位于mem的时候，旁路信号发生作用，实现WB-MEM的旁路。

检查存储器，发现：

地址为4($zero)的存储器被正确写入数字5。

（三）处理控制冒险

（1）控制冒险概述

控制冒险是指在计算机程序中由于分支指令（beq,j,jal,jr等）的执行可能导致的流水线停顿或指令执行顺序的错乱。

为了解决控制冒险，有以下的方法：

①使用阻塞。阻塞可以处理任何的冒险，后果就是使得程序执行的时间大大增加，所以应该尽量避免使用阻塞。

②把分支应用提前到ID级。通过增加多余的硬件，在ID级得到分支的地址，并在时钟的上升沿更改PC的值，这样只需要清除一条指令（阻塞一个周期）

③采用分支预测。当预测的准确度比较高，并且预测错误的代价比较小的时候，可以采用预测来事先执行，而不是等到需要执行的时候进行执行。预测主要有预测分支发生，预测分支不发生以及动态预测

④采用延时槽，在跳转指令之后放置一条与跳转不相关的指令，这样的话，无论分支是否发生，均不会形成阻塞。

在该实验中，采用在ID级应用分支的结果，采用分支总不发生的预测，同时在必须的时候使用阻塞。

（2）j,jal,jr控制冒险的处理

如下图：

在图中可以看到，对于这一类的指令，主要需要处理两个方面：

①在ID级确定需要跳转的地址

②把跳转指令取到的下一条指令清空（对应图中的第二行）

要完成操作②，进行以下分析：

由于跳转指令的目标地址是在ID级确定的，因此在下一个时钟周期，已经进入IF级的指令将被无效化并阻塞执行。为了实现指令的清空，可以使用NOP指令代替已进入IF级的指令，将其机器码设置为0x0000_0000。为了实现设置机码的功能，可以给流水线寄存器增加一个flush信号，如果其有效，那么就同步复位。

在我的设计中，由于流水线寄存器有异步复位端口，所以我重用异步复位端口，其输入为（reset && (!flush) ）,这样，就不必为流水线寄存器增加新的端口。

Flush的操作逻辑如下：

always @(*) begin//j,jr,jal指令阻塞,面对IF_ID

if(ID_op == `instruction_op_J

|| ID_op == `instruction_op_JAL

|| (ID_op == `instruction_op_R_type && ID_funct == 6'b001000))begin

IF_ID_flush = 1;

end

之前的代码在置位的时候是把所有的控制信号设置为0，但是在这里需要把指令设置为全0，这一条指令代表sll，即逻辑左移运算。为了保证处理器得到正确的结果，必须把这一条指令进行实现。

查阅MIPS手册，得知这一条指令的格式如下：

这一条指令相比于之前的指令，增加了shamt字段。所以需要对流水线寄存器做出修改。详细设计步骤如下：

为ID_EXE流水线寄存器增加shamt字段
为ALU模块增加shamt输入
修改ALU内部逻辑，使得其可以处理移位运算。
增加ALU操作宏定义alu_op_sll
修改控制模块，使得对于移位指令得到ALU控制信号alu_op_sll

控制信号	s_npc	s_data_write	mem_write	s_num_write	s_b	s_ext	aluop	reg_write
取值	3	1	0	1	0	1	`alu_op_sll	1

此时，控制信号设置完成。

计算地址的功能按照之前单周期的方式，进行连接即可。但是要注意，对于PC+4，这一个值来自于IF阶段，对于其他的地址来源于ID阶段。

波形分析：

在波形中使用j指令进行说明。

编写下面的汇编代码

addi $2, $zero, 1 //line 1

beq $zero, $zero, L1 //line 2

addi $3, $zero, 3 //line 3

L1:

addi $4, $zero, 4 //line 4

在第二行指令位于ID级的时候，发生跳转。此时IF已经取了第三行的指令，所以应该进行清除。

对波形进行观察：

在波形中可以发现，IF_ID_flush按照预期置位为1，这表示清除掉j指令后面取的指令。

下图为寄存器的图，从图片中可以看到，第三条指令并未执行。

（3）beq指令的控制冒险处理

对于控制冒险（在EXE级使用分支结果），如果单纯使用阻塞，那么需要两个周期，显然比较浪费时间。为此，有以下两种优化方式：

将分支比较操作提前到指令解码阶段（ID级），以便在下一个时钟周期尽早确定分支目标地址。
采用分支预测技术，在这里采用的是预测分支永远不发生。如果预测正确，将不会产生阻塞！

当把指令提前到ID级进行执行的话，如果使用加法器进行比较是否相等，那么会严重拖慢ALU的速度，所以需要采用异或运算，如果得到全零，那么就代表寄存器文件中的两个值是相等的。

使用异或实现的细节：

assign ID_zero = ~(|(ID_a_latest^ID_b_latest));

ID_a_latest表示在ID级的经过旁路处理的寄存器A的值（消除了数据冒险，即在旁路控制信号控制的MUX之后的值），ID_b_latest同理。
ID_a_latest^ID_b_latest用于对ID_a_latest和ID_b_latest两个信号进行逻辑异或操作。
| 表示缩减运算符，可以把异或结果的每一个进行或，得到一位结果。
如果|(ID_a_latest^ID_b_latest)为0，代表两个数字相等，所以应该取反。

Flush可以复用（1）中的flush模块，仅仅需要加入对于beq型指令的清空逻辑。如果分支跳转，那么把IF/ID流水线寄存器清空。否则正常执行（预测成功）

具体实现如下：

else if(ID_op == `instruction_op_BEQ)begin

if(ID_zero == 1) IF_ID_flush = 1;//跳转，那么清空

else IF_ID_flush = 0;//预测成功，正常执行

end

按照图示连接好数据通路即可。

波形分析：

由于在该CPU中使用分支不发生预测，所以如果分支不跳转，那么则执行beq指令之后相当于没有发生任何事情。

编写如下的汇编代码：

addi $1, $zero, 1

nop

nop #用于处理数据冒险

beq $zero, $1, L1

addi $2, $zero, 2

L1:

addi $3, $zero, 3

在该汇编代码中，分支不发生，预测正确，那么PC仍然按照原有的顺序执行。

波形图如下：

通过波形图可以看出，假如预测正确的话，那么就不采取行动，让原来的指令按照顺序执行即可。

（4）beq中数据冒险的分析

由于分支结果在ID级就必须产生，所以在ID级也有可能产生数据冒险。对于ID级的数据冒险，分析如下：

1.对于EXE ID型指令

TIME		CC1	CC2	CC3	CC4	CC5	CC6	CC7	CC8	CC9
前面的指令		IF	ID	EXE	MEM	WB
后面的指令	一阶		IF	ID	EXE	MEM	WB
	二阶			IF	ID	EXE	MEM	WB
	三阶				IF	ID	EXE	MEM	WB
	四阶					IF	ID	EXE	MEM	WB

对于一阶，由于ID与EXE阶段重合，无法获得数据，所以必须阻塞一个周期，然后使用旁路MEM-ID
对于二阶，直接进行MEM-ID旁路即可
对于三阶，由于寄存器堆只有在一个周期结束的时候才进行写回，所以需要进行WB-ID旁路。
对于四阶，ID级在WB阶段之后，没有冒险

2.对于MEM ID型指令

TIME		CC1	CC2	CC3	CC4	CC5	CC6	CC7	CC8	CC9
前面的指令（MEM）		IF	ID	EXE	MEM	WB
后面的指令	一阶		IF	ID	EXE	MEM	WB
	二阶			IF	ID	EXE	MEM	WB
	三阶				IF	ID	EXE	MEM	WB
	四阶					IF	ID	EXE	MEM	WB

对于一阶，由于ID在MEM阶段之前，无法获得数据，所以必须阻塞两个周期，然后使用旁路WB-ID
对于二阶，由于ID与MEM阶段重合，无法获得数据，所以必须阻塞一个周期，然后使用旁路WB-ID
对于三阶，使用旁路WB-ID
对于四阶，ID级在WB阶段之后，没有冒险

3.所以总的处理方式如下

前面的指令

数据产生阶段

后面的指令

数据使用阶段

EXE

MEM

一阶

二阶

三阶

四阶

一阶

二阶

三阶

四阶

阻塞一个周期，MEM-ID旁路

MEM-ID

WB-ID

无冒险

阻塞两个周期，WB-ID旁路

阻塞一个周期，WB-ID旁路

WB-ID

无冒险

（5）阻塞+MEM2ID分析

（说明：（5）以及（6）先对相应的冒险进行分析，在（7）中做具体的实现）

前一条指令为EXE型指令，根据上表进行设计。

1.对于一阶的情况：

阻塞是在ID级进行阻塞，所以与数据冒险的阻塞情况相似，可以使用与MEM EXE型数据冒险使用同一根阻塞控制线。

其中阻塞的条件是：

ID级的指令为beq，而EXE级的指令①进行了写寄存器；②写寄存器目的地址不是0；③写寄存器目的地址与beq指令的rs，rt相同。

对于MEM-ID旁路，在数据冒险阶段并没有实现，所以在这里需要进行添加。

该旁路的条件为：

MEM级指令进行了写入寄存器的操作
MEM级指令写寄存器号与ID级的rs或者rt相同
MEM级写寄存器号不为0

对于优先级问题，旁路到ID级的优先级为：

首先处理MEM-ID旁路（二级冒险），然后处理WB-ID旁路（三级冒险）
对于一级冒险，其会在下一个周期的MEM-EXE阶段进行旁路，覆盖之前的结果，所以符合优先级的关系。

综上所述，先处理MEM-ID旁路，再处理WB-ID旁路。

2.对于二阶情况

旁路已经实现

3.对于三阶情况

旁路已经在数据冒险阶段实现，无需再次实现。

（6）阻塞+WB2ID分析

对于旁路机制，已经在数据冒险阶段实现了从WB到ID级的旁路，所以在这里仅仅需要考虑阻塞。

1.对于一阶冒险的阻塞：

需要阻塞两个周期，阻塞均发生在ID阶段。对于第一个阻塞，与数据冒险中的lw-EXE型指令相同；对于第二个阻塞，判断条件为：

①MEM为lw且ID为beq

②MEM的写寄存器编号不为0

③MEM的写寄存器编号与ID级的rs或者rt相同

2.对于二阶冒险的阻塞：

与一阶冒险的阻塞中的第二个阻塞相同，无需实现。

（7）处理ID级计算地址的数据冒险

首先，增加旁路机制（MEM-ID旁路）

always @(*) begin

if(MEM_reg_write == 1 && MEM_num_write != 0 //优先MEM-ID

&& MEM_num_write == ID_rs)

s_forwardA2 = 0;

else if(WB_reg_write == 1 && WB_num_write != 0 //然后考虑WB-ID

&& WB_num_write == ID_rs)

s_forwardA2 = 1;

else

s_forwardA2 = 2;

对于s_forwardB2同理。

然后按照数据通路示意图修改数据通路，完成旁路的工作。

然后再处理阻塞的情况，定义如下几个变量：

reg one_cycle_stall_judge1;

reg one_cycle_stall_judge2;

wire one_cycle_stall;

reg second_cycle_stall;

assign one_cycle_stall = one_cycle_stall_judge1 || one_cycle_stall_judge2;

对于one_cycle_stall阻塞，有两种判决条件，任意一种生效，那么判定为one_cycle_stall
second_cycle_stall表示（6）中的一阶冒险的第二次阻塞以及（6）中的二阶冒险的阻塞
无论one_cycle_stall发生还是second_cycle_stall发生，均会进行阻塞（使得PC值不变，IF/ID流水线寄存器不变，ID/EXE流水线寄存器清零）
one_cycle_stall_judge1的判断条件为数据冒险中的lw EXE型冒险
one_cycle_stall_judge2实现（5）中的阻塞

定义如下：（具体的分析见（5））

if( (EXE_reg_write && EXE_num_write != 0 &&

EXE_num_write == ID_rs && ID_op == `instruction_op_BEQ

)

(

EXE_reg_write && EXE_num_write != 0 &&

EXE_num_write == ID_rt && ID_op == `instruction_op_BEQ

)

one_cycle_stall_judge2 = 1;

else

one_cycle_stall_judge2 = 0;

对于second_cycle_stall，具体实现如下（判断条件见（6）的一阶冒险的第二个阻塞）

if( MEM_op == `instruction_op_LW && ID_op == `instruction_op_BEQ

&& MEM_num_write != 0 &&

(MEM_num_write == ID_rs || MEM_num_write == ID_rt)

)

second_cycle_stall = 1;

else

second_cycle_stall = 0;

到此，完成了控制冒险以及前移分支判断所新增加的数据冒险的处理。

波形分析：

编写如下的汇编代码进行测试

addi $1, $zero, 7

addi $2, $zero, 8

beq $1, $2, L1

addi $3, $zero, 3

L1:

addi $4, $zero, 4

对于测试指令的分析：Beq指令与第二行的指令构成了一阶冒险，需要进行阻塞。在阻塞完成之后，beq与第一行指令构成三阶冒险，应该采用WB-ID旁路。与第二行指令构成二阶冒险，应该采用MEM-ID旁路。

综合得到波形如下：

在波形中可以看出来，CPU在beq指令位于ID级的时候进行了阻塞。阻塞一个周期之后，对于rs，采用WB-ID旁路；对于rt，采用MEM-ID进行旁路。

通过旁路之后，a_latest与b_latest为正确的值。

遇到的问题和解决方法:

问题一：

提交之后，提示我的指令instruction出现问题，编写testbench检查：

增加了一个临时的输出pc_proceed

发现对于同样的assign赋值语句，输出的结果却不一样。

检查顶层模块，发现如下：

把IM的输出以及IF_ID的输出接到了一起，所以导致了结果不确定。

问题二

经过检查是指令译码的接线错误

问题三：

在红色部分本来需要进行阻塞，但是我的代码并没有阻塞，使用仿真，编写以下代码：

.text

lw $t5, 0($a2)

addu $t7, $t5, $t6

add $t1, $a0, $v1

使用上述的汇编代码进行仿真：

发现接线位数不对（如图中的黄色部分），继续检查代码

把相关的位数进行更正。

继续仿真，还是发现有错误，

发现在test测试信号显示正常的情况下，nxt_is_load_word值错误。

再仔细检查，发现没有标明为二进制数，只需要把

ID_instruction[31:26] == 100011 ? 1 : 0

改为

ID_instruction[31:26] == 6'b100011 ? 1 : 0

更改之后发现可以正常阻塞

问题四

发现了仅有的一条错误：

由于在前面进行过阻塞，怀疑阻塞部分出现问题。

红色的框中应该为&&

问题五

更改问题四之后，出现最后错误

前述的控制信号等等均没有问题，偏偏在写存储器的时候出现了问题。

推测是发生了数据冒险，检查发现，我没有处理红框框起来的冒险。

但是在增加对印的控制模块之后，还是存在冒险。

推测冒险是MEM，编写以下汇编指令：

.text

addi $t4, $zero, 5

sw $t4, 4($zero)#事先向1号存储单元存入5

add $t5, $zero, $zero

addu $t7, $t5, $t6

add $t1, $a0, $v1

lw $2, 4($zero)#从1号存储单元读出

sw $2, 8($zero)#存入2号存储单元、

发现在我的代码中，MEM_op传递出现问题：

添加EXE_MEM流水线寄存器中的op以及nxt_op，发现信号位数不对（下图中最上面的信号），接线错误

在更改之后，op信号可以正常传递。

问题六

更正问题五之后，s_forwardB4（使用黄线标出）没有按照预期进行变化。

经过检查，未按照预期，多出一个阻塞

当指令不明确时，可能会产生以上问题，所以在原有的指令后面添加一些无关紧要的指令

.text

addi $t4, $zero, 5

sw $t4, 4($zero)#事先向1号存储单元存入5

add $t5, $zero, $zero

addu $t7, $t5, $t6

add $t1, $a0, $v1

lw $2, 4($zero)#从1号存储单元读出

sw $2, 8($zero)#存入2号存储单元

addu $t7, $t5, $t6 #后面填充指令，防止执行过程中出现指令不明确

add $t1, $a0, $v1

addu $t7, $t5, $t6

add $t1, $a0, $v1

再次仿真，发现仍然有阻塞，检查对印代码：

根据汇编指令，在0x301c处出现阻塞，这个时候lw在EXE级，sw在ID级，阻塞控制模块识别到lw在EXE，同时ID级的I型指令rt字段需要使用数据，所以发生了阻塞

if((//满足条件即阻塞

EXE_is_load_word && EXE_num_write != 0

&& EXE_num_write == ID_rt

&& ID_op != `instruction_op_ADDI//对于I型指令，不关心rt

&& ID_op != `instruction_op_ADDIU

&& ID_op != `instruction_op_ANDI

&& ID_op != `instruction_op_ORI

&& ID_op != `instruction_op_LUI

&& ID_op != `instruction_op_SW

&& ID_op != `instruction_op_LW

)

(

EXE_is_load_word && EXE_num_write != 0

&& EXE_num_write == ID_rs

)

在代码中可以看到，我的代码已经考虑了如果是I型指令，那么rt与lw写寄存器的寄存器号一致时，不会阻塞。进行波形仿真：

在黄色框内，发现op字段位数不对（本来是6位，但是我这里只有5位），进行更改。

更正完成之后，顺利通过测试

问题七

在实现上一条指令为EXE型的一阶数据冒险的时候，发现流水线寄存器被意外清零。

回忆发现：在之前解决控制冒险的时候，对IF/ID这一个流水线寄存器进行过置零。

我在代码中，使用ID级的比较器进行判断。即，如果比较器的输出zero为1，则发生跳转，清空IF/ID级的寄存器；否则正常执行。

具体实现如下：

always @(*) begin//j,jr,jal指令阻塞,面对IF_ID

if(ID_op == `instruction_op_J

|| ID_op == `instruction_op_JAL

|| (ID_op == `instruction_op_R_type && ID_funct == 6'b001000))begin

IF_ID_flush = 1;

end

else if(ID_op == `instruction_op_BEQ)begin //判断逻辑为这两句：

if(ID_zero == 1) IF_ID_flush = 1;

else IF_ID_flush = 0;

end

else

begin

IF_ID_flush = 0;

end

在之前的设计中，没有考虑冒险，所以只要遇到ID级位beq指令，如果zero为0，那么直接把刚取的指令清零。

但是如果由于ID级所需要的数据在这一时刻无法通过旁路得到，那么就必须要发生阻塞，阻塞的时候，不可以对IF/ID级流水线进行置0.把控制逻辑修改如下：

其中one_cycle_stall表示是否为阻塞一个周期的情况。

if(ID_zero == 1 && (~one_cycle_stall)) IF_ID_flush = 1;

else IF_ID_flush = 0;

问题八

在测试样例中部的时候，我的逻辑控制没有问题，但是数据部分出现错误，推测是数据通路连接不正常。由于问题出现在MEM阶段，检查我的数据通路。

发现我的流水线寄存器的输入并不是经过数据冒险处理之后的，而是直接把ID级的数据赋给了EXE/MEM流水线寄存器。（如图中红色的线）

错误代码如下：

exe_mem EXE_MEM(

………

.nxt_b(EXE_b),

………

)

需要把下一级流水线的输入与多路选择器的输出进行连接。

问题九

发现在第二次阻塞时出现问题。

本来需要两次，但是我的程序仅仅阻塞了一次。编写汇编代码进行测试：

addi $t1, $zero, 20

sw $t1, 4($zero)

addi $2, $zero, 20

lw $1, 4($zero)

beq $1, $2, L1

sll $zero, $zero, 0

L1:

sll $zero, $zero, 0

在代码中，beq指令前面有一条lw指令，可以用来测试我的CPU

波形图如图，第二次阻塞的控制信号为second_cycle_stall，黄色方框圈出来的就是我的程序需要阻塞的周期，明显看到，是因为second_cycle_stall信号出现了问题。

在代码中进行检查，发现：IF/ID级的寄存器同样被清空，根据问题七中的情况，迅速定位到控制冒险中。

红色框圈住的为新增加的语句。

问题十：

在问题九的内容得到了修正之后，发现second_cycle_stall的值还是不正常。为此，根据确定second_cycle_stall的条件语句进行拆分，见代码：

wire test1;

wire test2;

wire test3;

assign test1 = MEM_op == `instruction_op_LW && ID_op == `instruction_op_BEQ;

assign test2 = MEM_num_write != 0 ;

assign test3 = (MEM_num_write == ID_rs || MEM_num_write == ID_rt);

然后继续仿真，得到的波形如图：

在图中发现，if中的条件表达式全部为x（即test1, test2, test3,均不确定），猜测可能没有完成接线。检查代码发现对于新增加的MEM_op和MEM_num_write没有接线。

更改之后，发现正常

单周期CPU与流水线CPU性能的比较

单周期CPU：一个周期执行一条指令，所需要的时钟周期是由最慢的那一条指令来决定的（即lw），包含了IF，ID，EXE，MEM，WB的时间之和。

流水线CPU：把单周期CPU的执行阶段划分为5个阶段，在同一时间，在每一个阶段执行不同的指令。由于指令是“重叠”执行的，所以流水线CPU的CPI与单周期的CPU一致，均为1。但是由于阶段的划分，使得流水线CPU的时钟周期约为单周期CPU时钟周期的五分之一。

评价性能，主要是考虑一条指令的执行延迟以及单位时间内执行的指令数。

对于执行单条指令的延迟，以lw指令为例子。单周期CPU执行这一条指令的时间就是时钟周期T。但是对于流水线而言，如果流水级划分不均匀，那么最慢的流水级的执行时间大于T/5，所以执行这一条指令的时间也大于T。

由此可见，流水线CPU如果在流水级划分不均匀的情况下，执行单条指令的速度比单周期CPU更慢。

对于程序运行的时候，有大量的指令需要执行，这些指令可以填满流水级，使得各个部件满负荷运转。此时，单周期CPU与流水线CPU的CPI可以认为近似为1.而流水线CPU的时钟周期约为单周期CPU时钟周期的1/5，所以流水线CPU更快。

综上所述：流水线CPU相对于单周期CPU并没有提高单条指令的执行时间。但是对于一个程序而言，其有许多的指令，流水线CPU对于大量指令的执行时间是单周期CPU的1/5，执行的效率显著提高，对于用户而言，等待的时间减短。

实验总结：

深入理解了CPU的流水线的工作方式。CPU的流水线是把多条指令“重叠” 使得IF，ID，EXE，MEM，WB的功能部件同时运转，形成宏观上并行，微观上串行的执行模式。为了让五个部件在不同的时刻对于不同的指令进行执行，流水线中需要有流水线寄存器把五个阶段分隔成为五个部分，这样，各个部分就可以互不影响，进行运行。
学会以波形的方式观察流水线的执行情况。流水线的工作方式通常采用单周期流水线图以及双周期流水线图来进行表示。在实验中，采用了波形来对流水线的工作进行观察，最上面的clock而言，可以确定每一个时钟周期的时间，相当于是一个多周期流水线图。通过添加不同的信号来进行展示，我观察到了相应的信号在流水线中的传递，更加深刻地理解了其工作方式。
增加了数据冒险的理解。在本次实验中，使用旁路和阻塞来解决数据冒险，总共有5条旁路来处理相关的冒险。对于lw-EXE型指令以及beq指令，还需要配合使用阻塞完成。通过这一次实验，使得我对于数据冒险控制单元的处理逻辑有了深刻的认识。对于旁路，不管需不需要，都可以旁路最新的值。但是对于阻塞，必须仔细把握需要阻塞的条件以防止产生没有必要的阻塞。
学习了如何对CPU进行阻塞。我学会了对CPU进行阻塞的方法，若在ID级进行阻塞，那么需要使得EXE，MEM，WB的指令向后继续执行，IF，ID指令保持不变，下一个周期EXE指令为NOP指令。要使IF，ID指令保持不变，需要是对应的PC寄存器和IF/ID寄存器保持不变，并把ID/EXE清零。
了解了简单的分支预测的实现。如果对于beq指令，不进行操作，取的指就是beq下一条指令，这代表这分支不发生。所以实现分支预测仅仅需要判断是否发生跳转。如果跳转，那么把IF/ID寄存器清空，表示预测失败。都这不进行任何操作。
学习了如何把已经读入的指令清除。由于每一级的控制信号都是由流水线寄存器给出，所以要把某一级的指令设置为NOP指令，仅仅需要把对应的流水线寄存器设置为0.
增强了自己的调错能力。在本次实验中，我同样遇到了很多的BUG，在单周期CPU的设计中，我学会了如何自己手写代码进行汇编，然后通过testbentch导入到CPU中进行执行。在这一次实验中，我同样使用了这样的方法进行调试，并解决出了隐藏的问题，调试能力的提升对于我编写复杂的代码有了更好的支撑。
加深了对层次化程序设计的理解。我在实验中把流水线的阻塞模块放置入了pipeline_stall_ctrl模块，集中产生阻塞的信号，在bypass_ctrl中解决旁路信号的产生。把相应的功能放置在较小的模块中，这样可以实现功能的封装，简化顶层模块的设计，同时便于对相应的功能进行调错。
Verilog设计的能力得到了很大的提高。在流水线CPU的设计中，我可以使用verilog语言来实现不同的功能模块，并且通过顶层模块中的模块实例化以及连线，将各个部件组合在一起。对于数据冒险，控制冒险的情况，我学会了独立分析其应该产生的控制信号和优先级，然后采用组合逻辑进行描述。
激发了自己对于硬件设计的兴趣。对于一个流水线CPU，从最初的PC，IM等等基本模块，再到单周期CPU，然后处理了所有的数据冒险以及控制冒险，得到了比较完善的流水线CPU。随着增量式设计的进行，CPU的功能不断完善。在完成CPU的设计之后，我感到了一种前所未有的成就感和自豪感。我亲手创造了一个奇迹，我可以通过Mars把汇编语言翻译为16进制指令，然后放入我的CPU进行运行，在指令执行完成之后，可以从最终的寄存器以及存储器波形图上得到CPU的运行结果。通过这一次的实验，我感悟到了硬件设计的魅力，我会在之后的学习生活主动去多接触硬件，了解硬件设计。

你可能感兴趣的:(计算机组成原理实验,fpga开发)

【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
2022-07-08 保利学府里李楚怡1307022
——保利碧桂园学府里——童梦奇趣【科学实验室】「7.9-7.10」✏玩出大智慧约99-144㎡二期全新升级力作
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
CX8903：Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片诚芯微科技社交电子
CX8903：电动Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片推荐。电动助力自行车EBIKE凭借其环保、健康、低噪、和便捷等特点，成为了越来越受欢迎的骑行便利交通工具。提供电动Ebike自行车仪表电源方案开发、E-BIKE电动助力自行车仪表供电电源解决方案。CX8903采用100V高压制造工艺（芯片最高耐压可到100V以上），SOP-8L贴片封装，CX8903内置100V/90mΩ
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
摩托车加装车载手机充电usb方案/雅马哈USB充电方案开发诚芯微科技社交电子
长途骑行需要给手机与行车记录仪等设备供电，那么，加装USB充电器就相继在两轮电动车上应用起来了。摩托车加装usb充电方案主要应用于汽车、电动自行车、摩托车、房车、渡轮、游艇等交通工具。提供电动车USB充电器方案/摩托车加装usb充电方案/渡轮加装usb充电方案/游艇加装usb充电方案开发。摩托车加装车载手机充电usb方案、汽车游艇改装四孔面板装双USB车充点烟器5V/4A电动车USB充电器输入4.
广州会刊小程序开发公司哪家好｜开发多少钱费用｜专业外包服务红匣子实力推荐
在选择广州会刊小程序开发公司时，有几个关键因素需要考虑。首先，您应该确定自己的需求和目标，以便找到最合适的开发公司。其次，您需要考虑公司的经验和专业知识。最后，您还应该考虑公司的信誉和口碑。开发-联系电话：13642679953（微信同号）首先，您应该明确自己的需求和目标。会刊小程序是一种用于展示会议信息和日程安排的应用程序。在选择开发公司之前，您应该明确自己的需求，包括功能要求、设计风格和用户体
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

西北工业大学计算机组成原理实验报告——verilog后两次

实验要求：

实验过程：

（一）不考虑冒险的流水线搭建

（二）处理流水线中的数据冒险

（1）数据冒险总体概述

（2）产生数据冒险的情况分析

（3）解决数据冒险详细分析

1.对于后面的指令为一阶指令：

2.对于后面的指令为二阶指令：

3. 对于后面的指令为三阶指令：

（4）解决数据冒险总体分析

1. 总体方案：

2. 多种冒险冲突分析：

（5） WB2EXE以及MEM2EXE的处理

（6）WB2ID的实现

（7）halt+WB2EXE的实现

1.如果后面的指令为EXE型指令（非sw指令）

2.如果后面的指令为sw型指令

（三）处理控制冒险

（1）控制冒险概述

（2）j,jal,jr控制冒险的处理

（3）beq指令的控制冒险处理

（4）beq中数据冒险的分析

1.对于EXE ID型指令

2.对于MEM ID型指令

3.所以总的处理方式如下

（5）阻塞+MEM2ID分析

1.对于一阶的情况：

2.对于二阶情况

3.对于三阶情况

（6）阻塞+WB2ID分析

1.对于一阶冒险的阻塞：

2.对于二阶冒险的阻塞：

（7）处理ID级计算地址的数据冒险

遇到的问题和解决方法:

问题一：

问题二

问题三：

问题四

问题五

问题六

问题七

问题八

问题九

问题十：

你可能感兴趣的:(计算机组成原理实验,fpga开发)