This section introduces someting that maybe you need to know before learning.
Note:This CPU is based on MIPS instruction set.
本小节将会介绍设计单周期CPU的核心思想和重要观念。
注:本文讨论的单周期CPU完全理想化,不考虑时间延迟问题。
我们先来谈谈 组合逻辑器件 和 存储器件
我们再来看一个做好的单周期CPU
图中框出的部分是存储器件,其余部分全是组合逻辑器件。
紫色框的器件是指令存储器,它的读取是不受限制的,给出地址就能立即读出,因此它的功能可以理解为一个组合逻辑。
红色框的器件自左到右分别是PC寄存器、寄存器堆和数据存储器,它们的读取是不受限制的,但是写入受到限制,这些确实发挥了存储器件的功能。
1-->0
的时候,能够写入新的值1
且时钟变化为1-->0
的时候,能够写入新的数据显然,这个系统是一个由时钟控制、由组合逻辑器件和存储器件共同构成的时序逻辑电路,它的工作情况是(以add指令为例):
1-->0
的时候,PC写入新的值,这个值就是指令的地址,指令由指令寄存器输出以上的过程,都是在时钟信号为0
的时候,以极快的速度,按顺序地、无阻拦地执行和完成的。 很明显,这具备组合逻辑器件的特征,看起来,这就像是一个复杂的组合逻辑器件而已。
简化来说,这就像是
add
的结果,该结果会被拦在寄存器堆的“入口”当然,如果是sw
指令的话,数据一样会被运算出来,然后被拦在数据存储器的“入口”。
以上过程,是近乎完全的组合逻辑,这也就意味着,它非常容易设计,甚至,只需要给出输入和输出,就能被自动地生成,现代计算机完全可以做到这点。
接下来,我们再看看被拦在寄存器堆(Register Files)入口的数据吧。
0-->1
,如果允许写入的信号有效,“门”就会被打开再之后,时钟1-->0
又开始重复之前的过程……
回看本小节的标题,我像你能够理解什么是基于组合逻辑的单周期CPU了。
在CPU的设计中,我们需要指令译码,通过控制器生成控制信号,来控制CPU各部件的工作,因此,我们就需要设计合理的控制信号。
我们来看看CPU的控制部件:
这里的CPU设计了4个控制部件
我们这里只说关注两种,了解后两种。
首先,我们要分清楚,必须遵循的MIPS指令集信号和自行设计的内部信号。
我们的CPU要实现MIPS指令集的一部分,因此,必须遵循它的设计规范,例如
而我们内部信号的设计,是可以自己决定的,只要能够正确地完成指令规定的功能就可以,当然要考虑复杂度等问题,这点我们先不关注,例如:
这里,我们也可以将中心控制器和ALU控制器合并在一起,拆开是为了硬件设计的降低复杂度,你可以看到,我们还拆开出了移位控制器和jr控制器,事实上,都可以任意地合并,甚至ALU本身也可以集成进去,这完全取决于你的设计,这很自由,唯一可能的constraint可能就是你要让器件逻辑清晰并且性能较好。
本节介绍了设计CPU的核心方法,我们采用自顶向下和知识屏蔽的方法,快速完成一个简易CPU的设计。
我们先来简要地介绍一下我们需要使用的CS 3410器件,在此特别感谢加利福尼亚大学提供的宝贵资源!
A 32-bit wide by 32-registers deep register file. Register
$0
is hard-wired to zero at all times, and writes to$0
are ignored. You can rely on register$0
always containing 0, and do not need to test that its value does not change. InputsrA
andrB
are used to select register values to output on theA
andB
outputs. When the clock is triggered, ifWE
is high, the data value at inputW
is stored in registerrW
. The register file can be configured to use rising clock edges as trigger (the default), falling edge, or to be level sensitive.
Computes a result as follows. You do not need to test the provided ALU, and can assume it will work exactly as specified.
为简化起见,我们最开始只使用这两个器件,其余的使用Logisim自动的就好。
我们不使用提供的指令ROM器件,但是,有一些重要的东西需要强调,非常重要!
An interesting aspect of the ROM is that the offset for branch instructions must be a multiple of 4, which assembles to an output offset divided by 4. This output offset follows the MIPS specification and needs to be left shifted by 2 to be added to PC. For example, given an instruction BEQ $0, $0, 4, the outputted offset in binary is 1.
我们采用的ROM是存储单元是32位的,并不是8位,这也就意味着我们的指令地址是1的倍数而不是4的倍数,我们的PC自动机,先PC << 2
,然后+4
,之后再PC << 2
,而对于branch指令,我们需要先offset << 2
然后与PC + 4
相加,之后再>> 2
,最后赋给PC
,这一点在设计的时候要尤为注意,后面的示例中,这个地方的设计是错误的,请读者来修改。
CPU设计最重要的就是逻辑和抽象设计,实现是将抽象转化为现实,并且反过来验证它,毫无疑问的是,无设计,无实现,这可不可能像你最开始学习C语言那样,随便想想就开始写,一个复杂系统的实现,必须:
让我们来看看CPU的设计,需要做哪些工作吧。
现在我们拥有的
我们需要设计的
我们只需要将这几个控制器协调好,帮助我们完成MIPS指令的功能,就能够让CPU执行对应的指令了。
我们可以使用Excel表格来记录,这很方便,并且很清晰,例如:
具体CPU的设计,你可以在开头提及的MOOC的CPU设计的章节进行学习。
让我们先来实现一个最小的,最简单的CPU,并且验证它的正确性,之后我们可以根据成功的经验,来实现更多的指令了。
完成了CPU的逻辑设计,我们就可以按照逻辑设计进行实现了,对于组合逻辑我们完全可以使用自动生成电路功能来完成它,没有必要手动完成。
看示例:
这是一个极简功能的CPU,甚至可能,它的设计是有些问题的,但是不妨碍我们真的实现了一个CPU,你可以参考它完成自己的CPU。
注意:我们前面提到的ROM器件中特别强调了地址是4的整数倍的问题,这里的设计有问题,在branch指令中并没有移位就直接加了PC,请读者自行学习改进。
现在,我们设计了一个简单的CPU,现在需要验证正确性了,我们需要使用MARS模拟器,编辑一些简单的MIPS指令。
然后我们将其编译,运行
之后我们将指令导出,加载到我们刚刚设计的CPU的存储器中去,执行指令,看看结果与MARS的结果是否一致,如果一致,就设计正确,不一样就依次查找,找到出错的信息,然后纠正它。
在导出之前,我们需要设置一下MARS,将其数据段地址从0开始。
然后,我们就可以导出了
可以分别导出.text
和.data
,以十六进制形式,然后加载到我们的Logsim指令存储器和数据存储器中去。
好吧,我想现在还没有惊喜……后续我会将一些可参考的CPU上传,这样大家就可以参考学习了。