继电器是如何成为CPU的(2)
——《穿越计算机的迷雾》整理和总结
上一篇已经从电池、开关、灯泡和继电器开始,画出了设计CPU所需的基本器件。这些器件将成为设计CPU的砖瓦木料。这一篇就用这些基本器件做一个CPU的雏形。
下图所示的传输门的作用是:当左边的"~1G"端输入为0时,左侧的1A4、1A3、1A2、1A1会直接传输到右侧对应的1Y*,就像一条线直接从1A*连接到1Y*一样;当左边的"~1G"端输入为1时,左侧的1A4、1A3、1A2、1A1都不能传输到右侧对应的1Y*,就像从1A*到1Y*的连线被剪断了一样。
注:本文里我做的电路图片都是GIF格式的,你可以在浏览器里看到随着开关的开闭,输入和输出电路上的灯泡是如何变化的。每个图上都有(http://bitzhuwei.cnblogs.com)标识我的博客地址,不过每个GIF图的最后一帧都去掉了这个标识。这样,看到一帧没有标识的时候,就知道下一帧将是GIF图的第一帧了。
传输门的原理很简单,就是在每个1A*到1Y*之间的连线上放个继电器而已,如下图所示。(取自《穿》)
在上一篇已经说明了寄存器的原理,这里仅仅是为了说明"74LS194"这个带有各种无聊管脚的四位寄存器的用法。将"~CLR"、"S1"和"S0"置为1,"SR"和"SL"置为0,然后,"74LS194"就是一个简单的四位寄存器了。(本人在multisim12.0里只找到了这个靠谱的四位寄存器,凑合用吧。)
为了更直观地看到CPU的运算结果,我们将使用"DCD_HEX"这个东西。它能够把输入的"0101"显示为"5",把"1010"显示为"A"。
本文还要用一个四位的加法器,直接在下面这个简陋的CPU里看就好了,不再单独展示。
现在一切就绪,可以开始设计CPU了!
CPU包括运算器和控制器两部分。我们首先做出运算器,然后逐步实现控制器,最后感受一下用机器语言编程的过程。本文实现的CPU虽然功能及其简陋,但是能够传达出当前真实CPU的原理。
现在我们要做的这个CPU,字长是4位,只能做两个数的加法。实现了运算器和手动版的控制器的CPU如下图所示。我们把这个版本称为version1的CPU。
上图中,"Add"是加法器,能执行两个4位数的加法运算。"RA"和"TR"是寄存器,"GAA"和"GBA"是传输门。"4""3""2""1"用来准备需要相加的数据(0到15),"KTR""KRA""KGA""KGB"是用来控制传输门通断和寄存器脉冲的开关。
在上图所示的GIF动画中,显示了"5+1+2+4"这个过程。这个过程可以分为4个步骤:①加载一个数值(Load);②加上一个数值(Add);③加上一个数值(Add);④加上一个数值(Add)。具体来说,每一个步骤要做的事情是:
指令 |
内容 |
加载一个数(Load) |
准备数据(0101); KGB↓, KGA↑; KRA↓↑ |
加一个数(Add) |
准备数据(0001); KGB↓, KGA↑; KTR↓↑; KGA↓, KGB↑; KRA↓↑ |
加一个数(Add) |
准备数据(0002); KGB↓, KGA↑; KTR↓↑; KGA↓, KGB↑; KRA↓↑ |
加一个数(Add) |
准备数据(0004); KGB↓, KGA↑; KTR↓↑; KGA↓, KGB↑; KRA↓↑ |
你可以看到,每次执行(Add)这一步,要做的事情(搬动开关)是一样的,规律性极强。这意味着可以用简化的方式控制"KTR""KRA""KGA""KGB"这几个开关的状态。经过简化的CPU就有一定的自动化控制的性质了,如下图所示。我们把这个版本的CPU称为version2的CPU。
Verison2要比刚才的verison1进化了一些。为便于理解,我们保留原来的"KTR""KRA""KGA""KGB"这四个开关(把它们挪到了右上角,因为实在没地方放了),但让它们永远保持闭合的状态。这是想说明:version2里新增的电路只是实现了更加自动化地控制"KTR""KRA""KGA""KGB"的开闭,它没有改变version1中电路的工作流程。
Version2中的"KLoad"和"KAdd"开关分别代表了"Load"和"Add"这两个指令。当"KLoad"闭合时,表示CPU要进行加载操作,这会把"4""3""2""1"上的数据存入寄存器"RA";当"KAdd"闭合时,表示CPU要进行相加操作,这会把"4""3""2""1"上的数据与"RA"当前的数据相加,然后相加的结果又存储到"RA"。
Version2中的"K0"和"K1"两个开关会依次的开闭,即两者总有一个是断开且另一个是闭合的(若出现其它情况那就是电路设计错了)。所以实际上"K0"和"K1"可以用一个"2位循环移位寄存器"代替。(为便于理解,仍然保留"K0"和"K1"这两个开关,只不过让它们永远保持闭合的状态)
Version2中,只需重复"准备指令,准备数据,执行指令(K↓↑↓↑)"这样的操作,就能完成version1中的控制功能。这需要一个从"KLoad""KAdd""K0""K1"到"KTR""KRA""KGA""KGB"的转换电路,即version2电路图中的上半部分,如下图所示。
这需要一点点设计逻辑电路的知识,本文直接列出真值表,据此即可画出转换电路。(想知道如何推导的话,请查阅《穿》或者数字电路类书籍)
Kload |
Kadd |
K0 |
K1 |
KGA |
KRA |
KTR |
KGB |
1 |
0 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
1 |
1 |
0 |
1 |
0 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
其中"KLoad""KAdd""K0""K1"为输入,"KTR""KRA""KGA""KGB"为输出。只有如上三种输入情况下,输出部分会有1;其它的输入情况下,输出全部为0,所以就不需要列出来了。
举个例子,"KGA"="KLoad""~KAdd""K0""~K1" + "~KLoad""KAdd""K0""~K1"=("KLoad" ⊕"KAdd")"K0""~K1",据此可以画出"KGA"的转换电路。
在version2中,CPU要做的就是重复"准备指令,准备数据,执行指令(K↓↑↓↑)"这件事。其中执行指令这一步是完全重复完全自动化的(只要用振荡器替换K就可以),而准备指令和准备数据还需要手工操作。每次要执行哪个指令、要准备的数据是多少,这都是没有规律的,可改进的方法就是:把指令和数据按顺序保存到一些特别的寄存器里,需要的时候取出来用。这些特别的寄存器,就是内存。
所谓饭前便后要洗手,一个完整的卫生间,除了有若干坑位,还得有洗手池配套。类似的,学习CPU的结构原理,也得把"内存"牵出来溜溜,否则无法说明计算机编程的本质。CPU+内存才是一个完整的计算机(核心),才能展现出CPU的功能。由此也能联系到,将鼠标键盘显示器等称为"外部"设备的道理。
最基本的内存单元能够存储和读写一个位(bit),是由一个上升沿D触发器和传输门组成,如下图所示。传输门电路我没有找到只有一位的,拿这个四位GAA的凑合看吧。
内存单元的符号如下图所示。(取自《穿》)
把8个bit单元的读写端分别连起来,就可以存储一个字节(8bit)。下图是能够存储5bit的内存单元。(取自《穿》)此图所示的结构,我们称之为"一层"。
存储4bit的一层的符号如下图所示。这时我学会了multisim12里的"层次块"这个东西,下图就是用层次块画的,这样可以将复杂的电路封装起来,省地方了,还能复用。所以说模块化的思想在硬件设计里就有了。("用层次块替换…"和VS里的"Extract Method…"功能是何其类似!)
用一层一层的内存单元,即可构成存储器。对于有8层的存储器,需要3个bit表示需要读写的层数(23=8)。地址译码器的作用是:输入101时,输出的第5个(从0开始计数)引脚为1,其余均为0。有了地址译码器,存储器对外只需很少的地址线(例如10根)即可使用很多层(例如1024层)。这也符合了软件设计中接口尽可能简单的原则。本文所用的RAM存储器的结构如下图所示。其中左边的"3-8translator"就是译码器。
其层次块符号如下图所示。
这个RAM有三条地址线(Addr3、Addr2和Addr1),能够表示23=8个字(层),每个字的长度是4bit。这个小小的RAM刚好够存储(5+1+2+4)这个示例的指令和数据,下面就用这个RAM继续进化CPU。
这里也顺便把"3-8translator"译码器的电路实现贴出来吧,如下图所示。
在version2里用的"2位循环移动寄存器"只需要一个乒乓触发器(详见上一篇)就可以了,但是后面要做的全自动控制器,需要一个"9位循环移位寄存器",且这个寄存器要在加电时自动将第一个输出管脚置为1,其余为0。具有这样的功能的寄存器如下图所示。
如上图所示,第二行有4个D↑触发器,其中最左边的那个负责第一个输出管脚,即应该在加电时就置为1的那个管脚。这是通过左下方的电路实现的,其原理大家自己琢磨吧,无非是利用反馈电路实现了只生效一次这个功能而已。"9位循环移位寄存器"的符号如下图所示,其中"D0"是第一个输出管脚。
还有一个3bit的计数器,在上一篇里已经提过计数器,这里直接上图。
其层次块表示如下图所示。
有了内存,我们就要把指令和数据存进去。存储数据很好理解,是多少就写入多少。存指令之前,我们需要为每条指令分配一个4位的编码,比如0000表示Load,1111表示Add,然后用这个指令码控制"KLoad"和"KAdd"的开闭,所以这又是一个转换电路。有了这个转换电路,就可以只用"K"开关来完成"准备指令、准备数据、执行"这些操作了。全部自动化的CPU如下图所示。我们将这个版本的CPU称为version3的CPU。
这里的"ALU"是用层次块表示的version1里的电路,因为不这样的话,电路太大,而且不容易重点突出自动控制器的工作流程。同样的,"ShiftRegister9bit"、"Translator"、"Counter3bit"、"RAM8F4bit"都是层次块表示的电路。
"ShiftRegister9bit"会依次将输出端置为1,这可以从上方的三个数值显示器看出来。"Counter3bit"是3bit的计数器。"RAM8F4bit"是8层(每层4bit)的内存。"Translator"实现了控制信号的自动控制,"Translator"的内部实现如下图所示。
Version3所示的下半部分展示了译码电路,即把代表指令的4bit信号转换为指令信号的电路。由于我们指定Load和Add指令的代码(0000和1111)都是很规则的,所以译码电路也比较简单,如下图所示。
Version3的CPU用"9位循环移位寄存器"等器件实现了"取指令、分析指令,取数、执行"的全部自动化,其中取指令、分析指令、取数、执行分别占用了移位寄存器的t0- t2、t3、t4-t6、t7-t8这9个阶段。
注:如果用振荡器替换了"K",这个CPU会不停地运转下去,这样就得不到我们想要的结果0xC(十进制的12)了。所以还需要添加"停机"指令。不过到这里已经说清了CPU的控制器是如何一步步实现自动化的,不再继续讲述如何添加新的指令。
在给出上文的自动控制器里,我们只说了从内存里取指令和数据,而没有说这些指令和数据是如何写进去的。其实写进去的过程就是(机器语言)编程的过程。最简单的,你可以用拨动开关的方式,调整好要写入的位置,再调整好要写入的数值,把指令和数据一个字一个字地写入内存。最初的计算机编程就是用类似这样的方式(打孔纸带)编程的。(这个过程实在无聊,本文就不展示了,有兴趣的话自己拿multisim玩玩就好~)
用助记符和一些宏来代替机器码,这就是汇编语言。用C语言这种方式封装了汇编语言的编程方法,就是面向过程编程。用C++\C# \Java这样的语言封装了面向过程的语言,就是面向对象的编程方法。用if(..){…}代替JMP指令这种东西比较容易想象,但用"封装继承多态"这种飘渺的概念代替面向过程编程就有点困难了。我在另一篇文章《用C表达面向对象语言的机制——C#版》中作了分析和总结,现在终于算是从继电器一路走到面向对象编程了。
本系列文章只此两篇就结束了。貌似太少算不上一个系列,不过管他呢,反正问题写清楚就行了。如果有谁想做个实用的CPU,不妨用VHDL。SystemC也是用于硬件设计的,是用C++写的一个类库。我本科的时候用过,也不错。
感谢博客园众多园友推荐的好书,写本篇之前恶补了一阵,受益匪浅!现和我读的几本书一起陈列出来,方便查找。点击推荐者即可跳转到其博客上。
书名 |
作者 |
推荐者 |
《穿越计算机的迷雾》 |
李忠 |
BIT祝威 |
《编码:隐匿在计算机软硬件背后的语言》(《编码的奥秘》) |
Charles Petzold (伍卫国, 王宣政, 孙燕妮 译) |
armstronglaw, ClarkZhou, hywin, 天边彩云, Create Chen, Florian |
《计算机系统要素——从零开始构建现代计算机》 |
Noam Nisan, Shimon Schocken (周维, 宋磊, 陈曦 译) |
吴飞 |
《CPU自制入门》 |
水头一寿, 米泽辽, 藤田裕士 (赵谦 译) |
平如水 |
《CPU芯片逻辑设计技术》 |
朱子玉, 李亚民 |
吴飞 |
《30天自制操作系统》 |
川合秀实 (周自恒, 李黎明, 曾祥江, 张文旭 译) |
薛遗山 |
《Orange'S:一个操作系统的实现》 |
于渊 |
BIT祝威 |
本文作为整理和总结性质的文章,不求面面俱到,只为整理思路。想从灯泡开始一点一点地了解计算机的构成的话,建议看《编码的奥秘-隐匿在计算机背后的软硬件语言》(这一本的中文翻译也不错)。
了解了硬件的设计原理,又写过那么多的程序,下一步就该做个操作系统了。这次要写个真实可用的操作系统出来,不必像研究CPU一样只能弄个超简化的仿真模型玩了。再次感谢博客园众多园友推荐的好书,读了这几本书我才相信能在个把月内做出一个有图形界面的操作系统。如果再把网络协议和浏览器整进来,岂不就可以顺利畅游网络?
PS:需要本文的电路图等资料的话,麻烦点个赞并留下你的Email~