python_QYF

26 | Superscalar和VLIW：如何让CPU的吞吐率超过1？

到今天为止，专栏已经过半了。过去的 20 多讲里，我给你讲的内容，很多都是围绕着怎么提升 CPU 的性能这个问题展开的。

我们先回顾一下第 4 讲，不知道你是否还记得这个公式：

程序的 CPU 执行时间 = 指令数 × CPI × Clock Cycle Time

这个公式里，有一个叫 CPI 的指标。我们知道，CPI 的倒数，又叫作 IPC（Instruction Per Clock），也就是一个时钟周期里面能够执行的指令数，代表了 CPU 的吞吐率。那么，这个指标，放在我们前面几节反复优化流水线架构的 CPU 里，能达到多少呢？

答案是，最佳情况下，IPC 也只能到 1。因为无论做了哪些流水线层面的优化，即使做到了指令执行层面的乱序执行，CPU 仍然只能在一个时钟周期里面，取一条指令。

这说明，无论指令后续能优化得多好，一个时钟周期也只能执行完这样一条指令，CPI 只能是 1。但是，我们现在用的 Intel CPU 或者 ARM 的 CPU，一般的 CPI 都能做到 2 以上，这是怎么做到的呢？

今天，我们就一起来看看，现代 CPU 都使用了什么“黑科技”。

多发射与超标量：同一实践执行的两条指令

之前讲 CPU 的硬件组成的时候，我们把所有算术和逻辑运算都抽象出来，变成了一个 ALU 这样的“黑盒子”。你应该还记得第 13 讲到第 16 讲，关于加法器、乘法器、乃至浮点数计算的部分，其实整数的计算和浮点数的计算过程差异还是不小的。实际上，整数和浮点数计算的电路，在 CPU 层面也是分开的。

一直到 80386，我们的 CPU 都是没有专门的浮点数计算的电路的。当时的浮点数计算，都是用软件进行模拟的。所以，在 80386 时代，Intel 给 386 配了单独的 387 芯片，专门用来做浮点数运算。那个时候，你买 386 芯片的话，会有 386sx 和 386dx 这两种芯片可以选择。386dx 就是带了 387 浮点数计算芯片的，而 sx 就是不带浮点数计算芯片的。

其实，我们现在用的 Intel CPU 芯片也是一样的。虽然浮点数计算已经变成 CPU 里的一部分，但并不是所有计算功能都在一个 ALU 里面，真实的情况是，我们会有多个 ALU。这也是为什么，在第 24 讲讲乱序执行的时候，你会看到，其实指令的执行阶段，是由很多个功能单元（FU）并行（Parallel）进行的。

不过，在指令乱序执行的过程中，我们的取指令（IF）和指令译码（ID）部分并不是并行进行的。

既然指令的执行层面可以并行进行，为什么取指令和指令译码不行呢？如果想要实现并行，该怎么办呢？

其实只要我们把取指令和指令译码，也一样通过增加硬件的方式，并行进行就好了。我们可以一次性从内存里面取出多条指令，然后分发给多个并行的指令译码器，进行译码，然后对应交给不同的功能单元去处理。这样，我们在一个时钟周期里，能够完成的指令就不只一条了。IPC 也就能做到大于 1 了。

这种 CPU 设计，我们叫作多发射（Mulitple Issue）和超标量（Superscalar）。

什么叫多发射呢？这个词听起来很抽象，其实它意思就是说，我们同一个时间，可能会同时把多条指令发射（Issue）到不同的译码器或者后续处理的流水线中去。

在超标量的 CPU 里面，有很多条并行的流水线，而不是只有一条流水线。“超标量“这个词是说，本来我们在一个时钟周期里面，只能执行一个标量（Scalar）的运算。在多发射的情况下，我们就能够超越这个限制，同时进行多次计算。

你可以看我画的这个超标量设计的流水线示意图。仔细看，你应该能看到一个有意思的现象，每一个功能单元的流水线的长度是不同的。事实上，不同的功能单元的流水线长度本来就不一样。我们平时所说的 14 级流水线，指的通常是进行整数计算指令的流水线长度。如果是浮点数运算，实际的流水线长度则会更长一些。

Intel 的失败之作：安腾的超长指令字设计

无论是之前几讲里讲的乱序执行，还是现在更进一步的超标量技术，在实际的硬件层面，其实实施起来都挺麻烦的。这是因为，在乱序执行和超标量的体系里面，我们的 CPU 要解决依赖冲突的问题。这也就是前面几讲我们讲的冒险问题。

CPU 需要在指令执行之前，去判断指令之间是否有依赖关系。如果有对应的依赖关系，指令就不能分发到执行阶段。因为这样，上面我们所说的超标量 CPU 的多发射功能，又被称为动态多发射处理器。这些对于依赖关系的检测，都会使得我们的 CPU 电路变得更加复杂。

于是，计算机科学家和工程师们就又有了一个大胆的想法。我们能不能不把分析和解决依赖关系的事情，放在硬件里面，而是放到软件里面来干呢？

如果你还记得的话，我在第 4 讲也讲过，要想优化 CPU 的执行时间，关键就是拆解这个公式：

程序的 CPU 执行时间 = 指令数 × CPI × Clock Cycle Time

当时我们说过，这个公式里面，我们可以通过改进编译器来优化指令数这个指标。那接下来，我们就来看看一个非常大胆的 CPU 设计想法，叫作超长指令字设计（Very Long Instruction Word，VLIW）。这个设计呢，不仅想让编译器来优化指令数，还想直接通过编译器，来优化 CPI。

围绕着这个设计的，是 Intel 一个著名的“史诗级”失败，也就是著名的 IA-64 架构的安腾（Itanium）处理器。只不过，这一次，责任不全在 Intel，还要拉上可以称之为硅谷起源的另一家公司，也就是惠普。

之所以称为“史诗”级失败，这个说法来源于惠普最早给这个架构取的名字，显式并发指令运算（Explicitly Parallel Instruction Computer），这个名字的缩写EPIC，正好是“史诗”的意思。

好巧不巧，安腾处理器和和我之前给你介绍过的 Pentium 4 一样，在市场上是一个失败的产品。在经历了 12 年之久的设计研发之后，安腾一代只卖出了几千套。而安腾二代，在从 2002 年开始反复挣扎了 16 年之后，最终在 2018 年被 Intel 宣告放弃，退出了市场。自此，世上再也没有这个“史诗”服务器了。

那么，我们就来看看，这个超长指令字的安腾处理器是怎么回事儿。

在乱序执行和超标量的 CPU 架构里，指令的前后依赖关系，是由 CPU 内部的硬件电路来检测的。而到了超长指令字的架构里面，这个工作交给了编译器这个软件。

我从专栏第 5 讲开始，就给你看了不少 C 代码到汇编代码和机器代码的对照。编译器在这个过程中，其实也能够知道前后数据的依赖。于是，我们可以让编译器把没有依赖关系的代码位置进行交换。然后，再把多条连续的指令打包成一个指令包。安腾的 CPU 就是把 3 条指令变成一个指令包。

CPU 在运行的时候，不再是取一条指令，而是取出一个指令包。然后，译码解析整个指令包，解析出 3 条指令直接并行运行。可以看到，使用超长指令字架构的 CPU，同样是采用流水线架构的。也就是说，一组（Group）指令，仍然要经历多个时钟周期。同样的，下一组指令并不是等上一组指令执行完成之后再执行，而是在上一组指令的指令译码阶段，就开始取指令了。

值得注意的一点是，流水线停顿这件事情在超长指令字里面，很多时候也是由编译器来做的。除了停下整个处理器流水线，超长指令字的 CPU 不能在某个时钟周期停顿一下，等待前面依赖的操作执行完成。编译器需要在适当的位置插入 NOP 操作，直接在编译出来的机器码里面，就把流水线停顿这个事情在软件层面就安排妥当。

虽然安腾的设想很美好，Intel 也曾经希望能够让安腾架构成为替代 x86 的新一代架构，但是最终安腾还是在前前后后折腾将近 30 年后失败了。2018 年，Intel 宣告安腾 9500 会在 2021 年停止供货。

安腾失败的原因有很多，其中有一个重要的原因就是“向前兼容”。

一方面，安腾处理器的指令集和 x86 是不同的。这就意味着，原来 x86 上的所有程序是没有办法在安腾上运行的，而需要通过编译器重新编译才行。

另一方面，安腾处理器的 VLIW 架构决定了，如果安腾需要提升并行度，就需要增加一个指令包里包含的指令数量，比方说从 3 个变成 6 个。一旦这么做了，虽然同样是 VLIW 架构，同样指令集的安腾 CPU，程序也需要重新编译。因为原来编译器判断的依赖关系是在 3 个指令以及由 3 个指令组成的指令包之间，现在要变成 6 个指令和 6 个指令组成的指令包。编译器需要重新编译，交换指令顺序以及 NOP 操作，才能满足条件。甚至，我们需要重新来写编译器，才能让程序在新的 CPU 上跑起来。

于是，安腾就变成了一个既不容易向前兼容，又不容易向后兼容的 CPU。那么，它的失败也就不足为奇了。

可以看到，技术思路上的先进想法，在实际的业界应用上会遇到更多具体的实践考验。无论是指令集向前兼容性，还是对应 CPU 未来的扩展，在设计的时候，都需要更多地去考虑实践因素。

总结延伸

这一讲里，我和你一起向 CPU 的性能发起了一个新的挑战：让 CPU 的吞吐率，也就是 IPC 能够超过 1。

我先是为你介绍了超标量，也就是 Superscalar 这个方法。超标量可以让 CPU 不仅在指令执行阶段是并行的，在取指令和指令译码的时候，也是并行的。通过超标量技术，可以使得你所使用的 CPU 的 IPC 超过 1。

在 Intel 的 x86 的 CPU 里，从 Pentium 时代，第一次开始引入超标量技术，整个 CPU 的性能上了一个台阶。对应的技术，一直沿用到了现在。超标量技术和你之前看到的其他流水线技术一样，依赖于在硬件层面，能够检测到对应的指令的先后依赖关系，解决“冒险”问题。所以，它也使得 CPU 的电路变得更复杂了。

因为这些复杂性，惠普和 Intel 又共同推出了著名的安腾处理器。通过在编译器层面，直接分析出指令的前后依赖关系。于是，硬件在代码编译之后，就可以直接拿到调换好先后顺序的指令。并且这些指令中，可以并行执行的部分，会打包在一起组成一个指令包。安腾处理器在取指令和指令译码的时候，拿到的不再是单个指令，而是这样一个指令包。并且在指令执行阶段，可以并行执行指令包里所有的指令。

虽然看起来，VLIW 在技术层面更具有颠覆性，不仅仅只是一个硬件层面的改造，而且利用了软件层面的编译器，来组合解决提升 CPU 指令吞吐率的问题。然而，最终 VLIW 却没有得到市场和业界的认可。

惠普和 Intel 强强联合开发的安腾处理器命运多舛。从 1989 开始研发，直到 2001 年才发布了第一代安腾处理器。然而 12 年的开发过程后，第一代安腾处理器最终只卖出了几千套。而 2002 年发布的安腾 2 处理器，也没能拯救自己的命运。最终在 2018 年，Intel 宣布安腾退出市场。自此之后，市面上再没有能够大规模商用的 VLIW 架构的处理器了。

课后思考

在超长指令字架构的 CPU 里面，我之前给你讲到的各种应对流水线冒险的方案还是有效的么？操作数前推、乱序执行，分支预测能用在这样的体系架构下么？安腾 CPU 里面是否有用到这些相关策略呢？

数据的流动——计算机是如何显示一个像素的一尾66 基础知识图形渲染其他
在计算机内部是怎么把一张照片显示到屏幕上的呢？对于这个问题一直很好奇，这应该是也是图形学的一个最基础的问题吧。没上过计算机组成原理课，只好自行百度谷歌~发现网上的答案大多不完整，前段时间顺着问题一直搜索，从计算机的发明到显示器成像后来又到了电路，后来甚至工业革命的发展史，根本停不下来，有了一个主题后看历史也是真挺有意思的。在这里将我的理解大概记下来，不求细节精确，只求完整易懂。一个从编程/输入设备
计算机组成原理：总线技术深度解析努力编程的阿伟网络计算机组成
目录1.总线技术概述1.1什么是总线？1.2总线的基本功能2.总线的类型2.1内部总线2.2外部总线3.总线的标准与协议3.1常见的总线标准3.2总线协议4.总线的性能考量4.1带宽4.2延迟4.3可扩展性5.总线的未来趋势6.结语在计算机科学的浩瀚宇宙中，总线技术扮演着至关重要的角色。它是连接计算机硬件组件的神经网络，负责协调数据、指令和电源的流动。今天，我们将深入探讨总线的概念、类型、标准以及
计算机组成原理ioe,1614010102曹妍计算机组成原理实验报告7 weixin_39918145 计算机组成原理ioe
1614010102曹妍计算机组成原理实验报告7(6页)本资源提供全文预览，点击全文预览即可全文预览,如果喜欢文档就下载吧，查找使用更方便哦！9.9积分哈余虞理工大学钦件与微电子学院实验报告(2017-2018第一学期)课程名称：班级：学号：姓名：实验名称CPU与存储器的连接V业软件工程姓名曹妍学号1614010102班级软件16-1班一、实验目的：1.模拟一台完整的计算机，了解计算机硕件设计过程
计算机组成原理2——一个字是多少字节（切忌默认为一个字等于2字节蓝莓味柯基
一个字等于多少个字节，与系统硬件（总线、cpu命令字位数等）有关，不应该毫无前提地说一个字等于多少位。正确的说法：①：1字节（byte）=8位（bit）②：在16位的系统中（比如8086微机）1字（word）=2字节（byte）=16（bit）在32位的系统中（比如win32）1字（word）=4字节（byte）=32（bit）在64位的系统中（比如win64）1字（word）=8字节（byte）
计算机组成原理01 XXXJessie 计算机组成原理笔记
第一章计算机系统概述1.1本章大纲要求与核心考点1.1.1大纲内容(一)计算机系统层次结构计算机系统的基本组成计算机硬件的基本结构计算机软件和硬件的关系计算机系统的工作原理“存储程序"工作方式，高级语言程序与机器语言程序之间的转换,程序和指令的执行过程。(二)计算机性能指标吞吐量、响应时间；CPU时钟周期、主频、CPI、CPU执行时间；MIPS、MFLOPS、GFLOPS、TFLOPS、PFLOP
计算机组成原理02 XXXJessie 计算机组成原理笔记
1.3计算机系统的层次结构1.3.1计算机系统的基本组成（一）计算机硬件冯·诺依曼计算机冯·诺依曼在研究EDVAC计算机时提出了“存储程序”的概念，“存储程序”的思想奠定了现代计算机的基本结构，以此概念为基础的各类计算机通称为冯•诺依曼计算机，其特点如下：采用“存储程序”的工作方式。计算机硬件系统由运算器、存储器、控制器、输入设备和输出设备5大部件组成。指令和数据以同等地位存储在存储器中，形式上没
【计算机组成原理】3.2.1 SRAM和DRAM Skywalker玄默冲虚考研学习方法面试
3.2.1SRAM和DRAM00:00各位同学大家好，在上个小节中我们认识了存储芯片的基本原理，如何存储二进制的0和1，如何根据一个地址来访问某一个存储字，这是上一小节学习的内容。在这个小节当中我们会介绍两种特定类型的存储芯片，一种叫SRAM（StaticRandomAccessMemory），一种叫DRAM（DynamicRandomAccessMemory）。之前我们提到过RAM这个缩写，它指
我的大二上龙渊客
这一学期结束了，今天晚上就回家自己盘一下这学期的得失:学习上:计算机网络、计算机组成原理、数据库、线性代数、马克思原理基本概述、大学物理二都来了，感觉这一学期的任务是比上一学期加大，且沉重的。这些课程，要么专业课，要么必修课，自己认为对于这些课程，我并没有丝毫的放松，基本上都能全力以赴。但有些东西，还是我不能及的。有些人能在一周之内学完所有课程，耗费的是休息时间和取消平时的享乐。我则是慢热行的，慢
【计算机组成原理】2.3.2 浮点数的加减运算 Skywalker玄默冲虚考研学习方法面试
2.3.2浮点数的加减运算00:00各位同学大家好。通过之前几个小节的学习，我们已经知道了浮点数在计算机里边如何表示，它的表示规则是什么。那基于浮点数的这个表示规则和原理，又要如何实现浮点数的运算呢？所以这个小节我们要探讨的是浮点数如何实现加减运算。除了加减运算的实现之外，我们还会探讨浮点数还有定点数之间的一个强制类型转换的问题。00:24好，首先来看加减运算怎么实现，分为这样的几个步骤，对阶、尾
【计算机组成原理】2.3.1_1 浮点数的表示 Skywalker玄默冲虚考研面试学习方法
2.3.1_1浮点数的表示00:00各位同学大家好。通过之前几个小节的学习，我们已经知道了定点数怎么在计算机里表示，包括定点整数和定点小数。从这个小节开始，我们要学习浮点数在计算机里的表示和运算。这个小节中我们先介绍浮点数如何表示，我们会介绍浮点数它有什么作用，还有一个基本的原理。另外考试中常考的一个问题是浮点数的规格化，之后我们还会简单的介绍浮点数的表示范围相关的问题，这方面的内容其实已经从考研
SOC学习历程概述 weixin_30376509 操作系统嵌入式运维
从开始接触soc到现在大概有两年半左右的时间了，经历了ORSOC到minsoc再到mkg-soc的搭建，以及现在的大小核系统的搭建首先先讲下学习的前期需要具备的知识，前面3点是必须，后面3点可以中间学习的过程再学习。之所以有这些要求主要是以防中间的学习过程中，有些东西看不懂而走弯路。学习的前期准备：1、学过数电，有一定的电路基础。2、熟练掌握verilog语言。3、对于计算机组成原理，体系结构有一
计算机组成原理数据的表示和运算,计算机组成原理 No4 数据的表示和运算朝辞暮归
《计算机组成原理No4数据的表示和运算》由会员分享，可在线阅读，更多相关《计算机组成原理No4数据的表示和运算(39页珍藏版)》请在人人文库网上搜索。1、计算机组成原理,PrinciplesofComputerComposition,2,第二部分数据的表示和运算,2.1数制与编码2.2定点数表示和运算2.3浮点数表示和运算2.4算术逻辑单元ALU,3,2.2定点数表示和运算,2.2.1定点数的表示
【计算机组成原理】2.2.1_4 算数逻辑单元ALU Skywalker玄默冲虚考研学习方法面试
2.2.1_4算数逻辑单元ALU00:00各位同学大家好，在这个视频中我们会学习什么是算术逻辑单元ALU。首先我们会介绍ALU在计算机内部的一个作用，以及它需要支持哪些功能。紧接着我们会介绍ALU具体的实现原理，当然这个部分简要了解即可，考试不太可能考它的实现原理。最后我们会教大家怎么看懂ALU的图示。在考研真题当中有可能会给大家一个电路图作为题目的信息，在电路图当中可能会包含ALU这个部件。00
计算机组成原理—运算器 ITS_Oaij 考研
第二章数据的表示和运算2.1数制与编码2.1.1进位计数制及其相互转换2.1.2*BCD编码2.1.3定点数的编码表示⚫️定点数VS浮点数⚫️无符号数的表示⚫️有符号数的表示（原码、反码、补码、移码）⚫️原码、反码、补码、移码的作用2.1.4整数的表示2.2运算方法和运算电路2.2.1基本运算部件⚫️一位全加器⚫️串行进位加法器⚫️并行进位加法器⚫️算数逻辑单元ALU2.2.2定点数的移位运算⚫️
【计算机组成原理】2.2.2 定点数的移位运算 Skywalker玄默冲虚考研学习方法面试
2.2.2定点数的移位运算00:00这一小节中我们来学习定点数的移位运算怎么实现。移位运算又可以进一步的划分为算术移位、逻辑移位还有循环移位。我们会按从上至下的顺序依次讲解。00:13好，首先来认识一下什么叫做算术移位。我们从大家熟悉的十进制数出发，假设这儿有这样的一个十进制数985.211，那么我们从小经常做的一个事情是让小数点后移一位或者后移两位，那小数点每后移一位相当于我们对整个数值乘以了一
山东大学计算机组成原理实验4移位器（含原理图，引脚分配，实验结果输入输出） Star223333 计算机组成原理山东大学计算机组成原理计算机组成与设计实验移位器
实验内容及说明本实验要求采用传送方式实现二进制数的移位电路。图4给出了可对四位二进制数实现左移1位（×2），右移1位（÷2）和直接传送功能的移位线路，这也是运算器的主要功能。在LM（左移）的控制下可实现左移1位，空位补0。在RM（右移）的控制下可实现右移1位，空位补0。在DM（直送）的控制下可实现直接传送。实验步骤（1）用图形输入法完成图4逻辑电路输入。图4移位器电路原理图（2）管脚锁定：平台工作
408-计算机组成原理-注意点猫毛已经快要掉光的小猫系统架构
数据的表示IEEE754标准的特殊情况：阶码全为0，尾数不全为0表示非规格化的数值，0.M×2^(-126)阶码全为0，尾数也全为0，表示±0阶码全为1，尾数全为0，表示正负无穷大阶码全为1，尾数不全为0，表示非数符Nan存储器Cache：多少组相联指的是一组有多少个。LRU标记为一组有n个，就需要用logn表示区分计算cache数据区与cache容量，cache容量需要包括标志位。标志位大体包括
计算机组成原理第三章（存储器）—第一节（概述） Zevalin爱灰灰计算机组成原理笔记计算机组成原理
写在前面：本系列笔记主要以《计算机组成原理（唐朔飞）》为参考，大部分内容出于此书，笔者的工作主要是挑其重点展示，另外配合下方视频链接的教程展开思路，在笔记中一些比较难懂的地方加以自己的一点点理解（重点基本都会有标注，没有任何标注的难懂文字应该是笔者因为强迫症而加进来的，可选择性地忽略）。视频链接：计算机组成原理（哈工大刘宏伟）135讲（全）高清_哔哩哔哩_bilibili一、存储器的功能存储器是计
【软考中级备考笔记】数据的表示和校验码 lyx7762 软考软考
2024/2/18–数据的表示和校验码天气：阴雨春节假期结束后第一个工作日，开始备考中级软件工程师。希望在今年5月底的软考中取得中级证书视频地址：https://www.bilibili.com/video/BV1Qc411G7fB1.计算机的总体架构从下图中可以看出，计算机中包含了一下三个层次最底层的为计算机的硬件部分，对应的知识主要是计算机组成原理其次是操作系统这一个最大的系统软件，对应了操作
软考中级软件设计笔记 HoPE_st 设计模式软件工程网络程序人生
为备考2022上半年软考所做的笔记，祝愿自己顺利通过！软考笔记知识点速记操作系统1.CUP中的寄存器2.中断&DMA3.系统可靠地计算4.存储器4.1Cache4.2存储器划分4.3存储器构成5.页面逻辑地址&物理地址6.指令6.1流水线和吞吐率6.2指令寻址7.移臂调度算法8.总线基础知识9.PV操作、信号量计算机组成原理1.逻辑运算2数据校验2.1海明码&海明校验2.2循环冗余校验3.浮点数运
软考学习--计算机组成原理与体系结构 CYing丶学习软件设计师
计算机组成原理与体系结构数据的表示进制转换R进制转换为10进制–按权展开法10进制转换为2进制原码反码补码移码原码：数字的二进制表示反码：正数的反码等于原码，负数的反码等于原码取反补码：正数的补码等于原码，负数的补码等于原码取反+1移码：浮点运算中的阶，最高位取反浮点数运算浮点数表示：N=M*Rⁿ（科学计数法）M为尾数，R为基数，n为指数对阶->尾数运算=>结果格式化计算机结构Flynn分类法计算
计算机组成原理 2 数据表示 Sanchez·J 计算机组成原理电脑
机器数研究机器内的数据表示，目的在于组织数据，方便计算机硬件直接使用。需要考虑：支持的数据类型；能表示的数据精度；是否有利于软件的移植能表示的数据范围；存储和处理的代价；...真值：符号用“+”、“-”表示的数据表示方法。机器数：符号数值化的数据表示方法,用0、1表示符号。三种常见的机器数：（设定点数的形式为）原码表示简单运算复杂：符号位不参加运算，要设置加法、减法器。0的表示不唯一[X]原+[Y
180天Linux小白到大神-Linux快速入门给小李三分薄面 Linux小白成长之路 linux 运维运维开发定时任务
01.Linux快速入门01.Linux快速入门1.计算机组成原理1.1什么是计算机1.2为什么要有计算机1.3计算机五大组成部分1.3.1CPU1.3.2内存/硬盘1.3.3输入设备1.3.4输出设备1.3.5五大组件总结1.4计算机三大核心硬件1.5操作系统基本概念1.5.1操作系统由来1.5.2什么是操作系统1.5.3为什么需要操作系统2.Linux系统基本介绍2.1什么是Linux2.2L
计算机组成原理：存储系统【二】 godspeed_lucip 系统架构
个人主页：godspeed_lucip系列专栏：计算机组成与原理基础️1Cache概述️1.1局部性原理1.1.1空间局部性1.1.2时间局部性️1.2性能指标1.2.1解释1.2.2例题1.2.3待解决的问题️1.3知识总结️2Cache与主存的映射2.1知识总览2.2全相联映射（随便放）2.2.1要点2.2.2CPU访问主存2.3直接映射（只可以放在固定位置）2.3.1要点2.3.2改进2.3
计算机组成原理：存储系统【一】 godspeed_lucip 系统架构
个人主页：godspeed_lucip系列专栏：计算机组成与原理基础1主存的模型、寻址1.1总览1.2存储器的层次化结构1.3存储器的分类1.3.1按层次1.3.2按照介质1.3.3按照访问方式1.3.4按照信息的可更改性1.3.5按照信息的可保存性1.4存储器的性能指标1.5总结2主存储器的基本构成2.1总览2.2基本的半导体元件2.2.1构成2.2.2读出数据2.2.3写入数据2.2.4示例2
关于GPU一些笔记（SIMT方面) Huo的藏经阁 #CUDA gpu gpgpu
GPU组成《计算机组成原理—GPU图形处理器》已经大概说明出GPU一般都是由比CPU多的core组成，而每个core相当于一个单独线程进行计算，并且可以同时触发执行相同的单一指令但是每个计算单元数据不同(称之为SIMD)的指令执行。在英伟达GPU中core一般称之为之为cudacore，GPU内部一般集成了成千上万个cudacore。为了方便进行进行对这么多的核进行管理调度，GPU将按照一定数量的
计算机组成原理 1 概论 Sanchez·J 计算机组成原理电脑
主要内容介绍运算器、控制器、存储器结构、工作原理、设计方法及互连构成整机的技术。主要内容：◼数值表示与运算方法◼运算器的功能、组成和基本运行原理◼存储器及层次存储系统◼指令系统◼CPU功能、组成和运行原理◼流水线◼系统总线◼输入输出系前置知识C语言程序设计数值逻辑：组合电路、同步电路概念、寄存器传输、有限状态机汇编语言程序设计：能看懂指令即可Verilog硬件描述语言：作为实验工具（可选）冯诺依曼
使用 C++23 从零实现 RISC-V 模拟器（1）：最简CPU everystep_ c++23 risc-v
本节实现一个最简的CPU，最终能够解析add和addi两个指令。如果对计算机组成原理已经有所了解可以跳过下面的内容直接看代码实现。完整代码在这个分支：lab1-cpu-add，本章节尾有运行的具体指令。1.冯诺依曼结构冯·诺依曼结构是现代计算机体系结构的基础，由约翰·冯·诺依曼在1945年提出。这种结构也称为冯·诺依曼体系结构，其核心特点是将程序指令和数据存储在同一个读写存储器（内存）中，计算机的
【计算机组成原理】中断排队次序、中断处理次序和多重中断 Hundred billion 计算机组成原理 OS 数据结构硬件架构
中断可以分为硬中断和软中断，硬中断一般是外部中断，例如在指令执行到中断周期时检测到有外设的中断请求，则会执行中断隐指令、中断服务程序等一些列操作。执行结束之后执行下一条指令。（因为上一条指令已经执行完成，中断的部分是由于外部请求）。软中断一般是内部中断，例如缺页，则在指令执行的过程中就可以产生中断，去执行缺页程序。因此，执行完中断后仍执行原指令。中断在执行完中断隐指令后，需要执行中断服务程序，即中
计算机组成原理算术逻辑实验,计算机组成原理之算术逻辑运算实验大饼土博计算机组成原理算术逻辑实验
计算机组成原理之算术逻辑运算实验(6页)本资源提供全文预览，点击全文预览即可全文预览,如果喜欢文档就下载吧，查找使用更方便哦！9.9积分计算机与信ZQ/\技术学院实验报告姓名学号专业班级2009级计算机科学与技术课程名称计算机组成原理课程设计实验曰期2011/8/23成绩指导教师批改曰期实验名称实验1算术逻辑运算实验一、实验目的:1、了解运算器的组成结构；2、掌握运算器的工作原理；3、学习运算器的
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

26 | Superscalar和VLIW：如何让CPU的吞吐率超过1？

26 | Superscalar和VLIW：如何让CPU的吞吐率超过1？

多发射与超标量：同一实践执行的两条指令

Intel 的失败之作：安腾的超长指令字设计

总结延伸

推荐阅读

课后思考

你可能感兴趣的:(计算机组成原理,计算机组成原理)