住在天上的云

【王道】计算机组成原理知识点总结5——中央处理器

5 中央处理器

5.1 CPU的功能和基本结构

5.1.1 CPU的功能

组成

中央处理器（CPU）由运算器和控制器组成。
- 控制器的功能是负责协调并控制计算机各部件执行程序的指令序列，包括取指令、分析指令和执行指令；
- 运算器的功能是对数据进行加工
功能
- 1）指令控制。完成取指令、分析指令和执行指令的操作，即程序的顺序控制。
- 2）操作控制。一条指令的功能往往由若干操作信号的组合来实现。CPU管理并产生由内存取出的每条指令的操作信号，把各种操作信号送往相应的部件，从而控制这些部件按指令的要求进行动作。
- 3）时间控制。对各种操作加以时间上的控制。时控制要为每条指令按时间顺序提供应有的控制信号。
- 4）数据加工。对数据进行算术和逻辑运算。
- 5）中断处理。对计算机运行过程中出现的异常情况和特殊请求进行处理。

5.1.2 CPU的基本结构

运算器
- 功能：接收从控制器送来的命令并执行相应的动作，对数据进行加工处理。
- 组成：
  - 算术逻辑单元（ALU）。主要功能是进行算术/逻辑运算。
  - 暂存寄存器。用于暂存从主存读来的数据，该数据不能存放在通用寄存器中，否则会破坏其原有内容。暂存寄存器对应用程序员是透明的。
  - 累加寄存器（ACC）。它是一个通用寄存器，用于暂时存放ALU运算的结果信息，可以作为加法运算的一个输入端。
  - 通用寄存器组。如AX、BX、CX、DX、SP等，用于存放操作数（包括源操作数、目的操作数及中间结果）和各种地址信息等。SP是堆栈指针，用于指示栈顶的地址。
  - 程序状态字寄存器（PSW）。保留由算术逻辑运算指令或测试指令的结果而建立的各种状态信息，如溢出标志（OF）、符号标志（SF）、零标志（ZF）、进位标志（CF）等。PSW中的这些位参与并决定微操作的形成。
  - 移位器。对操作数或运算结果进行移位运算。
  - 计数器（CT）。控制乘除运算的操作步数。
控制器
- 功能：协调并控制计算机各部件执行程序的指令序列，基本功能如下：
  - 分析指令：操作码译码（分析本条指令要完成什么操作）；产生操作数的有效地址。
  - 执行指令：根据分析指令得到的“操作命令”和“操作数地址”，形成操作信号控制序列，控制运算器、存储器以及I/O设备完成相应操作
  - 中断处理：管理总线及输入输出；处理异常情况（如掉电）和特殊请求（如打印机请求打印字符）。
- 组成：
  - 程序计数器（PC）。用于指出欲执行指令在主存中的存放地址。CPU根据PC的内容去主存中取指令。因程序中指令（通常）是顺序执行的，所以PC有自增功能。容量：log₂存储容量
  - 指令寄存器（IR）。用于保存当前正在执行的那条指令。容量：指令字长
  - 指令译码器。仅对操作码字段进行译码，向控制器提供特定的操作信号。
  - 存储器地址寄存器（MAR）。用于存放要访问的主存单元的地址。容量：log₂存储容量
  - 存储器数据寄存器（MDR）。用于存放向主存写入的信息或从主存读出的信息。容量：存储字长
  - 时序系统。用于产生各种时序信号，它们都由统一时钟（CLOCK）分频得到。
  - 微操作信号发生器。根据IR的内容（指令)、PSW的内容（状态信息）及时序信号，产生控制整个计算机系统所需的各种控制信号，其结构有组合逻辑型和存储逻辑型两种。
基本架构图
- 用户可见寄存器：通用寄存器组、程序状态字寄存器、程序计数器；可对这类寄存器编程
- 用户不可见的寄存器：存储器地址寄存器、存储器数据寄存器、指令寄存器、暂存寄存器；不可对这类寄存器编程

5.2 指令执行过程

5.2.1 指令周期

概念
- 指令周期：CPU从主存中取出并执行一条指令的时间称为指令周期，不同指令的指令周期可能不同。
- 机器周期：也称节拍或T周期，指令周期常用若干机器周期来表示，它是CPU操作的最基本单位。
- 时钟周期：一个机器周期包含若干时钟周期。
图(a)为定长的机器周期，每个机器周期包含4个节拍(T)；图(b)所示为不定长的机器周期，每个机器周期包含的节拍数可以为4个，也可以为3个。

每个指令周期内机器周期数可以不等，每个机器周期内的节拍数也可以不等。
指令周期流程

一个完整的的指令周期应包括取指、间址、执行和中断4个周期。

上述4个工作周期都有CPU访存操作，只是访存的目的不同。取指周期是为了取指令，间址周期是为了取有效地址，执行周期是为了取操作数，中断周期是为了保存程序断点。

为了区别不同的工作周期，在CPU内设置4个标志触发器FE、IND、EX和INT，它们分别对应取指、间址、执行和中断周期，并以“1”状态表示有效，分别由1→FE、1→IND、1→EX和1→NT这4个信号控制。

5.2.2 指令周期的数据流

取指周期

任务：取指周期的任务是根据PC中的内容从主存中取出指令代码并存放在IR中

数据流：
- PC-①->MAR-②->地址总线-③->主存
  - 当前指令地址送至存储器地址寄存器，记做：(PC)→ MAR
- CU发出读命令-④->控制总线-⑤->主存
  - CU发出读信号，经控制总线传到主存，记做：1→R
- 主存-⑥->数据总线-⑦->MDR-⑧->IR (存放指令)
  - 将MAR所指主存内容经数据总线送入MDR，记做：M(MAR)→MDR
  - 将MDR中的内容（此时是指令）送入IR，记做：(MDR)→IR
- CU发出控制信号-⑨->PC内容加1
  - CU发出控制信号，形成下一条指令地址，记做：(PC)+1→PC
间址周期

任务：间址周期的任务是取操作数有效地址。

数据流：
- Ad(IR) (或MDR)-①->MAR-②->地址总线-③->主存
  - 将指令的地址码送入MAR，记做：Ad(IR)→ MAR或Ad(MDR)→ MAR
- CU发出读命令-④->控制总线-⑤->主存
  - CU发出控制信号，启动主存做读操作，记做：1→R
- 主存-⑥->数据总线-⑦->MDR (存放有效地址)
  - 将MAR所指主存中的内容经数据总线送入MDR，记做：M(MAR)→ MDR
  - 将有效地址送至指令的地址码字段，记做：（MDR）→ Ad（IR）
其中，Ad(IR)表示取出IR中存放的指令字的地址字段
执行周期

执行周期的任务是根据IR中的指令字的操作码和操作数通过ALU操作产生执行结果。

不同指令的执行周期操作不同，因此没有统一的数据流向。
中断周期

任务：处理中断请求。暂停当前任务去完成其他任务，为了能够恢复当前任务，需要保存断点。

一般使用堆栈来保存断点，这里用SP表示栈顶地址，假设SP指向栈顶元素，进栈操作是先修改指针，后存入数据。

数据流：
- CU控制将SP减1，SP-①->MAR-②->地址总线-③->主存
  - CU控制将SP减1，修改后的地址送入MAR记做：(SP)-1 → SP，(SP)→ MAR
    
    本质上是将断点存入某个存储单元，假设其地址为a，故可记做：a→MAR
- CU发出写命令-④->控制总线-⑤->主存
  - CU发出控制信号，启动主存做写操作，记做：1→ W
- PC-⑥->MDR-⑦->数据总线-⑧->主存 (程序断点存入主存)
  - 将断点（PC内容）送入MDR，记做：(PC)→ MDR
- CU (中断服务程序的入口地址) -⑨->PC
  - CU控制将中断服务程序的入口地址（由向量地址形成部件产生）送入PC，记做：向量地址→PC

5.2.3 指令执行方案

一个指令周期通常要包括几个时间段(执行步骤)，每个步骤完成指令的一部分功能，几个依次执行的步骤完成这条指令的全部功能。

单指令周期
- 特点：对所有指令都选用相同的执行时间来完成，指令之间串行执行。
  
  指令之间串行执行，即下一条指令只能在前一条指令执行结束后才能启动。
- 时钟周期：时钟周期取决于执行时间最长的指令的执行时间。
  
  对于那些本来可以在更短时间内完成的指令，要使用较长的周期来完成，会降低整个系统的运行速度。
多指令周期
- 特点：对不用类型的指令选用不同的执行步骤来完成，指令之间串行执行。
- 时钟周期：可选用不同个数的时钟周期来完成不同指令的执行过程，需要更复杂的硬件设计。
流水线方案
- 特点：指令之间并行执行。
- 时钟周期：在每一个时钟周期启动一条指令，尽量让多条指令同时运行，但各自处在不同的执行步骤中。

5.3 数据通路的功能和基本结构

5.3.1 数据通路的功能

数据通路：数据在功能部件之间传送的路径。

数据通路描述了信息从什么地方开始，中间经过哪个寄存器或多路开关，最后传送到哪个寄存器，这些都需要加以控制。
构成：包括数据通路上流经的部件，如ALU、通用寄存器、状态寄存器、异常和中断处理逻辑等。

数据通路由控制部件控制，控制部件根据每条指令功能的不同生成对数据通路的控制信号。
功能：实现CPU内部的运算器与寄存器及寄存器之间的数据交换。

5.3.2 数据通路的基本结构

基本结构类型
- CPU 内部单总线方式：将所有寄存器的输入和输出端连接到一条公共通路上
  - 结构比较简单，但数据传输存在较多的冲突现象，性能较低
- CPU内部三总线方式：将所有寄存器入的输入和输出端连接到多条公共通路上
  - 同时在多个总线上传送不同的数据，效率提高
- 专用数据通路方式：根据指令执行过程中的数据和地址的流动方向安排连接线路
  - 避免使用共享的总线，性能较高，但硬件量大
CPU内部单总线数据通路
- 寄存器之间的数据传送
  
  寄存器之间的数据传送可通过CPU 内部总线完成。
  
  上图中，以PC寄存器为例，把PC内容送至MAR，实现传送操作的流程及控制信号为
```
(PC)→Bus						PCout有效，PC内容→总线
Bus→MAR							MARin有效，总线→MAR
```
- 主存与CPU之间的数据传送
  
  主存与CPU之间的数据传送也要借助CPU内部总线完成。
  
  以CPU从主存读取指令为例，实现传送操作的流程及控制信号为
```
(PC)→Bus→MAR					PCout和MARin有效，现行指令地址→MAR
1→R								CU发读命令(过控制总线发出，图中未画出）
MEM(MAR)→MDR					MDRin有效
MDR→Bus→IR						MDRout和IRin有效，现行指令→IR
```
- 执行算术或逻辑运算
  
  执行算术或逻辑操作时，由于ALU本身是没有内部存储功能的组合电路，因此如要执行加法运算，相加的两个数必须在ALU的两个输入端同时有效。
  
  以一条加法指令为例，微操作序列及控制信号为：
```
Ad(IR)→Bus→MAR					MDRout和MARin有效
1→R								CU发读命令
MEM(MAR)→MDR			  		MDRin有效
MDR→Bus→Y						MDRout和Yin有效，操作数→Y
(ACC)+(Y)→Z						ACCout和ALUin有效，CU向ALU发送加命令
Z→ACC							Zout和ACCin有效，结果→ACC
```

5.4 控制器的功能和工作原理

5.4.1 控制器的结构和功能

控制器的结构

下图介绍了计算机硬件系统的五大功能部件及其连接关系。它们通过数据总线、地址总线和控制总线连接在一起，其中点画线框内的是控制器部件。
- 运算器部件通过数据总线与内存储器、输入设备和输出设备传送数据。
- 输入设备和输出设备通过接口电路与总线相连接。
- 内存储器、输入设备和输出设备从地址总线接收地址信息，从控制总线得到控制信号，通过数据总线与其他部件传送数据。
- 控制器部件从数据总线接收指令信息，从运算器部件接收指令转移地址，送出指令地址到地址总线，还要向系统中的部件提供它们运行所需要的控制信号。
控制的功能
- 从主存中取出一条指令，并指出下一条指令在主存中的位置。
- 对指令进行译码或测试，产生相应的操作控制信号，以便启动规定的动作。
- 指挥并控制 CPU、主存、输入和输出设备之间的数据流动方向。

5.4.2 硬布线控制器

硬布线控制器的基本原理是根据指令的要求、当前的时序及外部和内部的状态，按时间的顺序发送一系列微操作控制信号。它由复杂的组合逻辑门电路和一些触发器构成，因此又称组合逻辑控制器。

硬布线控制单元图

指令的操作码是决定控制单元发出不同操作命令（控制信号）的关键。为了简化控制单元（CU）的逻辑，将指令的操作码译码和节拍发生器从CU分离出来，便可得到简化的控制单元图，如下图所示。
- 输入：
  - 经指令译码器译码产生的指令信息。
  - 时序系统产生的机器周期信号和节拍信号。
  - 来自执行单元的反馈信息即标志。
- 输出：
  - CPU内部的控制信号：寄存器之间的数据传输、PC的修改、控制ALU进行相应的运算
  - 到控制总线的控制信号：
    
    到存储器：访存控制信号MREQ、读命令RD、写命令WR
    到I/O设备：访问I/O设备的控制信号IO
    中断响应信号INTA、总线响应信号HLDA
硬布线控制器的微操作

微操作命令分析。控制单元具有发出各种操作命令（控制信号）序列的功能。这些命令与指令有关，而且必须按一定次序发出，才能使机器有序地工作。

执行程序的过程中，对于不同的指令，控制单元需发出各种不同的微操作命令。一条指令分为3个工作周期：取指周期、间址周期和执行周期。下面分析各个子周期的微操作命令。
- 取指周期的微操作命令。无论是什么指令，取指周期都需有下列微操作命令：
```
(PC)→MAR					现行指令地址→MAR
1→R							命令存储器读
M(MAR)→MDR					现行指令从存储器中读至MDR
(MDR)→IR					现行指令→IR
OP(IR)→IR					指令的操作码→CU译码
(PC)+1→PC					形成下一条指令的地址
```
- 间址周期的微操作命令。间址周期完成取操作数地址的任务，具体微操作命令如下：
```
Ad(IR)→MAR					将指令字中的地址码（形式地址）→MAR
1→R							命令存储器读
M(MAR)→MDR					将有效地址从存储器读至MDR
```
- 执行周期的微操作命令。执行周期的微操作命令视不同指令而定。
  
  a.非访存指令。
```
CLA							清ACC
COM							取反
SHR							算术右移
CSL							循环左移
STP							停机指令
```
  b.访存指令
```
ADD X						加法指令
Ad(IR)→MAR,1→R
M(MAR)→MDR
(ACC)+(MDR)→ACC
STA X						存数指令
Ad(IR)→MAR,1→W
(ACC)→MDR
LDA X						取数指令
```
  c.转移指令
```
JMP X						无条件转移指令
BAN X						条件转移指令（负则转）
```
CPU的控制方式：产生不同微操作命令序列所用的时序控制方式。
- 同步控制方式。所谓同步控制方式，是指系统有一个统一的时钟，所有的控制信号均来自这个统一的时钟信号。通常以最长的微操作序列和最烦琐的微操作作为标准，采取完全统一的、具有相同时间间隔和相同数目的节拍作为机器周期来运行不同的指令。
  
  同步控制方式的优点是控制电路简单，缺点是运行速度慢。
- 异步控制方式。异步控制方式不存在基准时标信号，各部件按自身固有的速度工作，通过应答方式进行联络。
  
  异步控制方式的优点是运行速度快，缺点是控制电路比较复杂。
- 联合控制方式。联合控制方式是介于同步、异步之间的一种折中。这种方式对各种不同的指令的微操作实行大部分采用同步控制、小部分采用异步控制的办法。
硬布线控制器设计步骤
- 分析每个阶段的微操作序例
- 选择CPU的控制方式
- 安排微操作时序
- 电路设计

5.4.3 微程序控制器

微程序控制器采用存储逻辑实现，也就是把微操作信号代码化，使每条机器指令转化成为一段微程序并存入一个专门的存储器（控制存储器）中，微操作控制信号由微指令产生。

微程序控制的基本概念

微程序设计思想就是将每条机器指令编写成一个微程序，每个微程序包含若干微指令，每条微指令对应一个或几个微操作命令。

这些微程序可以存到一个控制存储器中，用寻址用户程序机器指令的办法来寻址每个微程序中的微指令。
- 微命令与微操作
  - 一条机器指令可以分解成一个微操作序列，这些微操作是计算机中最基本的、不可再分解的操作。
  - 在微程序控制的计算机中，将控制部件向执行部件发出的各种控制命令称为微命令，它是构成控制序列的最小单位。
  - 微命令和微操作是一一对应的。微命令是微操作的控制信号，微操作是微命令的执行过程。
  - 微命令有相容性和互斥性之分。
    - 相容性微命令是指那些可以同时产生、共同完成某一些微操作的微命令；
    - 而互斥性微命令是指在机器中不允许同时出现的微命令。
- 微指令与微周期
  - 微指令是若千微命令的集合。存放微指令的控制存储器的单元地址称为微地址。
    - 操作控制字段，又称微操作码字段，用于产生某一步操作所需的各种操作控制信号
    - 顺序控制字段，又称微地址码字段，用于控制产生下一条要执行的微指令地址。
  - 微周期是指执行一条微指令所需的时间，通常为一个时钟周期。
- 主存储器与控制存储器
  - 主存储器用于存放程序和数据，在CPU外部，用RAM实现
  - 控制存储器 (CM) 用于存放微程序，在CPU内部，用ROM实现
- 程序与微程序
  - 程序是指令的有序集合，用于完成特定的功能
  - 微程序是微指令的有序集合，一条指令的功能由一段微程序来实现
- 寄存器区分
  - 地址寄存器 (MAR)。用于存放主存的读/写地址。
  - 微地址寄存器 (CMAR)。用于存放控制存储器的读/写微指令的地址，
  - 指令寄存器 (IR)。用于存放从主存中读出的指令。
  - 微指令寄存器(CMDR或μIR)。用于存放从控制存储器中读出的微指令。
微程序控制器组成和工作过程
- 微程序控制器的基本组成
  - 控制存储器。它是微程序控制器的核心部件，用于存放各指令对应的微程序，控制存储器可用只读存储器ROM构成
  - 微指令寄存器。用于存放从CM中取出的微指令，它的位数同微指令字长相等
  - 微地址形成部件。用于产生初始微地址和后维微地址，以保证微指令的连续执行
  - 微地址寄存器。接收微地址形成部件送来的微地址，为在CM中读取微指令作准备
- 微程序控制器的工作过程
  - ①执行取微指令公共操作。具体的执行是:在机器开始运行时，自动将取指微程序的入口地址送入CMAR，并从CM中读出相应的微指令送入CMDR。取指微程序的入口地址一般为CM的0号单元，当取指微程序执行完后，从主存中取出的机器指令就已存入指令寄存器中
  - ②由机器指令的操作码字段通过微地址形成部件产生该机器指令所对应的微程序的入口地址，并送入CMAR
  - ③从CM中逐条取出对应的微指令并执行。
  - ④执行完对应于一条机器指令的一个微程序后，又回到取指微程序的入口地址，继续第①步，以完成取下一条机器指令的公共操作。
- 微程序和机器指令
  
  一条机器指令对应一个微程序。由于任何机器指令的取指令操作都是相同的，因此可将取指令操作的微命令统一编成一个微程序，这个微程序只负责将指令从主存单元中取出并送至指令寄存器。
微指令的编码方式

微指令的编码方式又称微指令的控制方式，是指如何对微指令的控制字段进行编码，以形成控制信号。编码的目标是在保证速度的情况下，尽量缩短微指令字长。
- 直接编码（直接控制）方式
  - 编码方式：微指令的微命令字段中每位都代表一个微命令。选用或不选用某个微命令，只要将表示该微命令的对应位设置成1或0即可。每个微命令对应并控制数据通路中的一个微操作。
  微指令的直接编码方式如下图所示。
  - 优点：简单、直观，执行速度快，操作并行性好
  - 缺点：微指令字长过长，n个微命令就要求微指令的操作字段有n位，造成控制存储器容量极大
- 字段直接编码方式
  - 编码方式：将微指令的微命令字段分成若干小字段，把互斥性微命令组合在同一字段中，把相容性微命令组合在不同字段中，每个字段独立编码，每种编码代表一个微命令且各字段编码含义单独定义与其他字段无关。
  - 优点：可以缩短微指令字长
  - 缺点：因为要通过译码电路后再发出微命令，因此比直接编码方式慢
  - 分段原则：
    
    ①互斥性微命令分在同一段内，相容性微命今分在不同段内。
    
    ②每个小段中包含的信息位不能太多，否则将增加译码线路的复杂性和译码时间
    
    ③一般每个小段还要留出一个状态，表示本字段不发出任何微命令。因此，当某字段的长度为3位时，最多只能表示7个互斥的微命令，通常用000表示不操作
- 字段间接编码方式
  - 编码方式：一个字段的某些微命令需由另一个字段中的某些微命令来解释，由于不是靠字段直接译码发出的微命令，因此称为字段间接编码，又称隐式编码。
  - 优点：可进一步缩短微指令字长
  - 缺点：但因削弱了微指令的并行控制能力，因此通常作为字段直接编码方式的一种辅助手段。
微指令的地址形成方式

后继微地址的形成主要有以下两大基本类型：
- 直接由微指令的下地址字段指出。微指令格式中设置一个下地址字段，由微指令的下地址字段直接指出后维微指令的地址，这种方式又称断定方式。
- 根据机器指令的操作码形成。机器指令取至指令寄存器后，微指令的地址由操作码经微地址形成部件形成
- 其他方式：
  
  ①增量计数器法，即(CMAR)+1→CMAR，适用于后继微指令的地址连续的情况
  ②根据各种标志决定微指令分支转移的地址。
  ③通过测试网络形成。
  ④由硬件直接产生微程序入口地址，

微指令的格式

微指令格式与微指令的编码方式有关，通常分水平型微指令和垂直型微指令两种。

水平型微指令。

从编码方式看，直接编码、字段直接编码、字段间接编码和混合编码都属于水平型微指令。一条水平型微指令定义并执行几种并行的基本操作，指令字中的一位对应一个控制信号，有输出时为1，否则为0。
- 优点是微程序短，执行速度快
- 缺点是微指令长，编写微程序较麻烦
垂直型微指令。

垂直型微指令的特点是采用类似机器指令操作码的方式，在微指令中设置微操作码字段，采用微操作码编译法，由微操作码规定微指令的功能。一条垂直型微指令只能定义并执行一种基本操作。
- 微指令短、简单、规整，便于编写微程序
- 微程序长执行速度慢，工作效率低
混合型微指令：在垂直型的基础上增加一些不太复杂的并行操作。

微指令较短，仍便于混合型微指令编写;微程序也不长，执行速度加快。

水平型微指令和垂直型微指令的比较

比较	水平微指令	垂直微指令
并行能力	强	弱
执行时间	长	长
微指令字长短	指令字较长；微程序短	微指令字较短；微程序长
编程难易程度	难	简单

微程序控制单元的设计步骤
- 写出对应机器指令的微操作命令及节拍安排。
- 确定微指令格式。
- 编写微指令码点。

硬布线和微程序控制器的特点

对比	微程序控制器	硬布线控制器
工作原理	微操作控制信号以微程序的形式存放在控制存储器中，执行指令时读出即可	微操作控制信号由组合逻辑电路根据当前的指令码、状态和时序，即时产生
执行速度	慢	快
规整性	较规整	烦琐、不规整
应用场合	CISC CPU	RISC CPU
易扩充性	易扩充修改	困难

5.5 异常和中断机制

5.5.1 异常和中断的基本概念

异常：由CPU内部产生的意外事件被称为异常，有些教材中也称内中断。

是CPU执行一条指令时，由CPU在其内部检测到的、与正在执行的指令相关的同步事件；
中断：由来自CPU外部的设备向CPU发出的中断请求被称为中断，通常用于信息的输入和输出，有些教材中也称外中断。

是一种典型的由外部设备触发的、与当前正在执行的指令无关的异步事件。

5.5.2 异常和中断的分类

异常的分类
- 故障（Fault）
  - 定义：指在引起故障的指令启动后、执行结束前被检测到的异常事件。
  - 例：指令译码时，出现“非法操作码”；取数据时，发生**“缺段”或“缺页"**；执行整数除法指令时，发现“除数为0”等。
  - 处理：内核程序修复后会把CPU使用权还给应用程序，让它继续执行。（如缺页中断）
    
    对于“非法操作码”和“除数为0”等，因为无法通过异常处理恢复故障，必需终止程序。
- 自陷（Trap）
  - 定义：也称陷阱或陷入，它是预先安排的一种“异常”事件，就像预先设定的“陷阱”一样。
  - 例：“断点调试”、单步跟踪、系统调用
  - 处理：CPU在执行完自陷指令后，自动根据不同“陷阱”类型进行相应的处理，然后返回到自陷指令的下一条指令执行。注意，当自陷指令是转移指令时，并不是返回到下一条指令执行，而是返回到转移目标指令执行。
  故障和自陷异常属于软件中断（程序性异常）；终止和外中断属于硬件中断
- 终止（Abort）
  - 定义：由致命错误起，内核程序无法修复该错误，一股直接终止该应用程序。
  - 例：如控制器出错、存储器校验错误、总线错误等；此时，只能调出中断服务程序来重启系统。
中断的分类

中断是指来自CPU外部、与CPU执行指令无关的事件引起的中断，包括IO设备发出的IO中断（如键盘输入、打印机缺纸等），或发生某种特殊事件（如用户按Esc键、定时器计数时间到）等。

外部I/O设备通过特定的中断请求信号线向CPU提出中断请求，CPU每执行完一条指令就检查中断请求信号线，如果检测到中断请求，则进入中断响应周期。
- 可屏蔽中断
  
  指通过可屏蔽中断请求线INTR向CPU发出的中断请求。CPU可以通过在中断控制器中设置相应的屏蔽字来屏蔽它或不屏蔽它，被屏蔽的中断请求将不被送到CPU。
- 不可屏蔽中断
  
  指通过专门的不可屏蔽中断请求线NMI向CPU发出的中断请求，通常是非常紧急的硬件故障，如电源掉电等。这类中断请求信号不可被屏蔽，以让CPU快速处理这类紧急事件。
中断和异常的不同点
- “缺页”或“溢出”等异常事件是由特定指令在执行过程中产生的，而中断不和任何指令相关联，也不阻止任何指令的完成。
- 异常的检测由CPU自身完成，不必通过外部的某个信号通知CPU。对于中断，CPU必须通过中断请求线获取中断源的信息，才能知道哪个设备发生了何种中断。

5.5.3 异常和中断响应过程

CPU对异常和中断响应的过程可分为：关中断、保存断点和程序状态、识别异常和中断并转到相应的处理程序。

关中断

在保存断点和程序状态期间，不能被新的中断打断，因此要禁止响应新的中断，即关中断。

通常通过设置**“中断允许”（IF）触发器**来实现，
- 若IF置为1，则为开中断，表示允许响应中断；
- 若IF置为0，则表示关中断，表示不允许响应中断。
保存断点和程序状态

为了能在异常和中断处理后正确返回到被中断的程序继续执行，必须将程序的断点（返回地址）送到栈或特定寄存器中。通常保存在栈中，这是为了支持异常或中断的嵌套。

异常和中断处理后可能还要回到被中断的程序继续执行，被中断时的程序状态字寄存器PSWR的内容也需要保存在栈或特定寄存器中，在异常和中断返回时恢复到PSWR中。
识别异常和中断并转到相应的处理程序

异常和中断源的识别有软件识别和硬件识别两种方式。
- 软件识别方式是指CPU设置一个异常状态寄存器，用于记录异常原因。操作系统使用一个统一的异常或中断查询程序，按优先级顺序查询异常状态寄存器，以检测异常和中断类型，先查询到的先被处理，然后转到内核中相应的处理程序。
- 硬件识别方式又称向量中断，异常或中断处理程序的首地址称为中断向量，所有中断向量都存放在中断向量表中。每个异常或中断都被指定一个中断类型号。在中断向量表中，类型号和中断向量一一对应，因而可以根据类型号快速找到对应的处理程序。

5.6 指令流水线

5.6.1 指令流水线的基本概念

可从两方面提高处理机的并行性：

①时间上的并行技术，将一个任务分解为几个不同的子阶段，每个阶段在不同的功能部件上并行执行，以便在同一时刻能够同时执行多个任务，进而提升系统性能，这种方法被称为流水线技术。

②空间上的并行技术，在一个处理机内设置多个执行相同任务的功能部件，并让这些功能部件并行工作，这样的处理机被称为超标量处理机。

指令流水的定义

一条指令的执行过程可以分为以下5个阶段：
- 取指（IF）：从指令存储器或Cache 中取指令。
- 译码/读寄存器（ID）：操作控制器对指令进行译码，同时从寄存器堆中取操作数。
- 执行/计算地址（EX)：执行运算操作或计算地址。
- 访存（MEM）：对存储器进行读写操作。
- 写回（WB）：将指令执行结果写回寄存器堆。
把k+1条指令的取指阶段提前到第k条指令的译码阶段，从而将第k+1条指令的译码阶段与第k条指令的执行阶段同时进行，如图所示。

理想情况下，每个时钟周期都有一条指令进入流水线，每个时钟周期都有一条指令完成，每条指令的时钟周期数（即CPI）都为1。

为了利于实现指令流水线，指令集应具有如下特征：
- 1）指令长度应尽量一致，有利于简化取指令和指令译码操作。否则，取指令所花时间长短不一，使取指部件极其复杂，且也不利于指令译码。
- 2）指令格式应尽量规整，尽量保证源寄存器的位置相同，有利于在指令未知时就可取寄存器操作数，否则须译码后才能确定指令中各寄存器编号的位置。
- 3）采用Load/Store指令，其他指令都不能访问存储器，这样可把Load/Store指令的地址计算和运算指令的执行步骤规整在同一个周期中，有利于减少操作步骤。
- 4）数据和指令在存储器中“对齐”存放。这样，有利于减少访存次数，使所需数据在一个流水段内就能从存储器中得到。
流水线的表示方法

通常用时空图来直观地描述流水线的执行情况。

在时空图中，横坐标表示时间，它被分割成长度相等的时间段T；纵坐标为空间，表示当前指令所处的功能部件。

只有大量连续任务不断输入流水线，才能充分发挥流水线的性能，而指令的执行正好是连续不断的，非常适合采用流水线技术。对于其他部件级流水线，如浮点运算流水线，同样也仅适合于提升浮点运算密集型应用的性能，对于单个运算是无法提升性能的。

5.6.2 流水线的基本实现

在单周期实现中，这5个功能段是串连在一起的，如下图所示。

虽然不是所有指令都必须经历完整的5个阶段，但只能以执行速度最慢的指令作为设计其时钟周期的依据，单周期CPU的时钟频率取决于数据通路中的关键路径（最长路径），因此单周期CPU指令执行效率不佳。

流水线的数据通路

一个5段流水线数据通路如下图所示。
- IF段包括程序计数器（PC）、指令存储器、下条指令地址的计算逻辑；
- ID段包括操作控制器、取操作数逻辑、立即数符号扩展模块；
- EX段主要包括算术逻辑单元（ALU）、分支地址计算模块；
- MEM段主要包括数据存储器读写模块；
- WB段主要包括寄存器写入控制模块。
每个流水段后面都需要增加一个流水寄存器，用于锁存本段处理完成的数据和控制信号，以保证本段的执行结果能在下个时钟周期给下一流水段使用。
流水线的控制信号

每个流水寄存器中保存的信息包括：
- ①后面流水段需要用到的所有数据信息，包括PC+4、指令、立即数、目的寄存器、ALU运算结果、标志信息等，它们是前面阶段在数据通路中执行的结果，
- ②前面传递过来的后面各流水段要用到的所有控制信号。
流水线的执行过程

由于流水线的特殊结构，所有指令都需要完整经过流水线的各功能段，只不过某些指令在某些功能段内没有任何实质性的操作，只是等待一个时钟周期，这也就意味着单条指令的执行时间还是5个功能段时间延迟的总和。
- 取指（IF）
  
  从存储器中根据程序计数器PC的值取出一条指令，并将其放入指令寄存器IR中，同时更新PC的值为下一条指令的地址。
- 译码/读寄存器（ID）
  
  对IR中的指令进行译码，确定指令的类型、操作码和操作数，以及要使用的寄存器或立即数。如果是转移指令，还要计算转移目标地址和判断转移条件。
- 执行/计算地址（EX）
  
  根据指令的类型和操作码，对ID阶段读出的操作数进行相应的运算或操作，如加减乘除、逻辑运算、移位等。运算结果暂存在ALU输出寄存器中。
- 访存（MEM）
  
  如果指令需要访问存储器，如加载或存储指令，那么在这个阶段用EX阶段计算出的有效地址从存储器中读出或写入数据。如果是分支指令，还要判断是否需要更新PC的值为转移目标地址。
- 写回（WB）
  
  将EX或MEM阶段得到的结果写回到目标寄存器中，完成一条指令的执行。

5.6.3 流水线的冒险与处理

在指令流水线中，可能会遇到一些情况使得流水线无法正确执行后续指令而引起流水线阻塞或停顿，这种现象称为流水线冒险。

结构冒险（资源冲突）

由于多条指令在同一时刻争用同一资源而形成的冲突，又称结构相关。

解决办法：
- 前一指令访存时，使后一条相关指令（以及其后续指令）暂停一个时钟周期。
- 资源重复配置：单独设置数据存储器和指令存储器，使取数和取指令操作各自在不同的存储器中进行。
数据冒险（数据冲突）

在一个程序中，下一条指令会用到当前指令计算出的结果，此时这两条指令发生数据冲突。
- 写后读（ReadAfterWrite，RAW）相关：表示当前指令将数据写入寄存器后，下一条指令才能从该寄存器读取数据。否则，先读后写，读到的就是错误（旧）数据。
- 读后写（WriteAfterRead，WAR）相关：表示当前指令读出数据后，下一条指令才能写该寄存器。否则，先写后读，读到的就是错误（新）数据。
- 写后写（WriteAfterWrite，WAW）相关：表示当前指令写入寄存器后，下一条指令才能写该寄存器。否则，下一条指令在当前指令之前写，将使寄存器的值不是最新值。
解决办法：
- 把遇到数据相关的指令及其后续指令都暂停一至几个时钟周期，直到数据相关问题消失后再继续执行。
  
  可分为硬件阻塞(stall) 和软件插入“NOP”两种方法。
- 数据旁路技术（转发机制）：从执行阶段结果出来后送回ALU输入端
- 编译优化：通过编译器调整指令顺序来解决数据相关。
控制冒险（控制冲突）

当流水线遇到转移指令和其他改变PC值的指令，必需等待分支处理结果而造成断流时，会引起控制相关。

解决办法：
- 转移指令分支预测。简单预测（永远猜ture或false）、动态预测（根据历史情况动态调整）
- 预取转移成功和不成功两个控制流方向上的目标指令
- 加快和提前形成条件码
- 提高转移方向的猜准率

5.6.4 流水线的性能指标

流水线的吞吐率（TP）

吞吐率是指在单位时间内流水线所完成的任务数量，或是输出结果的数量。其公式如下：
$TP=\frac {n} {T_k}$
式中， $n$ 是任务数， $T_K$ 是处理完n个任务所用的总时间。

设k为流水段的段数，Δt为时钟周期，在输入流水线任务连续的情况下，一条k段流水线能在k+n-1个时钟周期完成n个任务。流水线吞吐率为
$TP=\frac {n} {(k+n-1)Δt}$
连续输入的任务数 $n\to\infty$ 时，得到最大吞吐率为 $TP_{max}=1/Δt$ 。
流水线的加速比（S）

完成同样一批任务，不使用流水线所用的时间与使用流水线所用的时间之比。

流水线加速比的基本公式为
$S=\frac{T_0}{T_k}$
式中， $T_0$ 表示不使用流水线的总时间； $T_k$ 表示使用流水线的总时间。

一条k段流水线完成n个任务所需的时间为 $T_k=(k+n-1)Δt$ 。顺序执行n个任务时，所需的总时间为 $T_0=knΔt$ 。将 $T_0$ 和 $T_k$ 代入上式，得到流水线加速比为
$S=\frac{knΔt}{(k+n-1)Δt}=\frac{kn}{k+n-1}$
连续输入的任务数 $n\to\infty$ 时，得到最大加速比为 $S_{max}=k$ 。
效率

流水线的设备利用率称为流水线的效率。

在时空图上，流水线的效率定义为完成n个任务占用的时空区有效面积与n个任务所用的时间与k个流水段所围成的时空区总面积之比。

5.6.5 高级流水线技术

超标量流水线技术

也称动态多发射技术，每个时钟周期内可并发多条独立指令，以并行操作方式将两条或多条指令编译并执行。
- 要配置多个功能部件
- 指令是按顺序发射执行，不能调整指令的执行顺序
- 通过编译优化技术，把可并行执行的指令搭配起来
超长指令字技术

也称静态多发射技术，由编译程序挖掘出指令间潜在的并行性，将多条能并行操作的指令组合成一条具有多个操作码字段的超长指令字（可达几百位），为此需要采用多个处理部件
超流水线技术

在流水线一个时钟周期再划分多个功能段，通过提高流水线主频的方式来提升流水线性能。

但是流水线级数越多，用于流水寄存器的开销就越大，因而流水线级数是有限制的，并不是越多越好。
- 超流水线CPU在流水线充满后，每个时钟周期还是执行一条指令，CPI=1，但其主频更高；
- 多发射流水线CPU每个时钟周期可以处理多条指令，CPI<1，相对而言，多发射流水线成本更高，控制更复杂。

5.7 多处理器的基本概念

5.7.1 SISD、SIMD、MIMD的基本概念

单指令流单数据流（SISD）结构
- 特性：在一段时间内仅执行一条指令，按指令流规定的顺序串行执行指令流中的若干条指令。
  
  各指令序列只能并发、不能并行，每条指令处理一两个数据；不是数据级并行技术
- 硬件构成：传统的串行计算机结构，一个处理器和一个存储器；若采用指令流水线，需设置多个功能部件，采用多模块交叉存储器
前面介绍的内容多属于SISD结构
单指令流多数据流（SIMD）结构
- 特性：一个指令流同时对多个数据流进行处理，一般称为数据级并行技术。
  
  各指令序列只能并发、不能并行，但每条指令可同时处理很多个具有相同特征的数据
- 硬件组成：一个指令控制部件(CU)+多个处理单元/执行单元(如ALU)+多个局部存储器+一个主存储器
  
  每个处理单元虽然执行的都是同一条指令，但是每个单元都有自己的地址寄存器，这样每个单元就都有不同的数据地址。不同处理单元执行的同一条指令所处理的不同数据。
SIMD在使用for循环处理数组时最有效，比如，一条分别对16对数据进行运算的SIMD指令，如果在16个ALU中同时运算，则只需要一次运算时间就能完成运算。

SIMD在使用case或switch语句时效率最低，此时每个执行单元必须根据不同的数据执行不同的操作。
多指令流单数据流（MISD）结构

多条指令并行执行，处理同一个数据。现实中不存在这种计算机。
多指令流多数据流（MIMD）结构

MIMD是指同时执行多条指令分别处理多个不同的数据，MIMD分为多计算机系统和多处理器系统。
- 特性：各指令序列并行执行，分别处理多个不同的数据；是一种线程级并行、甚至是线程级以上并行技术
- 多计算机系统
  - 特性：各计算机之间，不能通过存取指令直接访问对方的存储器，只能通过“消息传递”相互传送数据
  - 硬件组成：由多台计算机组成，因此拥有多个处理器+多个主存储器；每台计算机拥有各自的私有存储器，物理地址空间相互独立
- 多处理器系统
  - 特性：各处理器之间，可以通过存取指令，访问同一个主存储器，可通过主存相互传送数据
  - 硬件组成：一台计算机内，包含多个处理器+一个主存储器；多个处理器共享单一的物理地址空间
向量处理器：向量处理器是SIMD的变体，是一种实现了**直接操作一维数组（向量）**指令集的CPU，而串行处理器只能处理单一数据集。
- 基本理念：将从存储器中收集的一组数据按顺序放到一组向量寄存器中，然后以流水化的方式对它们依次操作，最后将结果写回寄存器。
- 向量处理器在特定工作环境中极大地提升了性能，擅长对向量型数据并行计算、浮点数运算，常被用于超级计算机中，处理科学研究中巨大运算量
- 硬件组成：多个处理单元，多组“向量寄存器”；主存储器应采用“多个端口同时读取”的交叉多模块存储器；主存储器大小限定了机器的解题规模，因此要有大容量的、集中式的主存储器

5.7.2 硬件多线程的基本概念

为了减少线程切换过程中的开销，便诞生了硬件多线程。在支持硬件多线程的CPU中，必须为每个线程提供单独的通用寄存器组、单独的程序计数器等，线程的切换只需激活选中的寄存器，从而省略了与存储器数据交换的环节，大大减少了线程切换的开销。

硬件多线程有3种实现方式：细粒度多线程、粗粒度多线程和同时多线程（SMT)。

细粒度多线程

多个线程之间轮流交叉执行指令，多个线程之间的指令是不相关的，可以乱序并行执行。

处理器能在每个时钟周期切换线程。
粗粒度多线程

仅在一个线程出现了较大开销的阻塞时，才切换线程，如Cache 缺失。

阻塞时，新线程的指令开始执行前需要重载流水线，线程切换的开销比细粒度多线程更大。
同时多线程

同时多线程（SMT）在同一个时钟周期中，发射多个不同线程中的多条指令执行。

Intel 处理器中的超线程（Hyper-threading）就是同时多线程SMT，即在一个单处理器或单个核中设置了两套线程状态部件，共享高速缓存和功能部件。

	细粒度多线程	粗粒度多线程	同时多线程（SMT)
指令发射	各个时钟周期，轮流发射多个线程的指令	连续几个时钟周期，都发射同一线程的指令序列，流水线阻塞时，切换另一个线程	一个时钟周期内，同时发射多个线程的搭令
线程切换频率	每个时钟周期切换一次线程	只有流水线阻塞时才切换一次线程
线程切换代价	低	高，需要重载流水线
并行性	指令级并行，线程间不并行	指令级并行，线程间不并行	指令级并行，线程级并行

三种硬件多线程方式的调度示例：

5.7.3 多核处理器的基本概念

多核处理器是指将多个处理单元集成到单个CPU中，每个处理单元称为一个核（core)。

每个核可以有自己的Cache,也可以共享同一个Cacheo所有核一般都是对称的，并且共享主存储器，因此多核属于共享存储的对称多处理器。下图是不共享Cache的双核CPU结构。

在多核计算机系统中，如要充分发挥硬件的性能，必须采用多线程（或多进程）执行，使得每个核在同一时刻都有线程在执行。

多核上的多个线程是在物理上并行执行的，是真正意义上的并行执行，在同一时刻有多个线程在并行执行。而单核上的多线程是一种并发的多线程交错执行，实际上在同一时刻只有一个线程在执行。

5.7.4 共享内存多处理器的基本概念

定义

具有共享的单一物理地址空间的多处理器被称为共享内存多处理器（SMP)。

处理器通过存储器中的共享变量互相通信，所有处理器都能通过存取指令访问任何存储器的位置。注意，即使这些系统共享同一个物理地址空间，它们仍然可在自己的虚拟地址空间中单独地运行程序。
分类
- 统一存储访问（UMA）多处理器
  - 定义：每个处理器对所有存储单元的访问时间是大致相同的，即访问时间与哪个处理器提出访存请求及访问哪个字无关。
  - 结构：CPU通过前端总线和北桥芯片相连，越来越多的CPU对前端总线的争用使得前端总线成为瓶颈。
  - 分类：根据处理器与共享存储器之间的连接方式，分为基于总线、基于交叉开关网络和基于多级交换网络连接等几种处理器。
- 非统一存储访问（NUMA）多处理器
  - 定义：某些访存请求要比其他的快，具体取决于哪个处理器提出了访问请求以及访问哪个字，这是由于主存被分割并分配给了同一机器上的不同处理器或内存控制器。
  - 结构：内存控制器被集成到CPU内部，每个CPU都有独立的内存控制器。每个CPU都独立连接到一部分内存，CPU直连的这部分内存被称为本地内存。
  - 分类：处理器中不带高速缓存时，被称为NC-NUMA；处理器中带有一致性高速缓存时，被称为CC-NUMA。
  在NUMA架构下，内存的访问出现了本地和远程的区别，访问本地内存明显要快于访问远程内存。

你可能感兴趣的:(王道计算机组成原理知识点总结,考研,学习)

【深度学习】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows，论文 XD742971636 深度学习机器学习深度学习 transformer 人工智能
必读文章：https://blog.csdn.net/qq_37541097/article/details/121119988SwinTransformer:HierarchicalVisionTransformerusingShiftedWindows论文：https://arxiv.org/abs/2103.14030代码：https://github.com/microsoft/Swin-
Scikit-Learn K均值聚类对许 #Python #人工智能与机器学习 scikit-learn 聚类机器学习
Scikit-LearnK均值聚类1、K均值聚类1.1、K均值聚类及原理1.2、K均值聚类的优缺点1.3、聚类与分类的区别2、Scikit-LearnK均值聚类2.1、Scikit-LearnK均值聚类API2.2、K均值聚类初体验（寻找最佳K）2.3、K均值聚类案例1、K均值聚类K-均值（K-Means）是一种聚类算法，属于无监督学习。K-Means在机器学习知识结构中的位置如下：1.1、K均值
【15-聚类分析入门：使用Scikit-learn进行K-means聚类】是阿牛啊机器学习回归预测大数据挖掘 kmeans 聚类 python 机器学习人工智能 sklearn 性能优化
文章目录前言K-means聚类的原理Scikit-learn中的K-means实现安装与导入生成模拟数据应用K-means聚类可视化聚类结果选择K的值总结前言聚类分析是一种无监督学习方法，用于将数据集中的样本分组成若干个簇(cluster)。K-means是最广泛使用的聚类算法之一，其核心思想是将数据点分配到K个簇中，使得每个点到其簇中心的距离之和最小。在本文中，我们将介绍如何使用Scikit
LSTM 网络在强化学习中的应用 AI天才研究院 LLM大模型落地实战指南 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSTM网络在强化学习中的应用关键词：LSTM、强化学习、时序依赖、长期记忆、深度Q网络、策略梯度、Actor-Critic摘要：本文深入探讨了长短期记忆（LSTM）网络在强化学习领域的应用。我们将详细介绍LSTM的核心概念、结构和工作原理，以及它如何解决传统循环神经网络面临的长期依赖问题。文章重点分析了LSTM在强化学习中的多种应用场景，包括深度Q网络、策略梯度方法和Actor-Critic架构
数据挖掘常用算法优缺点分析天波烟客00 数据挖掘数据挖掘机器学习
领取机器学习视频教程：http://www.admin444.com/P-c8129a48常用的机器学习、数据挖掘方法有分类，回归，聚类，推荐，图像识别等。在实际应用中，一般都是采用启发式学习方式来实验。偏差&方差偏差：描述的是预测值（估计值）的期望与真实值之间的差距，偏差越大，越偏离真实数据。偏差bias其实是模型太简单而带来的估计不准确的部分---欠拟合方差：描述的是预测值的变化范围、离散程度
【机器学习与数据挖掘实战】案例11：基于灰色预测和SVR的企业所得税预测分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘灰色预测 SVR 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
Scikit-learn提供了哪些机器学习算法以及如何使用Scikit-learn进行模型训练和评估 Java资深爱好者机器学习 scikit-learn 算法
Scikit-learn库的使用一、Scikit-learn提供的机器学习算法Scikit-learn（通常简称为sklearn）是一个广泛使用的Python机器学习库，它提供了多种用于数据挖掘和数据分析的算法。Scikit-learn支持的机器学习算法可以大致分为以下几类：分类算法：支持向量机（SVM）随机森林（RandomForest）逻辑回归（LogisticRegression）朴素贝叶斯
数据挖掘常用算法 kaiyuanheshang AI 数据挖掘算法人工智能
文章目录基于机器学习~~线性/逻辑回归~~树模型~~贝叶斯~~~~聚类~~集成算法神经网络~~支持向量机~~~~降维算法~~基于机器学习线性/逻辑回归类似单层神经网络y=k*x+b树模型优点可以做可视化分析速度快结果稳定依赖前期对业务和数据的理解贝叶斯贝叶斯依赖先验概率，先验知识越准，结果越好聚类集成算法xgboostlightbgm神经网络在文本、视觉领域效果非常好。但是过程黑盒，缺乏解释性支持
通过 Docker 部署 Mastodon 服务器的教程 shelby_loo docker 服务器容器
如何使用Edu邮箱申请Azure订阅并开通免费的VPS想要免费获得Azure的VPS吗？拥有一个Edu邮箱就能让你轻松实现！Edu邮箱不仅可以帮助你申请Azure的学生订阅，还能免费使用Adobe和Notion等软件，让你的学习和工作更加便捷。如果你还没有Edu邮箱，可以参考末尾的衍生参考。在Azure100学生订阅中新建一台UbuntuVPS，并在Ubuntu下通过Docker部署Mastodo
Python学习笔记 - 探索正则表达式对象和对象匹配 Mr数据杨 Python 编程基础正则表达式 python 正则 re
在文本处理和数据清洗任务中，正则表达式无疑是一把锋利的“瑞士军刀”。它不仅能够简洁地表达复杂的字符串匹配规则，还可以在各种编程语言中实现高效的文本处理。在Python中，re库提供了强大的正则表达式功能，允许开发者轻松进行模式匹配、数据提取、验证等操作。本教程将深入探讨Python中正则表达式的高级功能，尤其是如何使用正则表达式对象及其方法来高效处理文本。我们将详细讲解如何通过re.compile
因果关系推断与机器学习 hhhh106 读书笔记大数据
因果关系定义设X和Y是两个随机变量。定义X是Y的因，即因果关系X→Y存在，当且仅当Y的取值一定会随X的取值变化而发生变化。两个变量X、Y之间有相关性往往不是我们能判断它们之间有因果关系的依据。其中包括三种情况：X是Y的因、X是Y的果、X与Y有共同原因(commoncause)。对于第三种情况，我们把这种不是因果关系的相关性叫作虚假相关(spuriouscorrelation)。机器学习模型是强大的
【中科院1区】Matlab实现黏菌优化算法SMA-RF锂电池健康状态估计算法研究 matlab科研助手 matlab 算法开发语言
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍摘要锂离子电池作为一种重要的储能器件，在电动汽车、便携式电子设备等领域发挥着至关重要的
【深度学习】因果推断与机器学习的高级实践数学建模_问题根因分析机器学习 2401_84239830 程序员深度学习机器学习数学建模
现阶段深度学习有三大特征：数据驱动：即数据训练，将数据输入到模型中进行训练；关联学习：模型基于给定训练数据集，进行关联学习；概率输出：即最后的输出，判断这个图片有“狗“的概率是多少。以数据驱动、关联学习、概率输出为特征的深度学习存在什么问题呢？以一个简单的图片识别问题为例：识别一张图片中是否有狗。在很多预测问题中，我们拿到的数据集往往都是有偏的，比如我们拿到的数据中有80%的图片中狗都在草地上，这
Qpython+Flask监控添加发送语音中文信息功能 eybk flask python 后端
对Qpython+Flask实现对小孩学习的监控-CSDN博客中html页面进行改造，利用Ajax，提交一段文字，发送到数据库，再在服务器，发送该段文件给手机端，然手机端TTS朗读出来，增加了父母监控小孩学习，自定义提醒小孩的功能。一、index.html的更改。实时**学习情况图//设置定时器，每20秒（20000毫秒）刷新一次页面setInterval(function(){location.
使用 Docker 部署 pSQL 服务器的教程 shelby_loo docker 服务器容器
如何使用Edu邮箱申请Azure订阅并开通免费VPS使用Edu邮箱不仅可以申请Azure的免费订阅来开通VPS，还可以免费使用Adobe和Notion等软件，极大地提高学习和工作的效率。如果您还没有Edu邮箱，可以参考在线笔记s3.tebi.io/notes-image/edu%E7%AC%94%E8%AE%B0.pdf获取相关信息和申请方法。新建一台UbuntuVPS并通过Docker部署pSQ
因果推断与机器学习—因果推断入门（1）樱花的浪漫因果推断机器学习人工智能计算机视觉搜索引擎深度学习算法
在机器学习被广泛应用于对人类产生巨大影响的场景（如社交网络、电商、搜索引擎等）的今天，因果推断的重要性开始在机器学习社区的论文和演讲中被不断提及。图灵奖得主YoshuaBengio在对系统2（system2，这个说法来自心理学家DanielKahneman的作品，人类大脑由两套系统构成：系统1负责快速思考，做出下意识的反应；系统2则负责比较耗时的思考，如理解事物之间的因果关系）的畅想中强调，在实现
pythonocc安装_PythonOCC开发-如何搭建开发环境和一个创建圆台例子 weixin_39884100 pythonocc安装
我本来是打算学习C++OCC的，但是感觉C++太难了，虽然OpenCasCAD里面有个MFC的例子，但是我连一个开发环境都没搭建出来。后来知道有个老外把C++OCC封装成了PythonOCC，就打算去研究一下。虽然网上百度到了资料，但是我还是慢慢摸索到处问别人，搞了两个多小时才成功的把环境搭建起来。转载出处，学习资料https://blog.csdn.net/weixin_42755384/art
《深度学习入门：梯度下降法全解析，小白必看！》 Lemon_wxk 深度学习
目录一、引言二、什么是梯度下降？2.1误差的计算2.2梯度的计算2.3参数更新2.4重复迭代三、梯度下降法的几种主要类型1.批量梯度下降（BatchGradientDescent）2.随机梯度下降（StochasticGradientDescent,SGD）3.小批量梯度下降（Mini-BatchGradientDescent）四、梯度下降的挑战与解决方案1.学习率的选择2.局部最小值与鞍点3.梯
python学习笔记——input()函数详解 blankcookie 学习笔记
1.input()函数概述功能：从标准输入中读取字符串，并且去掉末尾的换行符，最后返回数据数据类型：str-字符串2.input()函数的使用介绍方法1：直接使用input()函数print("Howoldareyou?")age=input()print(f"so,you're{age}old.")print(type(age))执行：2.方法2：带有提示词的使用input()函数print("
C#中使用FreeSql进行数据库操作，并在WPF的MVVM模式下使用 ysdysyn c#数据库 wpf
在java转C#WPF上位机，MVVM过程中，遇到数据库的问题，经过简单的学习FreeSql语法糖，进行一下简单的封装及使用。我们在C#项目中实现FreeSql技术，首先在我们需要在使用语法糖所在的文件下点击依懒性>管理NuGet程序包，搜索FreeSql并进行下载：在appsettings.json配置文件中输入数据库连接配置，如果没有可在文件夹下自行创建，这里的连接的数据库是MYSQL和SQL
【自然语言处理（NLP）】基于Transformer架构的预训练语言模型：BERT 训练之数据集处理、训练代码实现道友老李自然语言处理(NLP)自然语言处理 transformer
文章目录介绍BERT训练之数据集处理BERT原理及模型代码实现数据集处理导包加载数据生成下一句预测任务的数据从段落中获取nsp数据生成遮蔽语言模型任务的数据从token中获取mlm数据将文本转换为预训练数据集创建Dataset加载WikiText-2数据集BERT训练代码实现导包加载数据构建BERT模型模型损失训练获取BERT编码器个人主页：道友老李欢迎加入社区：道友老李的学习社区介绍**自然语言
keras快速上手-基于python的深度学习实践-基于索引的深度学习对话模型-源代码... weixin_34162401
该章的源代码已经调通，如下，先记录下来，再慢慢理解#!/usr/bin/envpython#coding:utf-8#In[1]:importpandasaspdimportnumpyasnpimportpickleimportkerasfromkeras.modelsimportSequential,Modelfromkeras.layersimportInput,Dense,Activatio
web3.0入门及学习路径吗喽一只 web3 学习
Web3是指下一代互联网的演进形式，它涉及一系列技术和理念，旨在实现去中心化、开放、透明和用户主导的互联网体验。Web3的目标是赋予用户更多的控制权和数据所有权，并通过区块链、加密货币和分布式技术来实现。一、特点去中心化：Web3建立在区块链技术之上，通过使用分布式网络去除传统互联网中的中心化权威机构，实现数据和应用的去中心化。这种结构提高了安全性，减少了单点故障的风险，并增加了抗审查性。加密货币
想要在web3工作，这份web3学习路线图必不可少 Ray Change web3 学习
想要在web3工作，这份web3学习路线图必不可少欢迎踏上Web3学习之旅！Web3——去中心化互联网的新纪元正以前所未有的速度席卷全球。作为前瞻视野的你，是否渴望掌握这一颠覆性技术，跻身引领行业变革的精英行列？希望这份路线图可以帮助到你。推荐Web3Roadmap：Web3学习路线图-登链社区阶段一：Web3基础知识与区块链原理目标：理解Web3与区块链的基本概念、发展历程与价值主张。掌握区块链
yolo是什么，有什么优缺点以及YOLO的应用场景？ cesske YOLO
目录前言一、yolo是什么？二、YOLO的优点三、YOLO的缺点四、YOLO的应用场景总结前言这里我们来讲一下yolo是什么，有什么优缺点？一、yolo是什么？“YOLO”在计算机视觉和深度学习领域是一个特定的算法框架，全称是“YouOnlyLookOnce”。这个算法最初由JosephRedmon、SantoshDivvala、RossGirshick和AliFarhadi在2015年提出，旨在
Web-3.0学习路线奶龙牛牛 web3
方向学习内容✅区块链基础区块链、智能合约、共识机制✅智能合约Solidity/Rust（Ethereum/Solana）✅前端React.js,Next.js,Web3.js,ethers.js✅后端Node.js,Python,Golang（链上数据）✅存储IPFS,Arweave,Filecoin（去中心化存储）✅交互MetaMask,WalletConnect（钱包）如果你是前端开发Reac
Java与Kafka：消息队列使用指南墨瑾轩一起学学Java【一】java kafka linq
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣大家好呀！今天我们要来聊聊如何使用Java语言与ApacheKafka搭建消息队列系统。Kafka是一款分布式流处理平台，它能够高效地处理大量实时数据。无论是构建实时数据分析系统还是简单的消息队列应用，Kafka都能胜任。那么，我们就开始吧！什么是Kafka？
Adobe软件的5个冷门使用技巧明庭 adobe
在现代设计和创意工作中，Adobe系列软件是不可或缺的工具。值得注意的是，拥有Edu教育邮箱的用户可以免费使用这些软件，这极大地降低了学习和创作的门槛。相比之下，使用破解版软件不仅存在法律风险，还可能带来各种安全隐患，因此建议大家选择合法途径获取软件。如果你想获取Edu邮箱，可以参考一些在线资源，在本文的末尾我会给出参考，了解如何申请和使用这些邮箱，以便顺利享受Adobe软件的相关优惠。五个冷门的
AI真的能理解我们这个现实物理世界吗？深度剖析原理、实证及未来走向 AI_DL_CODE 人工智能深度学习 AI AI理解世界
摘要：当下，AI与深度学习广泛渗透生活各领域，大模型与海量数据加持下，其是否理解现实物理世界引发热议。文章开篇抛出疑问，随后深入介绍AI深度学习基础，包含神经网络架构、反向传播算法。继而列举AI在物理场景识别、实验数据分析中显露的“理解”迹象，也点明常识性错误、极端场景失效这类反例。从信息论、物理启发式算法剖析理论支撑，探讨融合物理知识路径，并延展至跨学科应用、评估维度、伦理社会问题，最终展望AI
攻克设备数据质量难题：深度学习应用的数据基石搭建教程（DBSCAN 聚类算法） AI_DL_CODE 深度学习运维算法数据质量 DBSCAN聚类算法
摘要：在深度学习赋能设备管理的浪潮中，数据质量成为关键瓶颈。本文聚焦设备数据采集与预处理阶段面临的噪声干扰、数据缺失等难题，深入讲解强化采集端管控的策略，详细剖析聚类、统计法及线性回归模型在数据清洗与补全中的应用原理，并结合振动传感器数据实例给出可实操的Python代码。旨在为从业者提供一站式解决方案，助力打造高质量设备数据集，为深度学习模型高效运行筑牢根基，推动设备管理智能化落地。文章目录攻克设
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

【王道】计算机组成原理 知识点总结5——中央处理器