SpriCoder

COA-2019-第十五章 CPU Structure and Function

CPU Structure and Function

1. Task of CPU

Fetch instruction: The processor reads an instruction from memory (register, cache, main memory)(获取指令：处理器从内存(寄存器、缓存、主存)读取指令)
Interpret instruction: The instruction is decoded to determine what action is required(解释指令：对指令进行解码以确定所需的操作)
Fetch data: The execution of an instruction may require reading data from memory or an I/O module(获取数据：指令的执行可能需要从内存或I/O模块读取数据)
Process data: The execution of an instruction may require performing some arithmetic or logical operation on data(处理数据：指令的执行可能需要对数据执行一些算术或逻辑运算)
Write data: The results of an execution may require writing data to memory or an I/O module(写入数据：执行的结果可能需要将数据写入内存或I/O模块)

2. CPU Requirement(CPU的需要)

The processor needs to store some data temporarily(处理器需要临时存储一些数据)
It must remember the location of the last instruction so that it can know where to get the next instruction(它必须记住最后一条指令的位置，以便知道下一条指令的位置)
It needs to store instructions and data temporarily while an instruction is being executed(It needs to store instructions and data temporarily while an instruction is being executed)(指令执行时需要临时存储指令和数据(指令执行时需要临时存储指令和数据))
The processor needs a small internal memory(处理器需要一个小的内存)

3. Register Organization

The registers in the processor perform two roles:(处理器中的寄存器执行两个角色：)
1. User-visible registers(用户可见寄存器): Enable the machine- or assembly language programmer to minimize main memory references by optimizing use of registers(用户可见寄存器：通过优化寄存器的使用，使机器或汇编语言程序员能够最小化主内存引用)
2. Control and status registers(控制和状态寄存器): Used by the control unit to control the operation of the processor and by privileged, operating system programs to control the execution of programs(控制和状态寄存器：由控制单元用来控制处理器的操作，由特权操作系统程序用来控制程序的执行,控制和状态寄存器对于用户是不开放的)

3.1. User-visible Register(用户可见寄存器)

3.1.1. General purpose register(通用寄存器)

Assigned to a variety of functions by programmer(由程序员分配给各种功能)

3.1.2. Data register(数据寄存器)

Used only to hold data and cannot be employed in the calculation of an operand address(仅用于保存数据，不能用于计算操作数地址)

3.1.3. Address register(地址寄存器)

General purpose or devoted to a particular addressing mode(通用的或专用于特定寻址方式的)
E.g.: segment pointer, index register, stack register, …(例如：段指针、索引寄存器、堆栈寄存器，)

3.1.4. Design issues(设计问题)

Whether to use completely general-purpose registers or to specialize their use(是完全使用通用寄存器还是专门使用它们)
Number of registers(寄存器数量)
- Fewer registers result in more memory references(更少的寄存器导致更多的内存引用)
- More registers do not noticeably reduce memory references(更多的寄存器不会明显减少内存引用)
- 均衡最好
Register length(寄存器长度)
- Must be at least long enough to hold the largest address or values of most data types(必须至少足够长以容纳大多数数据类型的最大地址阈值)
- Some machines allow two contiguous registers to be used as one for holding double-length values(有些机器允许使用两个相邻的寄存器作为一个寄存器来保存双长度值)

3.1.5. Condition codes register(条件码寄存器)

Condition codes are bits set by the processor hardware as the result of operations(条件码是处理器硬件根据操作结果设置的位)
At least partially visible to the user(用户至少部分可见)

3.1.6. Store and recovery(存储和恢复)

A subroutine call will result in the automatic saving of all user-visible registers, to be restored on return(子例程调用将自动保存所有用户可见的寄存器，并在返回时还原)
- The processor performs the saving and restoring as part of the execution of call and return instructions(处理器执行保存和恢复，作为执行调用和返回指令的一部分)
- This allows each subroutine to use the user-visible registers independently(这允许每个子程序独立使用用户可见寄存器)
The programmer should save the contents of the relevant user-visible registers prior to a subroutine call, by including instructions for this purpose in the program(在调用子程序之前，程序员应该保存相关的用户可见寄存器的内容，方法是在程序中包含用于此目的的指令)

3.2. Control and Status Register 控制和状态寄存器

Employed to control the operation of the processor(用于控制处理器的操作)
Most of these, on most machines, are not visible to user(在大多数机器上，这些大部分对用户是不可见的)
- Some of them may be visible to machine instructions executed in a control or operating system mode(其中一些对在控制或操作系统模式下执行的机器指令是可见的)

3.2.1. Program counter (PC)

Contains the address of an instruction to be fetched(包含要获取的指令的地址)
Typically, the processor updates the PC after each instruction fetch so that the PC always points to the next instruction to be executed(通常，处理器在每次取指令后更新PC，以便PC始终指向要执行的下一条指令)
A branch or skip instruction will also modify the contents of the PC(分支或跳过指令也会修改PC的内容)
取指之后就会更新，一旦取指完成，PC就已经完成更新

3.2.2. Instruction register (IR)

Contains the instruction most recently fetched(包含最近获取的指令)
The fetched instruction is loaded into an IR, where the opcode and operand specifiers are analyzed(获取的指令被加载到IR中，在IR中分析操作码和操作数说明符)

3.2.3. Memory address register (MAR)

Contains the address of a location in memory(包含内存中某个位置的地址)
MAR connects directly to the address bus(MAR直接连接到地址总线)
不仅仅是存储指令的地址，而是可以存储所有的数据地址。

3.2.4. Memory buffer register (MBR)内存缓存寄存区

Contains a word of data to be written to memory or the word most recently read(包含要写入内存的数据字或最近读取的数据字)
MBR connects directly to the data bus, and user-visible registers, in turn, exchange data with the MBR(MBR直接连接到数据总线，用户可见的寄存器反过来与MBR交换数据)
ALU may have direct access to the MBR and uservisible registers(ALU可以直接访问MBR和用户可见寄存器)

3.2.5. Program status word (PSW):程序状态字

A register or set of registers contain status information(一个或一组寄存器包含状态信息)
Sign: Sign bit of the result of the last arithmetic operation(Sign：最后一次算术运算结果的符号位)
Zero: Set when the result is 0.(0：结果为0时设置。)
Carry: Set if an operation resulted in a carry (addition) into or borrow (sub-traction) out of a high-order bit(进位：如果一个操作导致高阶钻头进位(增加)或出位(副牵引)，则设置)
Equal: Set if a logical compare result is equality(相等：设置逻辑比较结果是否相等)
Overflow: Indicate arithmetic overflow(溢出：表示算术溢出)
Interrupt enable/disable: Enable or disable interrupts(中断启用/禁用：启用或禁用中断)
Supervisor: Indicates whether the processor is executing in supervisor or user mode(Supervisor：指示处理器是以Supervisor模式还是用户模式执行，操作系统模式)

3.2.6. Other registers related to status and control(与状态和控制有关的其他寄存器)

A pointer to a block of memory containing additional status information(指向包含附加状态信息的内存块的指针)
In machines using vectored interrupts, an interrupt vector register may be provided(在使用矢量中断的机器中，可以提供中断矢量寄存器)
If a stack is used to implement certain functions, a system stack pointer is needed(如果使用堆栈来实现某些函数，则需要系统堆栈指针)
A page table pointer is used with a virtual memory system(页表指针用于虚拟内存系统)

3.2.7. Design issues(设计问题)

Operating system support(操作系统支持)
1. Certain types of control information are of specific utility to the operating system(某些类型的控制信息对操作系统具有特定的实用性)
2. If the processor designer has a functional understanding of the operating system to be used, register organization can to some extent be tailored to the operating system(如果处理器设计者对要使用的操作系统有一个功能上的理解，那么注册组织在某种程度上可以根据操作系统进行定制)
Allocation of control information between registers and memory (主存和寄存器之间的控制信息的交换)
1. It is common to dedicate the first (lowest) few hundred or thousand words of memory for control purposes(为了控制的目的，通常将第一个(最低的)几百或几千字的内存专用于控制目的)
2. Trade-off of cost versus speed arises(成本与速度的权衡)

4. Indirect Cycle(间址周期)

The execution of an instruction may involve one or more operands in memory, each of which requires a memory access(指令的执行可能涉及内存中的一个或多个操作数，每个操作数都需要内存访问)
If indirect addressing is used, additional memory accesses are required(如果使用间接寻址，则需要额外的内存访问)
Treat the fetching of indirect addresses as one more instruction stages(将间接地址的获取视为一个或多个指令阶段)

5. Data Flow(数据流转)

Assume a processor that employs a memory address register (MAR), a memory buffer register (MBR), a program counter (PC), and an instruction register (IR)(假设处理器使用内存地址寄存器(MAR)、内存缓冲寄存器(MBR)、程序计数器(PC)和指令寄存器(IR))
Fetch cycle
- 把下一条指令地址放到MAR中去，然后交给memory
- 控制单元设置控制线的信号，如果控制线设置为相应信号，内存会始终监听信号线，当它从上面那根短线读到读信号，则从MAR中读出一个地址，然后取出数据给数据总线。
- 将数据从数据总线读取到MBR中，然后拷贝到IR中去。

Indirect cycle(间址周期)
- MBR中是地址，把地址拷贝到MAR中
- 控制单元发送读请求，内存从MAR中进行拉取后，从内存中取出来，返给MBR。
- 间址操作是指在间址周期中的和正常周期多出来的操作。

Interrupt cycle(中断，需要调用)
- 控制单元会先告诉主存有写操作
- 之后控制单元会为MAR指定一个写入的位置。

6. Instruction Pipelining(指令流水线)

Pipelining(流水线)
- If a product goes through various stages of production, products at various stages can be worked on simultaneously by laying the production process out in an assembly line(如果一个产品经历了不同的生产阶段，那么可以通过在装配线上布置生产过程来同时处理不同阶段的产品)
In fact, an instruction has a number of stages(实际上，指令有许多阶段)

6.1. Two Stages Solution(两种存储策略)

Subdivide instruction processing into two stages: fetch instruction and execute instruction(将指令处理细分为两个阶段：获取指令和执行指令)
Fetch the next instruction in parallel with the execution of the current one(在执行当前指令的同时获取下一条指令)
Problem: memory access conflict(问题：内存访问冲突)

There are times during the execution of an instruction when main memory is not being accessed(在指令执行过程中，有时不访问主存)
More problems
1. Execution time will generally be longer than fetch time(执行时间通常比获取时间长)
2. A conditional branch instruction makes the address of the next instruction to be fetched unknown(条件分支指令使要获取的下一条指令的地址未知)

7. Six Stages Solution(6级流水线)

几级流水线表示分为了几个微操作。

To gain further speedup, the pipeline must have more stages(为了进一步加速，管道必须有更多的阶段)
1. Fetch instruction (FI): Read the next expected instruction into a buffer(获取指令(FI)：将下一条预期指令读入缓冲区)
2. Decode instruction (DI):Determine opcode and operand specifiers(Decode instruction (DI):Determine opcode and operand specifiers)(解码指令(DI)：确定操作码和操作数说明符(解码指令(DI)：确定操作码和操作数说明符)
3. Calculate operands (CO): Calculate effective address of each source operand(计算操作数CO：计算每个源操作数的有效地址)
4. Fetch operands (FO): Fetch each operand from memory. Operands in registers need not be fetched(获取操作数(FO)：从内存中获取每个操作数。不需要获取寄存器中的操作数)
5. Execute instruction (EI): Perform the indicated operation and store the result, if any, in the specified destination operand location(执行指令(EI)：执行指定的操作并将结果(如果有的话)存储在指定的目标操作数位置)
6. Write operand (WO):Store the result in memory(写入操作数(WO)：将结果存储在内存中)
The various stages will be of more nearly equal duration(各个阶段的持续时间将更接近相等)
Example: reduce the execution time for 9 instructions from 54 time units to 14 time units(示例：将9条指令的执行时间从54个时间单位减少到14个时间单位)

问题：
1. 最多的时候会同时处理6件事情，所以需要遵守6个任务中时间最长的任务所需时间。
2. 因为微指令之间存在时间间隔，所以6个指令加起来的运算时间要大于原来一次计算完
3. 不是所有的指令都有6个结点，比如加载指令不需要WO阶段。
4. 可能出现内存冲突的问题
Comment 评价
1. Not all the instructions contain six stages(不是所有的指令都有6个部分)
  1. E.g.: Load instruction does not need the WO stage(加载指令不用WO指令)
  2. To simplify hardware, the timing is set up assuming that each instruction requires all six stages(为了简化硬件，设置时间的前提是每条指令都需要所有六个阶段)
2. Not all the stages can be performed in parallel(不是所有的阶段都可以并行执行)
  1. E.g.: FI, FO, and WO stages involve a memory access(FI、FO和WO阶段涉及内存访问)
  2. The desired value may be in cache, or the FO or WO stage may be null(期望值可能在缓存中，或者FO或WO stage可能为空)
Limitation 限制
1. If the six stages are not of equal duration, there will be some waiting involved at various pipeline stages(如果这六个阶段的持续时间不相等，那么在不同的管道阶段会有一些等待)
2. Conditional branch instruction can invalidate several instruction fetches(条件分支指令可以使多个指令获取无效)

Interrupt
- 上面如果调到了15号指令，则之前的所有的数据都被"浪费掉"

Another viewpoint
- 从竖向的方式来看

7.1. Pipeline Performance(加速比)

Assume
1. : time delay of the circuitry in the ith stage of pipeline(k级流水线执行n条指令所需的总时间第i级流水线电路的延时)
2. : maximum stage delay(最大级延迟)
3. : number of stages in the instruction pipeline(指令管道中的阶段数)
4. : time delay of a latch, needed to advance signals and data from one stage to the next(锁存器的时间延迟，用于将信号和数据从一个阶段提前到下一个阶段)
Cycle time： = max[] + = +
加速比是指使用了流水线后加速的比例
Total time required for a pipeline with k stages to execute n instructions(具有k个阶段的管道执行n条指令所需的总时间)
Speedup factor(加速比)
- 加速比>1
- 分子:未使用流水线
- 分母:使用流水线
- 考法:一般在发生指令跳转的情况下来计算，在之前的例子中实际运行了5条指令

7.1.1. Misunderstanding(误解)

流水线不是分隔的越细越好
1. 会造成指令间隔变多,间隔浪费的时间也会增加
2. 会造成指令控制变得复杂

7.1.2. Reason 原因

At each stage of the pipeline, there is some overhead involved in moving data from buffer to buffer and in performing various preparation and delivery functions(在管道的每个阶段，将数据从一个缓冲区移动到另一个缓冲区以及执行各种准备和传递功能都会涉及一些开销)
The amount of control logic required to handle memory and register dependencies and to optimize the use of pipeline increases enormously with the number of stages(处理内存和寄存器依赖项以及优化管道使用所需的控制逻辑量随着阶段数的增加而大大增加)

8. Hazard(冒险)

In some cases, instruction pipeline will be blocked or stalled the subsequent instructions cannot be correctly executed(在某些情况下，指令管道将被阻塞或暂停后续指令无法正确执行)
Type
1. Structure hazard / hardware resource conflict(结构冒险/硬件资源冲突)
2. Data hazard / data dependency(数据冒险/数据依赖)
3. Control hazard(控制冒险)

8.1. Structure Hazard(结构冒险)

8.1.1. Reason

The same device is accessed by different instructions(相同的硬件被不同的操作访问)

8.1.2. Solution

A device can be accessed once in one instruction, and use multiple different devices(一个设备可以在一条指令中访问一次，并使用多个不同的设备)
可以分时复用，前半段读出，后半段写入。

8.2. Data Hazard(数据冒险)

8.2.1. Reason(原因)

The data required by a instruction is not generated(指令需要的数据不是被生成的)

8.2.2. Solution

Insert nop instruction(插入nop指令)

Insert bubble(插入等待)

Forwarding / bypassing(转发/绕过)
- 添加一根线来拿到目标数据(旁路)

Exchange instruction orders(改变指令顺序)
- 比如load指令:只能在第四小周期才能拿到。

调整指令的处理顺序可以进一步优化操作

8.3. Control Hazard(控制冒险)

8.3.1. Reason

The order of instruction execution is changed(指令执行顺序改变)
Transfer: branch, loop, …(转移:分支、循环)
Interrupt(中断)
Exception(异常)
Call / return(调用/返回)

8.3.2. Solution

Multiple streams: replicate the initial portions of the pipeline and allow the pipeline to fetch both instructions, making use of two streams(多个流：复制管道的初始部分，并允许管道使用两个流来获取两条指令)
Prefetch branch target: When a conditional branch is recognized, the target of the branch is prefetched, in addition to the instruction following the branch(预取分支目标：当一个条件分支被识别时，除了分支后面的指令外，分支的目标也被预取)
Loop buffer: use a small, very-high-speed memory maintained by the instruction fetch stage of the pipeline and containing the n most recently fetched instructions, in sequence(循环缓冲区：使用一个由管道的指令获取阶段维护的小的、非常高速的内存，该内存按顺序包含n个最近获取的指令)
Delayed branch: exchange instruction orders(延迟分行：换货指示单)
Branch prediction(分支预测)
1. Predict never taken(从不做分支预测)
2. Predict always taken(一直做分支预测)
3. Predict by opcode(根据操作码进行分支预测)

Branch prediction
1. Taken/not taken switch(是否进行转换)
2. Branch history table(分支历史表) 分支历史表(循环)是一个分支(循环一个)

i = 1;
while(i < n){
    i++;
}
//分支预测n+1次

Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
【2023年】云计算金砖牛刀小试6 geekgold 云计算服务器网络 kubernetes 容器
第一套【任务1】私有云服务搭建[10分]【题目1】基础环境配置[0.5分]使用提供的用户名密码，登录提供的OpenStack私有云平台，在当前租户下，使用CentOS7.9镜像，创建两台云主机，云主机类型使用4vCPU/12G/100G_50G类型。当前租户下默认存在一张网卡，自行创建第二张网卡并连接至controller和compute节点（第二张网卡的网段为10.10.X.0/24，X为工位号
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
L1 L2 L3 缓存京天不下雨 windows 缓存 windows
L1L2L3缓存L1Cache(一级bai缓存)是CPU第一层高速缓存，分为数据缓存和指令缓存。du内置的zhiL1高速缓存的容量和结构对daoCPU的性能影响较大，不过高速缓冲存储器均由静态RAM组成，结构较复杂，在CPU管芯面积不能太大的情况下，L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—4096KB。L2由于L1级高速缓存容量的限制，为了再次提高CPU的运
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
网关gateway学习总结猪猪365 学习总结学习总结
一微服务概述:微服务网关就是一个系统!通过暴露该微服务的网关系统,方便我们进行相关的鉴权,安全控制,日志的统一处理,易于监控的相关功能!实现微服务网关技术都有哪些呢?1nginx:nginx是一个高性能的http和反向代理web的服务器,同事也提供了IMAP/POP3/SMTP服务.他可以支撑5万并发链接,并且cpu,内存等资源消耗非常的低,运行非常的稳定!2Zuul:Zuul是Netflix公司
程序计数器的作用毕加涛 java
程序计数器的作用就是**用来记住下一条jvm指令的执行地址。**它的特点是**线程私有的**，也就是一人一个。然后cpu会给每个线程分配时间片，然后等待这个线程的时间片用完之后就会轮到下一个线程来执行。所以此时就需要计数器来记录线程运行的下一行指令的地址，等到下次轮到这个线程执行的时候来到上次执行的指令地址来继续执行指令。所以它的作用就是：为了保证程序的执行遵循自上而下有顺序的执行。
linux下好用的任务管理器htop WittXie Linux linux 服务器运维
给大家推荐个好用的任务管理器htop，简直好用的不得了。完虐top。不解释了，看文章！！！在Linux系统中，top命令用来显示系统中正在运行的进程的实时状态，它显示了一些非常有用的信息，比如CPU利用情况、内存消耗情况，以及每个进程情况等。但是，你知道吗？还有另外一个命令行工具'htop'，它与传统的top命令功能一样，但它有更加强大的功能及能显示更多的信息。这篇文章，我们会用实例来讨论这个'h
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
磁盘性能评价指标—IOPS和吞吐量 ???? ??? Frank
一、磁盘I/O的概念I/O的概念，从字义来理解就是输入输出。操作系统从上层到底层，各个层次之间均存在I/O。比如，CPU有I/O，内存有I/O,VMM有I/O,底层磁盘上也有I/O，这是广义上的I/O。通常来讲，一个上层的I/O可能会产生针对磁盘的多个I/O，也就是说，上层的I/O是稀疏的，下层的I/O是密集的。磁盘的I/O，顾名思义就是磁盘的输入输出。输入指的是对磁盘写入数据，输出指的是从磁盘读
为什么Node.js不适合CPU密集型应用？ weixin_54503231 node.js
Node.js不适合CPU密集型应用的原因主要基于其设计理念和核心特性，具体可以归纳为以下几点：单线程模型Node.js采用单线程模型来处理用户请求和异步I/O操作。虽然这种模型在处理高并发I/O密集型任务时非常高效，因为它避免了传统多线程模型中的线程上下文切换开销，但这也意味着它不能充分利用现代多核CPU的计算能力。对于需要大量计算资源的CPU密集型应用，单线程模型会成为瓶颈，导致应用性能受限。
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
多线程相关面试题（2024大厂高频面试题系列）小橘子831 后端面试 java 面试后端
1、聊一下并行和并发有什么区别？并发是同一时间应对多件事情的能力，多个线程轮流使用一个或多个CPU并行是同一时间动手做多件事情的能力，4核CPU同时执行4个线程2、说一下线程和进程的区别？进程是正在运行程序的实例，进程中包含了线程，每个线程执行不同的任务不同的进程使用不同的内存空间，在当前进程下的所有线程可以共享内存空间3、如果在java中创建线程有哪些方式？在java中一共有四种常见的创建方式，
【大模型】triton inference server idiotyi 大模型自然语言处理语言模型人工智能
前言：tritoninferenceserver常用于大模型部署，可以采用http或GRPC调用，支持大部分的backend，单GPU、多GPU都可以支持，CPU也支持。本文主要是使用tritoninferenceserver部署大模型的简单流程示例。目录1.整体流程2.搭建本地仓库3.服务端代码4.启动服务5.客户端调用1.整体流程搭建模型仓库模型配置服务端调用代码docker启动服务客户端调用
座舱交互的下一个时代高工智能汽车交互物联网人工智能
为了满足座舱信息娱乐的更高性能要求，几乎所有的一线品牌都在准备“换芯”。去年开始，不少车型开始推动传统的分布式座舱仪表和中控电子架构进入域控制器时代，高通成为大赢家。今年6月，特斯拉也正式官宣，即将推出的新款ModelS将配备能够运行PS5游戏机性能的AMD芯片，包括专门定制的AMDRyzenCPU和独立的Navi23图形处理器。最新消息，特斯拉将率先在中国市场生产的ModelY高性能版车型换装A
Redis 为什么这么快？小海海不怕困难 Redis redis
决定Redis请求效率的因素主要是三个方面，分别是网络、cpu、内存。在网络层面，Redis采用多路复用的设计，提升了并发处理的连接数，不过这个阶段，Server端的所有IO操作，都是由同一个主线程处理的这个时候IO的瓶颈就会影响到Redis端的整体处理性能。所以从Redis6.0开始，在多路复用及层面增加了多线程的处理，来优化IO处理的能力不过，具体的数据操作仍然是由主线程来处理的，所以我们可以
选择适合你企业发展的服务器 666IDCaaa 服务器运维
1.我的服务器的主要目的是什么？主要是用于电子邮件目的？还是认为数据传输更重要？当然，选择多功能的服务器是最佳的，这样你就不必只将其用于一个目的而已。你需要了解哪些操作和功能有利于你目前业务需求的发展，根据优先级去选择，选择和你业务需求相匹配度更高的服务器。一般来说，选择服务器之前，还要确定好将运行什么软件，负载有多大，这样就可以很清楚的知道服务器的大概配置，cpu、内存、硬盘等分别用怎样的最好。
Python 课程8-多线程编程和多进程编程可愛小吉 Python教學 python 开发语言 threading multiprocessing
前言在现代编程中，处理并发任务是提高程序性能的关键之一。Python提供了多线程（threading）和多进程（multiprocessing）两种方式来实现并发编程。多线程适用于I/O密集型任务，而多进程则更适合CPU密集型任务。通过这两种技术，你可以高效地处理大规模数据、加速程序执行并优化资源利用。在本篇详细教程中，我们将讨论如何使用Python的threading模块实现多线程，以及如何使用
如果面试官问你CAS，你还这么答，可能就要回去等通知了爱玛士程序员面试 Java java 面试开发语言程序员架构
前言大家好，我是JAVA高级开发之路，一个总在为粉丝解决面试题的程序员。最近有几个粉丝说在面试面试中遇到了CAS的问题，连着几次面试都没有让面试官满意，区区CAS底层源码，怎能难倒咱们这届程序员们呢？都支棱起来，跟我一起来搞定CAS底层源码。什么是CASCAS的全称是Compare-And-Swap，它是CPU并发原语。它的功能是判断内存某个位置的值是否为预期值，如果是则更改为新的值，这个过程是原
实时监控或查看系统资源使用情况的工具——TOP summer@彤妈 linux
top命令可以显示当前系统正在执行的进程的相关信息，包括进程ID、内存占用率(MEM)、CPU占用率等。默认进程以CPU的占用率进行排序。输入大写M可以切换成使用内存占用率排序；输入大写P可以切换为使用CPU占用率排序。top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器.下面详细介绍它的使用方法:（实时监控系统资源使用情况图）统计
线程池的应用--＞1 路ZP java 开发语言
1.线程的执行机制线程分为用户线程和内核线程内核线程就是系统级别的线程，与cpu逻辑处理器数量对应的用户线程就是使用java代码创建的Thread对象用户线程必须与内核线程关联（映射），才能执行任务当用户线程多于内核线程时，内核线程就需要不停的上下文切换，使得多个用户线程都能得以执行上下文会影响性能，消耗资源。大量的创建用户线程，消耗用户线程，也会影响性能，消耗资源。所以我们希望，创建合适数量的线
从零开始学PostgreSQL (十三)：并行查询 DBA实战 postgresql 数据库
目录概述1.并行查询的工作原理2.什么时候可以使用并行查询？3.并行计划3.1.并行扫描3.2.并行连接3.3.并行聚合3.4.并行追加3.5.并行计划提示4.并行安全4.1.函数和聚合的并行标签5.注意事项6.总结概述并行查询是PostgreSQL提供的一种功能，它允许查询在多个CPU核心或处理器上同时执行，从而显著提高查询性能，特别是在处理大型数据集时。并行查询的设计目标是在多核处理器的现代硬
Ansible自动化部署kubernetes集群 theo.wu kubernetes ansible 自动化
机器环境介绍1.1.机器信息介绍IPhostnameapplicationCPUMemory192.168.204.129k8s-master01etcd，kube-apiserver，kube-controller-manager，kube-scheduler,kubelet,kube-proxy,containerd2C4G192.168.204.130k8s-worker01etcd，kub
查看当前计算机CPU架构 raoxiaoya Linux windows
在安装软件的时候，windows上会有32bit,64bit的区别，但是Linux系统下则还需要知道CPU架构，比如amd64,i386,arm64,x86_64,aarch64等等。1、cat/proc/versionLinuxversion3.10.0-1127.10.1.el7.x86_64([email protected])(gccversion4.8.
查看 CPU架构类型 BYAPESS windows
打开cmd窗口—>输入echo%PROCESSOR_ARCHITECTURE%接口显示，本人的是AMD64
Java并发复习 vd_vd Java并发安全容器 java 开发语言
Java基础1.为什么要使用并发编程？一般我们工作的电脑都有多核，我们创建多个线程，然后操作系统可以将多个线程分配给不同的CPU去执行，每个CPU执行一个线程，这样就提高了CPU使用效率。在网络购物中，我们买了一个东西的同时，需要减库存，生成订单等等这些操作，就可以进行拆分利用多线程的技术完成。面对复杂业务模型，并行程序串行会比程序更适应业务需求，而并发编程更能吻合这种业务拆分。->充分利用多核C
大模型框架：vLLM m0_37559973 大模型大模型通义千问 Qwen
目录一、vLLM介绍二、安装vLLM2.1使用GPU进行安装2.2使用CPU进行安装2.3相关配置三、使用vLLM3.1离线推理3.2适配OpenAI-API的API服务一、vLLM介绍vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架。它利用了全新的注意力算法「PagedAttention」，提供易用、快速、便宜的LLM服务。二、安装vLLM2.1使用GPU进行安装vLLM是一个Py
单片机在医疗设备中的应用实例教程 kkchenjj 单片机单片机嵌入式硬件
单片机在医疗设备中的应用实例教程单片机基础单片机概述单片机，全称为单片微型计算机（Single-ChipMicrocomputer），是一种将中央处理器（CPU）、存储器、输入输出接口等主要计算机部件集成在一块芯片上的微型计算机系统。它具有体积小、功耗低、成本低廉、控制功能强大等特点，广泛应用于工业控制、家用电器、汽车电子、医疗设备等多个领域。特点集成度高：单片机将计算机的主要部件集成在一块芯片上
单片机与传感器接口技术应用实例教程 kkchenjj 单片机单片机 nosql 嵌入式硬件
单片机与传感器接口技术应用实例教程单片机基础单片机概述单片机，全称为单片微型计算机（Single-ChipMicrocomputer），是一种将中央处理器（CPU）、存储器、输入输出接口等主要计算机部件集成在一块芯片上的微型计算机系统。它具有体积小、功耗低、成本低廉、控制功能强大等特点，广泛应用于工业控制、家用电器、汽车电子、通信设备、医疗器械等领域。特点集成度高：单片机将计算机的主要部件集成在一
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

COA-2019-第十五章 CPU Structure and Function

CPU Structure and Function

1. Task of CPU

2. CPU Requirement(CPU的需要)

3. Register Organization

3.1. User-visible Register(用户可见寄存器)

3.1.1. General purpose register(通用寄存器)

3.1.2. Data register(数据寄存器)

3.1.3. Address register(地址寄存器)

3.1.4. Design issues(设计问题)

3.1.5. Condition codes register(条件码寄存器)

3.1.6. Store and recovery(存储和恢复)

3.2. Control and Status Register 控制和状态寄存器

3.2.1. Program counter (PC)

3.2.2. Instruction register (IR)

3.2.3. Memory address register (MAR)

3.2.4. Memory buffer register (MBR)内存缓存寄存区

3.2.5. Program status word (PSW):程序状态字

3.2.6. Other registers related to status and control(与状态和控制有关的其他寄存器)

3.2.7. Design issues(设计问题)

4. Indirect Cycle(间址周期)

5. Data Flow(数据流转)

6. Instruction Pipelining(指令流水线)

6.1. Two Stages Solution(两种存储策略)

7. Six Stages Solution(6级流水线)

7.1. Pipeline Performance(加速比)

7.1.1. Misunderstanding(误解)

7.1.2. Reason 原因

8. Hazard(冒险)

8.1. Structure Hazard(结构冒险)

8.1.1. Reason

8.1.2. Solution

8.2. Data Hazard(数据冒险)

8.2.1. Reason(原因)

8.2.2. Solution

8.3. Control Hazard(控制冒险)

8.3.1. Reason

8.3.2. Solution

你可能感兴趣的:(COA课程笔记,cpu)