DuanPenghao

计算机组成原理第五章---中央处理器第三部分：指令流水线，多处理器和硬件多线程

1.指令流水线

1.1 什么是指令流水线

在解释什么是指令流水线之前，我们需要清楚指令的真实执行过程，一个计算机对于多条指令的执行有以下的几种方式：

（1）串行执行：传统的冯诺依曼机是把指令一条一条的执行的，这被称为串行执行的执行方式，它设计起来很简单，也很好控制，但是处理器一次只能处理一个指令，导致速度很慢。如图所示(我们假设每一执行的阶段时间都是t，并且指令有n条):

（2）重叠执行：既然一次执行一条慢，于是我们就会想到既然一个指令可以被分为多个阶段(取指译码和执行)，而每一个阶段执行时所需要的硬件不一样，那么我们为什么不把指令的各个阶段拆开来执行呢？也就是同时并行的执行多个指令的不同阶段（这其实在前面已经分析过一次），这样可以大大地节省时间，这就是重叠执行的思想。但是根据重叠的方法，还可以再细分：
{1}一次重叠执行：前一条指令的执行阶段和后一条指令的取指阶段重叠：

第一次执行需要3t的时间，后面执行一次只需要2t。所以总的来说，减少了约3分之一的时间。但是缺点是，它需要额外的硬件来实现两个指令一同执行，开销更大(其实就是操作系统的临界区问题)。

{2}二次重叠： 这个不用多说了，更节约时间(同时可以执行三条指令)，但是实现起来更加复杂：

=这种重叠执行指令的执行方式就是指令流水线！！！ 实际上，指令流水线的执行不可能像图上这么流畅，因为不同指令的执行周期和取指周期还有译码阶段，它们的硬件是有可能发生冲突的，所以上面的是理想状态，现实中会比上面的理想状态实施起来慢(有冲突只能等)，但是总是比串行执行要快的。
PS:这里只是把指令分成了3个阶段，但是指令其实可以分成许多阶段(你甚至可以规定一个节拍就一个阶段)，然后就可以同时让多条指令并行执行。考试最常考5个阶段的指令，这个后面说。

1.2 时空图

这是一个考试常见的图，它是用于表现指令流程线一个常用的画法：

图中的横坐标是时间，纵坐标是执行到了什么阶段，纵坐标有几个就代表题目把执行过程分成了几个阶段。 图中的 $I_1,I_2...$ 等就是指令的序号。从图中还可以看出它的指令流水线采用了三次重叠的执行方式。时空图的重点是可以帮助我们计算指令流水线的性能，这需要先学习一下指令流水线的性能指标。

1.3 指令流水线的性能指标

有三个指标：
（1）吞吐率（TP）：单位时间内，流水线可以完成多少条指令。 设一共要执行n条指令，执行完需要 $T_k$ 的时间，那么:
$\frac{n}{T_k}$
现在用这个理想状态下的时空图为例子：

$TP=\frac{n}{(k+n-1)\Delta t}$ 如果我们的指令无限多也就是n趋近于无穷时： $TP=\frac{1}{\Delta t}$ 。其中， $\Delta t$ 是执行一个指令的阶段所需要的时间(常常就是一个时钟节拍，因为都探讨极限理想了)。这里其实还给出了，n-1次重叠执行，所需要的时间，正好是 $(k+n-1)\Delta t$ 。
这里再引入一个装入时间和排空时间的概念，其实就是从第一条指令执行到它执行结束的部分还有最后一条指令执行开始到结束的部分，从图上看正好像是一点点装进去又一点点排空。

这两个时间段使得硬件被一点点全部启动，然后一点点全部关闭。

（2）加速比S：完成同样的一批任务，不使用指令流水线和使用指令流水线所需要的时间比值。 说白了，就是和冯诺伊曼的串行执行相比，效率提高了多少。其实，用上面的例子去算，串行执行需要 $nk\Delta t$ 的时间，所以 $S=\frac{nk}{k+n-1}$ 。显然，S的值越大越好(n越大它就越大)。n趋近于无穷的时候，加速比为k，所以极限情况下(指令足够多)，分几个阶段就快了几倍。

（3）效率E：流水线设备的利用率。计算方法其实就是计算整个时空图实体的面积(正好可以拼接成一个长方形)比上整个时空图的面积(就是一个大长方形)。

其实从图上可以看出，高固定是k，长就是 $(k+n-1)\Delta t$ ,所以可以得出效率公式：
$E=\frac{k[(k+n-1)-(k-1)]\Delta t}{k(k-1)\Delta t}=\frac{n}{k+n-1}$ 因为k是常数，所以很显然，n足够多的时候，这个值可以趋近于1，也就是利用率到了百分百。

从三个性能指标来看，当指令足够多的时候，叠的越多越好。当然这是理想状态，即每一个指令的执行时间相同且运行结束时，下一条指令立即衔接。

1.4 指令分段–五段式指令流水线(选择大题都必考)

前面把指令分为了三段，现在进一步的扩展，把指令扩展成五段，这其实也是最常用的分段方法。这五段如图所示：

（1）取指令阶段IF。（2）指令译码阶段ID。（3）指令的执行阶段EX。（4）访存阶段M。（5）把计算结果写回通用寄存器WB。 这种五段式的指令，是由世界上第一个RISC指令集MIPS提出的(AMR是后期提出的)。要注意的是，这五个阶段是必须的，也就是说，即便有的指令没有后面两个阶段，计算机也会认为它们在执行(因为如果要认真的区分，设计起来会很复杂)。现实中每一个阶段用的时间是不一致的，但是设计的时候，为了方便实现，通常会把每一个阶段的时间设置成一样的，也就是用最长的那个阶段的时间作为全部的总时间。 (其实，只要是RISC指令集，都是这样设计的，因为指令短，花费这点时间来简化设计没有什么)。所以每一条指令的机器周期数相同，长度也相同才能更好的实现指令流水线。 因为每一个阶段的时间不同，那么一开始就肯定会存在空闲的时候(比如M只需要70ns，但是时间需要100ns，那么前30ns空闲)，但是我们却知道因为要并行的运行许多指令，所以前一个阶段产生的数据不能一直占用寄存器，所以就会在每一个阶段后面加一个缓冲寄存器（图中ID后面的A和B还有Imm，EX后面的空白还有上面的store），这个缓冲寄存器也被称为锁存器。锁存器的功能就是保留本流水段的执行结果给下一流水段使用。

其次，图上出现了好久没有见到的Cache，这里就可以对Cache进行补充：如图所示，其实取指阶段和访存阶段往往访问的是Cahe，不是主存(回顾第三章)。然后图上也指明了，我们的Cache可以分成两个部分，一部分专门用来存指令，叫做指令Cahce，另一部分则用于存数据，称为数据Cache。而且这两个Cache其实是分成两半的，每一个都是一个单独的元件，这就导致它们可以并行的运行。如果Cache不命中，则就必须花费更多的时间去访问主存，因为很耗费时间，所以指令流水线会因此出现断流(全停下来等)。

最后，我们需要注意的是，图上ALU在计算前数据都到了寄存器里面(然后存到AB锁存器里面)，这是因为RISC指令集的运算必须两个数都在寄存器中，不能像CISC那样一个在寄存器一个在主存。 AB就是专门用来存放两个运算数的，上面的Imm锁存器则是用于存放立即数的。 M阶段后面的最小的框其实是一个寄存器，因为运算结果也可能是存入寄存器的(最后也可能像图上那样回流到通用寄存器里)。

1.5 影响流水线的因素

（1）结构相关(指令之间的资源冲突)。 其实就是操作系统的互斥问题。比如，两条指令一个是取指阶段，一个是执行阶段，它们如果Cache未命中的话，就需要同时访问主存，引发冲突。同时，也会出现多条指令争抢同一个寄存器的现象。解决方法有：
1.后一条指令先暂停一个周期再运行。2.资源重复配置：即把资源分到不同的存储体中。 比如前面说的，把指令Cache和数据Cache分开来单独的设计。第一种容易实现，第二种效率更高。

（2）数据相关(它是重点考点)(后一条指令的执行可能需要前一条指令执行结束之后才获得)。其实就是操作系统的同步。解决方法：1.一直等待，直到需要的指令执行完成为止，可以通过硬件的阻塞(stall)[也被称为插入气泡]和软件插入"NOP"实现，其实就是指插入1到几个周期的空指令来等待。2.转发机制(数据旁路技术)：这个技术要更复杂一些，比如我们要计算 a=1+2,b=a-1。按照方法1，第二条减法指令需要等待第一条指令完全执行完第五个周期才可以，但是其实第一条指令在执行完执行阶段就已经有a的值了，所以就连接一条线到第二条指令，在第一条指令执行出a的结果以后，第二条指令立即开始执行，这样就可以少等待2个周期，但是会麻烦一些。3.编译优化：就是先执行后面的，不涉及到前一条指令的指令，然后等前面指令结果出来再继续执行，这其实是编译原理的知识不用深究，感兴趣可以看看。

（3）控制冲突。控制冲突是因为转移指令或者其他可以改变PC的情况(比如中断)，打断了原本的指令执行顺序造成的(因为指令流水线实现的基础就是顺序的执行指令)。关键的是，转移指令只有在执行到第五个阶段结束你才知道需要转移，而这个时候下面的四条指令都已经开始执行了！解决办法：1.提前预测是否会跳转，又分为简单预测和动态预测两种，简单预测就是看到jmp指令，译码器就认为会跳转或者不会跳转(通常是全认为会跳转)，动态预测就是额外加个硬件，多判断一下会不会跳转(因为硬件很简单，预测的也不是那么准确，它的原理一般就是根据历史情况，如果前面跳转的多，那就预测会跳转，少就不会，其实就是一个计数器)****。虽然动态预测很简单，但是准确率确实比简单预测要高一些。2.预取转移成功和转移失败两个方向上的目标指令： 这需要额外的加两个指令寄存器什么的，原理就是同时把转移成功和失败的指令都并行运行，例如jmp指令的第一阶段结束以后运行jmp成功的第一条，jmp指令第二阶段结束以后就运行jmp失败的第一条，这样最后总是有的指令是可以继续运行的不需要移除全部。3.加快和提前形成条件码:和第二章学习的全加器是一样的，因为转移的条件不一定需要计算出来才知道，我们可以连上额外的硬件，提前就计算出是否需要转移（说的玄乎其乎的，其实就是在第三个阶段执行结果出来以后立即判断是否转移，不等指令走后面两个阶段了，其实和数据相关的转发机制也很类似)。4.提高转移方向的猜准率： 其实还是第一种方法里面的动态预测，只不过用更好的算法来预测，但是算法更复杂也意味着更大的计算开销。

1.6 流水线的分类

1.6.1 根据流水线使用的级别不同进行分类

（1）部件功能级流水线：就是对每一个部件(比如ALU算术逻辑单元)再进行细分，然后让各个部分并行的完成操作。举个例子：在一次加法操作中，ALU需要完成求阶差，对阶，尾数相加和结果规格化四个过程，其中，不同的过程用到的子操作元件不同，所以可以并行的执行。ps:因为它们是在一个指令里面发生的,所以不是指令流水线，是部件流水线(计组常见的，研究好一套理论以后到处用)。
（2）处理机级流水线：就是上面介绍的指令流水线，把指令分成5段，然后并行执行。
（3）处理机间的流水线：如果有多个处理器(可以理解成多核)，那么就可以实现更多的指令并行执行，比如前面说的互斥的指令。也可以实现第一个处理器完成取指阶段，然后递交到处理机间的公共存储器，交给第二个处理器去完成第二阶段…

1.6.2 按照流水线能完成的功能划分

（1）单功能流水线：只能实现单一功能的流水线。比如要搞个连续加法的时候，我么就可以搞一个加法流水线，快速执行。
（2）多功能流水线：就是可以同时搞多种功能的流水线，比如同时加法和乘法等。

1.6.3 按照连接方式分

（1）静态流水线：同一时间内，只能完成同一种功能(比如只能执行加法)。
（2）动态流水线：同一时间内，可以执行多种运算。其实和按照能完成的功能分没有太大区别，只不过一个强调干了什么，一个强调时间而已。

1.6.4 是否有反馈信号

（1）线性流水线：执行完当前指令就下一条，中间不存在对下面指令的反馈信号。
（2）非线性流水线：执行结束或者过程中对其他指令有反馈信号(最上面的图中就是，执行完成的结果最终还能回到译码阶段的寄存器中)。包括某些功能段会数次通过流水线(比如乘法是多次加法来实现的)。

1.7 流水线的多发技术

1.7.1 超标量技术

其实就是多核运行的模式：

如图所示，就是一次可以同时运行多条指令的同一个阶段，它的特点是不能随便改指令的顺序，同时还要充分考虑互斥和同步问题，对编译器的要求很高。图中流水线速度快了3倍。

1.7.2 超流水技术

它不需要多核来支持，它的原理如图：

不需要等待上一条指令的一个阶段执行完，就可以执行下一条指令。也就是一个时钟周期内，一个功能部件被使用多次。但是对编译设计人员的要求再次增加。图上的流水线速度也快了三倍。

1.7.3 超长指令字

说实话，这个不太好理解。基本原理是这样的：一些指令的执行操作可能会占用不同的部件，那么计算机就会把这些指令给合并成一条大指令，然后执行到执行阶段就全部并行的执行，这样一次就可以执行完很多指令。它也是由编译器来完成的，因为操作码和地址码都合并了，所以指令会很长很长，所以叫超长指令字。同时，它必须有多个处理器才能实现(因为要一起取数据，一起执行，那需要多个MDR和MAR)。

1.8 考查指令流水线时，常考的几个指令

一共有五个：运算类指令，LOAD指令，STORE指令，条件转移指令和无条件转移指令。其中，只有取数指令LOAD和存数指令STORE才需要访问主存。

1.8.1 运算类指令

指令名称	汇编语言	功能
加法指令(寄存器和寄存器)	ADD $R_s, R_d$	$(R_s)+(R_d)\rightarrow R_d$
加法指令(寄存器和立即数)	ADD #666 $R_d$	$666+(R_d)\rightarrow R_d$
算术左移	SHL $R_d$	$(R_d)<<<2\rightarrow R_d$

表格中的 $R_s$ 和 $R_d$ 分别是源寄存器和目的寄存器，同时，因为RISC指令集只能允许寄存器相加，只有寄存器间加法和立即数存寄存器(立即数也是存在指令寄存器里面的，不需要访存)。所以运算类的指令往往不需要访存阶段！ 现在根据下面的图，分析一下它们各个阶段发生了什么：

(1)IF取指阶段：根据PC里面的指令，从指令Cache里面取出需要的指令，存到IF的锁存器里面。
(2)ID指令译码阶段：分析当前指令，并且根据当前的运算类型，把操作数取到AB锁存器或取到立即数锁存器里面。
(3)EX执行阶段：根据ID锁存器里面的值计算，然后把结果放入锁存器。
(4)M空段：因为运算的结果最终只会存到寄存器，所以这里不会涉及访存，会空闲一个节拍。
(5)WB写回阶段：这个阶段就把值写回到寄存器里面(仔细看上面的图最后有一条线连接到ALU后面的寄存器里面)。

1.8.2 LOAD指令

LOAD指令是取数指令，它的汇编写法是：LOAD $R_d$ ,888( $R_s$ )，它的伪代码写作 (888+( $R_s$ )) $\rightarrow R_d$ 。这其实是一种偏移寻址的写法，内存地址中真实数据的位置在基址寄存器+888的位置。它也被写作：LOAD $R_d$ ,mem 也就是省去了偏移的过程，伪代码写作：（mem） $\rightarrow R_d$ 。它的各个阶段执行过程如下：
(1)IF取指阶段：根据PC里面的指令，从指令Cache里面取出需要的指令，存到IF的锁存器里面。
(2)ID指令译码阶段：将基址寄存器的值放入到锁存器A，偏移量放入立即数锁存器Imm。
(3)EX执行阶段：把两个锁存器的值相加，计算出有效的地址放到后面空白的锁存器里。
(4)M段：根据有效地址，取数，然后放入M的锁存器。
(5)WB写回阶段：把最终的值放入目的寄存器.

1.8.3 STORE指令

STORE是存数指令，所以和LOAD取数指令十分地相似。它的汇编写法是：STORE $R_s$ ,888( $R_d$ )，它的伪代码写作 $R_s \rightarrow$ (888+( $R_d$ ))。正好就是取数指令反过来的写法。同样的，它也可以简写为：STORE $R_s,mem$ 记作:STORE $R_s\rightarrow (mem)$ 。它每一段的执行过程和上面也很相似：
(1)IF取指阶段：根据PC里面的指令，从指令Cache里面取出需要的指令，存到IF的锁存器里面。
(2)ID指令译码阶段：将基址寄存器的值放入到锁存器A，偏移量放入立即数锁存器Imm，将要存的数据放入锁存器B中。
(3)EX执行阶段：把两个锁存器的值相加，计算出有效的地址放到后面空白的锁存器里，并且把要存的值放入到锁存器store(store和B是直接相连接的，所以可以直接存入)。
(4)M段：把对应的数据写入Data Cache。
(5)WB写回阶段：空段。

1.8.4 条件转移指令

条件转移指令有很多，这里以beq为例(beq就是等于的时候跳转)。它的汇编格式和功能如下：

汇编格式	功能
$beq\quad R_s,R_t,\#偏移量$	当 $R_S)==(R_t)$ 时(PC)+指令字长+(偏移量x指令字长) $\rightarrow$ PC
	否则：(PC)+指令字长 $\rightarrow$ PC

你有可能已经忘记了前面的知识，现在回顾一下，PC每一次跳转的都是一条指令，所以每一次都会自动的加“1”，这个1就是一个指令的字长，然后偏移往往不是在当前的PC值上偏移，因为在你执行结束的时候，PC的值已经自动的加“1”，所以需要在已经加1的情况下再偏移n条指令。所以PC+1这个操作被描述为：(PC)+指令字长 $\rightarrow$ PC。它每一个阶段发生的事情如下：
(1)IF取指阶段：根据PC里面的指令，从指令Cache里面取出需要的指令，存到IF的锁存器里面。
(2)ID指令译码阶段：将要比较的两个数字放入锁存器A和B，然后把偏移量放入Imm寄存器。
(3)EX执行阶段：通过运算来比较两个数(前面已经学习过如何比较)。
(4)WrPC段(M段)：修改PC的值，把目标的PC值写回PC。它准确来说不是M，也不是WB，因为用到的硬件是不一样的(图上没有画出)，但是它需要时间很短，所以就放到M的时间段执行，不用太纠结，就是说它属于M段也是可以的。
(5)WB写回阶段：空段。因为前4个已经改完PC了。

1.8.5 无条件转移指令

无条件转移指令就和条件转移指令类似，但是简单许多。它的汇编是：jmp #偏移量，记作：(PC)+指令字长+(偏移量x指令字长) $\rightarrow$ PC。这就不用过多解释了。
它每一段发生的如下：
(1)IF取指阶段：根据PC里面的指令，从指令Cache里面取出需要的指令，存到IF的锁存器里面。
(2)ID指令译码阶段：只需要把偏移量放入Imm寄存器。
(3)WrPC(EX)：直接根据偏移量进行WrPC，因为用不到ALU，就用它来取代执行阶段。
(4)M段：空段。
(5)WB写回阶段：空段。

虽然条件转移和无条件转移指令存在空段，但是它们可以进一步的解决冲突的发生。 如果按照前面说的，执行到最后才修改PC的值，那么就会出现更多的冲突，这种提前修改PC的值，就可以最大限度地去避免冲突的发生。但是有的课本确实是把WrPC段设计到最后的(也就是WB阶段)，这样的好处是实现起来简单，所以考试的时候一定要看清楚题目。

2.多处理器系统的基本概念

前面反复提到了多处理器系统，但是一直没有明确说明多处理器系统到底是什么，这部分就来简单学习一下。因为展开讲内容很多，但是考试只会简单的考察基本概念，不会考大题，所以这里就来简单的说一下。

2.1 SISD，SIMD和MIMD的基本概念

基于指令流的数量和数据流的数量，计算机的体系结构可以分为SISD，SIMD，MISD和MIMD四类。常规的单处理器属于SISD，而常规的多处理器属于MIMD。

（1）单指令流单数据流结构(SISD)：
SISD是传统的串行计算机结构，这种计算机通常仅包含一个处理器和一个存储器，处理器在一段时间内仅执行一条指令，按指令流规定的顺序串行执行指令中的若干条指令，为了提高速度，有的SISD计算机采用指令流水线的方式。因此，SISD处理器有时候回设置多个功能部件，并采用多模块交叉方式组织存储器。我们前面学的一直都是SISD系统。

就是单核CPU。它一次只能处理一到两个数据(比如a=a+b,不能处理a=a+b+c，处理a+b+c需要两条指令)。它每一时刻只有一条指令执行，同时只能处理一到两个数据。它甚至连数据的并行处理都做不到。更别提线程并行。

（2）单指令流多数据流结构(SIMD)：
SIMD是指一个指令流同时对多个数据流进行处理，一般称为数据级并行技术，这种结构的计算机通常由一个指令控制部件、多个处理单元组成、每一个处理单元虽然执行的是同一条指令，但是每一个单元都有自己的地址存储器，这样每一个单元都有不同的数据地址，因此，不同的处理单元执行同一条指令所处理的数据是不同的，一个顺序应用程序编译后，可能安置SISD组织并运行于串行硬件上，也可能按照SIMD组织并运行于并行硬件上。通常，SIMD在使用for循环处理数组时最有效，比如一条分别对16对数据进行运算的SIMD指令，如果在16个ALU中同时运算，则仅需一次运算时间就能完成运算。SIMD在使用case或switch语句时效率最低，因为此时每一个执行单元必须根据不同的数据执行不同的操作，然后只有一个结果是有效的。

它就可以用一条指令执行完多个数字的加法：a=a+b+c+d。早期的某些显卡，需要渲染多个像素点，用的也是SIMD架构。它每一时刻也只有一个指令在执行，但是能处理多个相同的数据。其实就是上面说的超长指令字结构！ 它只能做到数据流并行，不能做到线程并行。

（3）多指令流单数据流(MISD)结构：
MISD是指同时执行多条指令，来处理同一个数据，实际上不存在这里的计算机。因为脱裤子放屁的操作不需要。当时只是正好想到而已。

（4）多指令流多数据流(MIMD)：
这是目前最常用的处理器架构，比如因特尔的i5,i7等CPU用的就是MIMD的架构，你电脑和手机ipad里的大概率也是。因为有多个CPU，所以它的特点是可以并行地执行多条指令，同时处理多个不同的数据。 不仅支持线程级的并行(几个核处理同一条指令)，还支持线程级以上的并行(一个核处理一个进程)。**它还有一个常用的名称，叫做多核处理器。**它还能分为以下两类：
[1]多处理器系统(一台计算机)：全称是共享内存多处理器系统(SMP)，各个处理器之间都可以通过LOAD,STORE指令来访问同一个主存，可以通过主存相互传递数据。目前的手机电脑都是这种系统。

这里的主存指的其实包括了Cache，之前说过目前的Cache是被分级的，往往最高的两级L1和L2(速度最快的两级)，是给每一个核都分配一个，然后由它们独享，剩下的L3内存更大也更慢才是共享的。图上画的LLC就是最低一级的Cache，负责几个核之间的通信。 当然，Cache不命中时也可以通过旁边的主存来交互。

[2]多计算机系统(多台计算机)：云计算其实可以看作多计算机系统。它的特点就是由个计算机来完成多个指令和数据的处理，这些指令可以共同组成一个进程。它和上面的共享内存不同的是，每一个计算机都是独立的个体，有自己的内存，它们的内存数据无法通过LOAD和STORE来共享，只能通过互相发消息的方式来传递数据。

多计算机系统其实就是分布式计算系统，也被称为消息传递系统。它能实现MIMD的所有功能，且算力更强(因为电脑更多)。如果你发现一个程序的完成，处理各个指令的CPU的物理地址均相同，那么它就是MSP系统(因为说明是同一个计算机干的)，如果各个指令的CPU物理地址不同，那么大概率就是分布式架构。因为多核处理器的核心都在一个CPU芯片上(你也可以理解成一块板子上有多个CPU，都是一个意思)，所以又把每一个处理器称为一个片，把它称为片级多处理器。

MIMD可以做到线程和进程的并行，数据流并行更是不在话下。 需要注意的一点是，无论是是哪种系统，都是可以做到指令的并发执行的，只不过能并行执行指令的只有MIMD而已(MISD被开除了，哈哈哈)。

2.2 向量处理器

向量处理器只有一个功能，那就是进行向量相关的计算操作。不要小看这个操作，因为向量的运算和图形，渲染阴影等。向量操作的特点就是需要的计算量很大了，计算的形式也单一，所以就针对计算向量，专门推出了向量处理器。向量处理器的示意图如下：

里面的向量寄存器可以直接存一个大型的向量，指令的处理的数据单位均是以向量为单位的。它可以辅助数据的运算(因为从线代的思想来看，数据的计算都和矩阵息息相关)。因为矩阵涉及的数据是很大的(最常见的矩阵数据就是图像，一个图像有1080x720的像素)，所以主存必须支持多端口读取，也就是可以同时并行读取许多条的数据(把数据多条同时读取就是矩阵)。这个了解即可。它可以看作是一个高级的SIMD，最常见的就是我们的显卡。

3.硬件多线程

在操作系统里面已经学习过多线程的概念，但是不知道怎么实现多线程，现在我们就来学习如何真的用硬件实现多线程。这里要分清楚一个知识点，我们之前学习的指令流水线不是多线程的方法，一个指令不是一个线程，一个指令只是同一个线程里面的一小部分而已。所以如图所示的这种处理器，一次只能支持一个线程运行：

但是它支持线程的并发执行，每一次换线程的时候，只不过每一次换线程都会把当前线程的东西给入栈(参考函数调用栈)，会浪费很多时间。
而支持硬件多线程的处理器如图：

不要把它当作多核处理器，这里线程的执行也是并发的。但是它在切换线程的时候，并不需要把当前线程的东西入栈，这是因为它有多组通用寄存器和PC，也就是当它需要切换线程的时候，只需要换一下这些寄存器就行了，不涉及访存，所以更快。但是硬件多线程又分为以下三种：
（1）细粒度多线程： 它在每一个时钟周期内仅发射一个线程的指令，也就是每一个时钟周期都换一次线程，它能做到同一个线程里面的指令并行执行，但是做不到多个线程并行执行。它的线程切换代价很低(因为不需要访存，也不需要额外操作)。

（2）粗粒度多线程：它在每一个时钟周期都发射同一个线程的指令，当线程的指令流水线发生阻塞(需要的资源被占用)的时候，才切换其他线程。它和上面的细粒度多线程一样，只能做到指令的并行执行，做不到线程的并行执行，且它切换线程的代价很大，因为指令流水线被阻塞的时候，有的指令可能已经被执行了许多，而它在切换以后不保存当前已经执行的微指令的结果，所以之后需要重新执行一遍当前的指令(其实挺复杂的，不需要深究)。

（3）同时多线程：一个核里面有两套甚至更多的ALU，可以支持多个线程并行执行。所以它可以在一个时钟周期内发出多个线程的指令，实现线程的并行执行。
配上王道的两个图：

能记住它们的区别即可，不会考大题的，只考察选择题。

本章就结束了，下一章我们将会更细致地探讨总线的相关知识。

你可能感兴趣的:(计算机组成原理,学习,考研)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
传奇修改map地图教程_传奇技能第三祭：NPC的增加、隐藏和脚本修改垃圾箱博物馆传奇修改map地图教程
技能献祭，Get新技能：传奇技能——NPC功能与实现跟航家学技能，用干货带你飞，现学现用，底部有配套学习资源本篇内容简介：通过对游戏内NPC的控制，可以让NPC出现在地图中的任意位置，还可以控制外观显示、自定义命名，新增与隐藏以及脚本功能的实现。一、NPC总控制文本所在路径：D:MirServerMir200EnvirEnvir目录下，找到NPC总控制文本：Merchant，游戏内的所有NPC都在
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
AI问答之手机相机专业拍照模式的主要几个参数解释 piaopiaolanghua 拍摄曝光时间 ISO感光度
一、背景近期突然想了解下手机的专业拍照模式，了解如何拍出拖尾效果，譬如拍摄运动的车辆，长曝光拍摄星空，甚至能够拍到卫星（再来个漂亮的拖尾），因此想到先了解下手机相机专业模式的参数再说，通过AI问答，学习了下，也就有了本文。二、主要参数详细解释截图显示了在“专业”模式下设置的典型核心参数。这些参数共同决定了照片的曝光、清晰度、色彩和焦点。下面逐一解释每个参数及其典型用法：1、ISO640解释：ISO
Python selenium 库 AI老李 python python selenium 开发语言
关键要点PythonSelenium库用于自动化Web浏览器，适合测试和爬虫，中文教程资源丰富。推荐菜鸟教程、CSDN博客和Selenium-Python中文文档，涵盖基础到进阶。学习需注意浏览器驱动匹配和动态加载处理，可能需显式等待。资源推荐以下是适合初学者和中级学习者的中文教程：菜鸟教程：提供全面的Selenium教程，包括安装和示例，详见Selenium教程。Selenium-Python中
Python3 内置函数 AI老李 python python
关键要点Python3的内置函数是解释器直接提供的，无需导入即可使用，涵盖数据类型转换、数学操作、序列处理等多种功能。推荐使用官方文档、菜鸟教程和腾讯云开发者社区的中文资源，适合初学者和中级学习者。资源提供详细解释和示例，学习时可结合实际项目实践。简介Python3的内置函数是编程中常用的工具，方便用户快速实现各种操作。以下是几个主要资源，帮助您学习这些函数的用法。资源推荐Python官方文档：内
three前置课程知识
学习中文网(1.threejs文件包下载和目录简介|Three.js中文网)threejs官方文件包所有版本：https://github.com/mrdoob/three.js/releases更新迭代较快，要选择对应版本使用---下载zip压缩包Threejs官网中文文档链接：https://threejs.org/docs/index.html#manual/zh/重要的内容docs包:文档
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end