Akimoto Akira

computer architecture总结

MIPS64流水线处理器原理与优化技术

1. 流水线基本原理

MIPS流水线基本工作原理

2. 流水线的指令级优化技术

分支优化

调度优化

3.基于tomasulo算法的结构改进

ARM汇编编程（基于恩智浦LPC1768）

1.ＡＲＭ V7 寄存器结构

2. ARM汇编指令的操作

directive

pseudo-instruction

instruction

子程序

3. 异常处理

4. 混合编程

MIPS64流水线处理器原理与优化技术

1. 流水线基本原理

流水线技术是为了提高处理器指令吞吐量（throughput）而萌生的技术。简单来说就是尽量让每个时间段中处理器中所有的部件都同时工作，而不要留有空闲。拿做菜来举个例：

做菜可以分为很多个步骤：洗菜，切菜，炒菜，装盘，传菜。这些步骤在流水线中叫做stage

每一个stage 都会有不一样的工作。在没有作流水化的情况下就如图一所示，在这个情况下，切菜的时候洗菜的池子炒菜的锅装菜的盘子以及传菜的人都不工作，这就会造成很大的资源浪费，5个clock cycle才能做好一道菜，然而在流水化之后，就变成了图二所示的情况，第一道菜做出来需要5个clock cycle ，但是在第一道菜切菜的时候，第二道菜就开始洗菜了，第一道菜开始炒的时候第二道菜开始切第三道菜开始洗，这样经过5个clock cycle整个流水线就被填满，每一个周期每一个部件都在做事，在第五个clock cycle开始，每一个clock cycle就会出来一个指令。这样相当于处理指令的速度提升了5倍。

图一

图二

但是流水线并不是那么十全十美，将一个过程流水化是需要代价的。

流水化后每一个stage所需要的时间都要均衡才能顺利运行起来。所以流水线这种东西，为了均衡每一个stage，快的stage要等慢的stage执行完，所以说流水线中stage 所用的时间是取决于最慢的那个stage的。这样考虑一下其实每一个单独的stage其实所用的时间是增加的。
流水化调度每一个stage需要有额外的运行开支

基于这两个原因，流水线其实在每一个指令的角度上来看是不如非流水线的。而且这种开支是在每一个stage层面上的开支，所以很容易理解流水线分得越细，这种开支对整体运行的影响就越大，所以这也就是为什么不过大提升流水线深度的原因，目前市面上的PC用的芯片大多用的是13级或者是14级左右的流水线，像我们常用的ARM芯片很多也就是4级5级的样子。

MIPS64指令集架构就是专为流水线设计的架构，其设计出了标准的5级流水线，这也是当时MIPS64指令集处理性能比当时Intel的支持X86指令集芯片处理性能要好得多原因之一，就连目前MIPS64架构一直为流水线处理学习最好的范本，国产的龙芯就是以MIPS64指令集为基本架构设计的。

MIPS流水线基本工作原理

最基本的MIPS流水线分为5个stage:

IF（取指）：注意这个instruction memory和data memory其实是同一个
ID（译码）
EX（执行）：在ID部分确定是不是分支语句，分支语句的执行是在这里
MEM（存储器访问）
WB（回写）

结构如下图所示：

考虑到相邻指令在相同流水级的时候可能会发生数据的干扰，所以需要几个缓冲寄存器，把流水级刚处理好的数据存起来。所以流水线就变成了下图这样，灰色的长方形就是寄存器，有些资料上自动省略了这一部分。

到这里，我们结构上的准备已经做好了，也就是说这个流水线基本功能已经齐全了，但是还有一些小的工作需要修修补补。一个很大的问题就是在指令重叠执行的时候遇见某些特殊情况会造成冲突，举个很简单的例子：上个菜我要炒点肉，下到菜也要用这些熟肉，如果上道菜的肉没有出锅的话，下一道菜的炒菜的步骤也进行不下去，因为下一道炒菜的步骤是和上一步装盘是同时做的，你得等装了盘再倒进第二个菜的锅里。当然这只是其中的一种情况。用专业术语来描述这种问题叫做hazard。

在流水线中hazard种类共有3大类：

structure hazard：由于硬件资源不足的原因导致的冲突
data hazard：由于指令需要的数据无法在需要的stage产生而导致的冲突
control hazard：由于不知道下一步PC应该填哪个所以得等前面的指令执行完

而解决这三大类hazard的最直接暴力的方法就是拖，就硬拖到有数据来的时候再运行就好了，这样工程师是省事了。但是处理器的性能上就得牺牲一大截。为了解决这些问题，我们还需要在硬件上进行一些魔改。

对于structure hazard而言出现的问题主要是在IF阶段的时候需要用到memory，在MEM阶段也需要用到memory，而在哈佛结构中指令存储器和数据存储器是同一个，而这个memory又只有一个访问接口每次只能访问一次，读或者写。所以在下图所示的情况中就出现了structure hazard。解决方案要么就花钱在memory上多装几个访问接口支持多次访问，或者说就硬等。

对于data hazard，我们可以在产生数据结果的stage中把数据通路给改造一下，使其尽量一出结果就传到需要的地方，而不是经过MEM和WB stage之后再传回去，这一技术我们称之为forwarding。如何具体实现这一功能呢？首先我们得清楚什么时候会产生数据什么时候需要数据。数据的产生是在MEM阶段才会有的以及在EX阶段的末尾也会有，因此我们从这两个阶段末尾的寄存器中能产出两个结果放到ALU的输入端，具体做法是将MEM/WB寄存器的输出值转发到ALU输入，而EX/MEM寄存器的输出值直接转发到ALU输入上。如下图所示

control hazard是由分支指令引起的，按照原来的结构考虑的话，得到PC结果是在MEM阶段的末尾，所以分支指令要等到前一个指令的MEM执行完才能知道分支到底往哪里跳转。就变成了下图的结果

所以为了早点知道转跳的结果就把计算分支结果的部分从EX阶段搬到了ID阶段，新的结构如下图，在这个结构中，ID阶段就可以知道分支转跳的结果了。所以新的结果在EX阶段就可以给分支语句使用了所以流水线的执行就变成下图的状况。

其中分支语句中会出现两个IF阶段，这是因为第一个IF阶段是分支下一条语句，但是当CPU知道了下一条指令的时候就会再重新取一次目标指令的地址，而当前这条指令就被遗弃掉。这一个重复的IF周期其实也可以利用，我们可以在分支语句判断之前就预测下一条要执行的语句是否为分支语句中的语句，在这个方法下，如果成功预测那么执行过程就不会由任何暂停周期，而不正确的话就会跟前面没有预测一样会有一个额外的周期。另一个方法是利用这一个branch delay slot来执行一个一定会执行且和branch判断无关的语句。这样就能稳定地利用这一个额外地周期，这个方法考验的是编译器的能力，看其如何能找到符合要求的语句就很重要，不过现在的处理器由于流水线太深，导致这个slot变得很长，但是要找那么多语句填满这个空白就会很难，所以趋势就是干脆不用这个技术了，大多数用动态预测来处理。

在出现异常的时候我们得写点程序来处理这些异常（跟中断的思想是一样的）。在这里主要有两种处理异常的方式：precise exception 和 imprecise exception。这两者的区别就是前者需要对断点进行保护，前面正确的语句处理完，等等操作来保证处理完异常之后可以重新回到错误的地方执行。而imprecise exception直接就把在流水线中没有处理完的语句全都给放弃掉，直接处理异常，这样的操作虽然不能重启但是在非常需要实时性的场合很实用，尤其是应急系统中。在处理异常的时候就像在单片机里处理中断一样，只要有异常，立马就把相应的寄存器位置位，所以异常处理的顺序是根据异常发生的顺序来执行的，跟指令的顺序倒是关系不大

除了integer数据以外我们在使用汇编语言的时候还需要使用浮点数据。处理浮点数据的操作是需要和integer数据分开处理的，因为处理浮点数据比integer要复杂所以会需要更多的迭代周期来处理，浮点操作。又由于这个处理数据的EX阶段的操作是不同的硬件unit来处理，所以不同的操作可以在同一时间在EX阶段处理数据。如下图所示的结构。

另外有些多周期迭代的EX单元也是有流水化的，这意味着一个EX单元有许多个小部分，同类的操作进入EX阶段也可以流水化执行，但是也有些操作没有流水化，一般是DIV操作，这就是说这个单元一次只能进行一个DIV的操作。讲其再放大看就是像下图一样的结构了。其中DIV是没有流水化的部分，所以除法只能一个一个做。

如果说运用了这样的结构就会产生很多的问题，因为从上图可知整型加减法只需要一个clock cycle，浮点操作通常需要很多个周期的操作。就有可能造成数据上的错位等等问题，例如下面的例子中在第10和11个周期中有三个指令同时用到了MEM和WB阶段。一般而言，解决这种问题有两种方法，一种是增加硬件的访问通道（这个会很花钱），另一种是干脆等一等加入stall周期就好了。除了这种问题可能还会出现WAW data hazard或者是RAW data hazard的问题，所以在ID阶段会设有hazard检测，来检测structure hazard 和上两种data hazard。

在流水线的实现过程中会遇到一些比较难处理的问题。第一个问题就是流水化过程中异常的处理问题，当某一条指令发生异常时会由一个restart machine来对异常指令和其前后的指令进行一系列操作，使得其在异常时程序停止运行，处理完异常后重新回到原处继续执行程序，具体分为两个步骤：

停止程序的运行，在异常指令的下一个指令的IF阶段设立一个trap instruction来引导程序进入异常处理，并且关闭异常指令和其后执行的指令的读写通道，并且保存异常指令的PC值
返回PC处，并且重新运行异常后一条指令，得到异常处理完之后的正确结果。

在处理的时候还会遇到一个异常发生顺序的问题，因为在运行过程中，各个指令在流水线中是一个阶段一个阶段地执行，那么就有可能发生后一条执行某个阶段出现异常，然而恰好其前一个指令的某个阶段也出现异常，而后一条指令这个阶段发生在前一个阶段之前。如果说这种情况直接处理异常的话就会导致异常处理的顺序和正常非流水化程序处理顺序不一样，这样显然不可接受。为了保证异常处理顺序不乱，这里为每一个正在执行的指令引入了一个指令状态寄存器来检测指令的异常状态，当出现异常时，不会立马就处理，而是状态寄存器顺着流水线向下一阶段一阶段走，直到MEM的末尾或者是进入WB阶段，会对这个寄存器进行检测，如果有异常那么就会处理。由于MEM和WB是根据程序运行的顺序固定好的，所以异常发生的阶段与程序运行的顺序不一致就不会导致异常处理的不一致了。

上述处理异常的过程是一个精确异常的过程，保证这个的原因是为了保证程序要能够重启。相对的会有非精确异常，其常用于在动态调度乱序执行的情况下处理异常。

精确异常需要保证：

1> 异常指令前的程序要执行完

2> 必须能够从scratch寄存器中重启，且重新运行异常指令的后一条指令

对于使用了动态调度算法的处理器中要实现精确异常是很困难的，主要是因为动态调度的指令状态和非流水线运行时的指令状态不完全一致，导致在返回原点执行的时候没办法还原状态。其特点如下：

1> 异常指令之前的指令可能没有完成

2> 异常指令之后的指令可能已经完成了

但是虽然如此，精确异常会花费相对于非精确异常10倍的时间来处理异常，所以一般而言精确异常应用于调试程序过程，非精确异常可用于处理一些应急事件。

2. 流水线的指令级优化技术

流水线主要的参考指标是流水线处理的速度，而影响速度的一方面是处理器的硬件的处理速度，另一方面是我们在硬件功能规划上尽量让处理器不要停下来等待，而是一直保持最佳状态运行下去。这一类的改进目前主要有两类，一类是在指令调度上下功夫，尽量去错开可能会产生暂停的语句，而另一类是在分支上下功夫，前面也说了分支方面即使是说做了那么一些改动，但是还是会有暂停的现象，所以要么就好好利用这个等待时间，要么就预测分支，反正对了我能剩下一部分时间，错了就大不了和原来一样呗，等就是了，总比啥都不做好。

要进行这样些优化首先要明白等待是因为什么，在程序的层面来看是因为上面章节中所说的一些hazard，而hazard产生的原因是dependence，但是dependence 不一定会产生hazard，hazard也不一定会引起程序的暂停。其主要的功能是

主要的dependence 有三类：

1. data dependence：

这类dependence是因为前后语句使用的寄存器读取和使用的顺序因为流水化和重叠执行的原因有些结果前一个指令还没做完后面的语句就得用而造成的，这类dependence 一定是两条指令之间有数据流动的。

其引起data hazard的类是RAW dependence，如下图例：

2. name dependence

这一类是发生在两个没有数据流动的指令之间的，但是依旧是会导致寄存器里的数据混乱，因为写同一个寄存器没有按照指令逻辑顺序写而发生的，可能会引起data hazard的是有两种：WAW（输出相关）和WAR（反相关）。

要解除这两种dependence通常用的方法是寄存器重命名，说白了就是把上面涉及的重复的寄存器其中一个换一个另外的寄存器即可。

3. control dependence

这个就是为了保证分支和其他语句的逻辑而使得分支语句和其他语句的顺序不能随便乱排。所以其实这个dependence是没有引起stall的。

分支优化

分支优化技术主要有两种，一种是动态分支预测，另一种是静态预测。静态预测是实现设计好之后就不变了，这个需要编译器在编译的时候就做好工作，而动态分支预测则需要改变硬件电路。

1. 静态预测

这个和之前说的delay branch slot 技术和rescheduling技术可以混起来用，这样会比较好一点。主要的静态预测原理就是在编译的时候就已经基于人工经验预测taken或者untaken，后期就不再改了。这个方法就很佛系就是了。

2. 动态预测

动态预测的方法有很多主要有一下几种：

BHT（branch history table）

每一个branch指令都对应了BHT中的一个单元，这个单元可以有好几个bit用于记录这个branch是的历史这几个bit叫做predictor，这个predictor其实是一个sturating counter, 这个计数器计数到顶或者底的时候再加或者再减都会保持一个状态不再变化。预测的标准很简单就是以一半为界，不管是几位的都是一样。taken计数超过一半就会预测为taken，untaken计数超过一半就会预测为untaken。拿两位的来说，这个可以看作一个下图所示的FSM

另外还有一个问题就是如何找BHT的entry。这个要看entry的大小比如说有一个1k大小的BHT那么entry就可以用10bit地址线进行编码，那么也就是说用指令地址的最低10bit来判断分支指令在BHT中是在什么位置。

相关预测（correlating predictiors）

这个预测的主要思路是用当前分支之前的几条分支结果来作为预测依据。拿（m,n）预测来举个例子，这里m表示使用前面的m个分支进行预测，共有2^m个predictor，每一个用来预测的predictor的大小为n bit。拿（2，2）预测来举个例子，那么目前的分支预测结果就是由前两个分支决定，前两个分支是否被taken就有2^2种组合方式（这是个移位寄存器，检测到一次结果就往后推一个），每一个组合方式下有一个n bit的计数器来记每一种组合出现的次数。然后可以根据次数来判断当前我们需要的指令是taken还是untaken。结构如下图所示，假设这个表是3bit寻址。

分支目标缓存器（Branch-target buffer）

这个很简单，在硬件中加一个表格，表中记录了所有的分支指令的地址和其预测的吓一跳指令的地址，每执行一个指令就会将指令的地址和表中的地址一一对比，如果在表中，则说明是分支指令，接下来就会对应找到预测出的要存在PC中的地址，并转跳过去。（这个地方我的理解是之前的两种方法用于预测，预测出来的结果会在这个表中更新，而不是作为一种新的预测方法来归类）

调度优化

与前面的同理，调度优化也分为静态优化和动态优化两种，静态调度基于编译器，而动态调度基于硬件。

1. 静态调度

静态调度原理是在编译的时候改变指令的顺序，使指令之间的不再有dependence。第一种方法实现去相关就是将程序看成一个一个basic block组成的，这一个block中一般有4到7条指令（因为这是最可能发生相关的情况），但是这个basic block也有条件，就是出口和入口不能有分支转跳指令。第二种方法是针对循环语句来的，即loop unrolling这个方法首先可以避免过多的分支判断语句出现在程序中（分支语句可能会存在一个多余的IF阶段，所以太多的话可能会浪费时间），另一方面可以在循环体中进行重新调度指令顺序，使得它们不再相关。第三种方法也是针对这个循环的，这种方法称为SIMD（single instruction stream, multiple data stream），能用这一套方法的处理器有两种一种是向量处理器另一种是GPU，其思想是将多个数据排列成一个向量输入处理器中，经过向量运算并行处理后，输出也是一个向量。

2. 动态调度

我们换一个角度来想优化这个事情。在运行的过程中，我们会发现有些指令确实是由于数据没出来而被暂停了，但是有另一些指令是因为前一个指令的工作没做完导致占用资源不放手导致后面的指令即使没有冒险和dependence要跟着一起暂停，就如下面图中所示的几个指令

所以为了解决这个问题我们需要允许程序乱序执行同时不影响执行的结果和逻辑。要实现这一功能我们的硬件电路要将 ID阶段需要分开成两个阶段

issue（发射）：解码指令，检查是否由structure hazard

read operand（读操作数）：如果检测出没有数据冒险，就开始读取操作数

处理数据冒险的过程如下：

issue阶段从寄存器或者队列中读取指令，在这个阶段先来的指令就先issue
随后这些issue的指令会等待操作数，即进入read operand阶段，在这个阶段数据会通过旁路技术或者stall解决data hazard
当这些操作数全都可以用了就进入到EX中

Tomasulo 算法

要理解这个算法首先有几个硬件概念需要知道。

第一个是保留站（reservation station），这个东西相当于一个buffer，用于存储正在等待操作数的指令，在运行过程中指令存在一个FIFO栈中按顺序issue，随后就堆放到保留站中，如果后面有指令的操作数足够且能够执行那么，后面的指令会越过这条指令先执行。另一个概念是CDB（common data bus），在指令计算出结果后，指令会将自己计算出的结果在CDB上广播给正在等待数据的保留站和寄存器，相当于一个数据旁路的作用使数据在计算出来的第一时间可以被指令当成操作数利用起来。

算法的硬件结构图如下所示：

对于一般的运算语句，在这里需要经过4个phase（这里的一个phase并不是一定是一个周期，可能会有多个周期）：

IF（取指）：将指令从内存中取出放入一个FIFO的堆栈中
Issue（发射）：看保留站是不是有位置，如果有位置那么从FIFO栈中顺序取出指令放入保留站中
Execute（执行）：等待操作数，如果操作数能用了就会放到操作单元中进行运算
Write result（写结果）：运算完成后，将结果广播在CDB上，随后传给需要的register和保留站

另外保留站是这个算法的核心部件，其解决了后面指令等待的问题。当前一个指令被操作数原因堵住的时候，有一个指令只要一能执行立马就会运作起来。保留站主要有7个部件：

OP：记录操作类型种类

RS1和RS2：记录需要读取的操作数来自于哪一个保留站

Val1和Val2：如果保留站的值能够读取就会在这两个地方进行记录并将相应的RS置零

Imm/Addr：立即数和地址记录在这里

Busy：记录保留站的状态，如果里面有东西就记为忙碌状态

FP register也有和保留站相似的结构但是只有两个部件：

RS：记录需要读取的操作数来自于哪一个保留站

Val：如果保留站的值能够读取就会在这两个地方进行记录

对于Load/Store操作，这由两个步骤组成

计算物理地址（EA）
访问存储器

为了支持这样的操作，于是分别对于load和store都加了一个buffer，结构如下。在Store Buffer里得Val可以由RS产生，RS也可以等待Load Buffer里的值。

Load操作：

计算EA
比较Store Buffer中的A，如果有匹配到的话就表示可能会有RAW，这个load就不会被发送到load buffer中去，直到这个冲突解决为止

Store操作：

和上面一样，只是说要同时检查Store Buffer中的值和Load Buffer中的值，避免WAR和WAW。

3.基于tomasulo算法的结构改进

> 多发射

在消除data dependences和control dependences导致的停顿后处理器的CPI会越来越近似1，但是如果说每一个周期内只发射一条指令的话这个CPI就不能更小，所以为了进一步缩小CPI就需要一次性多issue几个指令。目前市面上比较多的是以下几种：

> 基于硬件的预测

这个玩意相当于动态调度算法的扩展插槽，其在原有write back阶段分离出了一个commit阶段，计算所得到的所有结果也不会直接放到register file中而是先放到一个reorder buffer中等待commit，在这个commite阶段之前所做的一切都是可以改的，如果说预测不正确，那么就可以将存在reoder budder中将错误的结果给改掉然后再commit。这个东西显然得搭配上动态预测或者静态预测使用，其主要就是为了解决控制相关在预测错误的时候带来的延迟问题，而使用了这个方法后就可以将运行看做是一直都判断正确了。硬件预测主要基于以下三个关键的思想：

用动态分支预测选择要执行哪些指令
用推测处理在控制指令判断之后需要执行的指令
用动态调度来解决在basic block中的不同指令组合执行问题

其与原先的tomasulo不同的地方在于这里先把一些依照原先程序执行的顺序将结果放到reorder buffer中，放在reorder buffer中的数据也能用，只是说可能会在commit之前改掉而已。然后再按顺序commit，得到确认好的数据依次再到register或者memory中。

改进之后的结构如下图所示：

ARM汇编编程（基于恩智浦LPC1768）

1.ＡＲＭ V7 寄存器结构

通用寄存器结构：

其中R0~R12用作通用寄存器用于暂存数据和进行运算。R13位堆栈指针的地址，在堆栈操作时会改变值。R14是连接寄存器，用于子程序的处理，在调用子程序时其会将主程序的PC值存进去。R15为当前PC执行地址。

特殊寄存器结构：

xPSR是状态寄存器，其实包含了三个不同的寄存器分别为APSR(application)\IPSR(interrupt)\EPSR(execution)用于表明各个部分的状态。

在ARM V7架构下的数据有：byte(8 bits), halfword(16 bits), word(32 bits)

寄存器带宽为32位

指令集只支持thumb和thumb-2指令集，其中就包含了16bits 指令和32 bits指令

2. ARM汇编指令的操作

汇编指令集主要包含有三种不同的指令：instruction, pseudo-instruction, directive

其中只有instruction是有对应的机器码可以翻译成101010这样的程序的，其他两种都是给编译器看的，可以引导编译器的行为。

directive

常用的有

AREA(定义段)

area 段名 {段属性1} {段属性2}

段属性主要有两类：

表明段内容是什么 code,data,stack,heap

表明段是不是可以读写 readonly, readwrite, writeonly

RN(寄存器重命名)

RN {新寄存器名},{寄存器编号}

EQU(定义常量)
DCx（定义变量或变量数组）

x的参数表明了变量需要预留空间的大小： B(byte), W(halfword), WU(halfword unsigned), D(word), DU(word unsigned)

ALIGN(用于数据对齐)
SPACE(用于预留空间)

pseudo-instruction

存取memory中的数，其存储顺序是从低地址到高地址

如果需要连续存取数据就要控制好指示存取地址的寄存器内容，共有两种方式来控制

pre-indexing adddressing [Rn,offset] {!} (这个感叹号可以选择是否Rn更新)（先加后存）
post-indexing addressing [Rn],[offset] （先存后加）

instruction

1. MOV，MVN，MOVW，MOVT

- MOV和MVN操作数的要求

8位数据
8位数移位得到的结果
数据格式为 00xy00xy, xy00xy00或xyxyxyxy之间的一种

- MOVW和MOVT的要求

16位数据
MOVW填充寄存器的低16位，MOVT填充寄存器的高16位

- LDR除了从memory中加载数据也可以直接加载常数，加载常数时如果参数符合MOV或MVN的数据条件和格式，编译器会把LDR翻译成MOV或者MVN，如果不符合就会自动在程序末尾创建一个文字池（literary pool），并从中导入数据。

2. 计算指令（查表即可）

大多数计算指令是不能影响标志位的，除了CMP和TST，如果要影响标志位那么就需要在指令的末尾加一个S的后缀。另外在表中还有一些组合指令，可以用来精简程序结构。

3. 分支指令BL，B，BLX，BX

有没有X的区别在于能跳转的范围不同，加了X后缀的可以调用所有4GB范围内的子程序或者分支。flag就是计算时用于指示结果性质的标志位了。

另外的后缀可以在下表中找到

B系列用于调用分支；BL系列用于调用子程序，其会将主程序断点的PC值保存到LR寄存器中。

4. 堆栈和出栈 LDMxx/SMTxx，PUSH，POP

对于LDMxx/SMTxx是堆出栈指令的原本的版本，后面的xx是可以配置的选项，可选项有两个

-IA（increase after）:指针指向的位置先存进去，再移动指针

-DB（decrease before）:先移动指针位置，再存数据

其格式如下所示：

LDMxx/STMxx {!}, {reglist}
其中{!}表示是否在存储后更新寄存器的值，没有!就不会一直保存寄存器的值；
reglist是你想放在堆栈里面的寄存器，这个list是自动排序的，从R0开始往上排，格式为
{R0-R3,R4,R5,LR}
在这里面可以用寄存器的别名,LR其实是R13

PUSH{reglist}=STMDB SP!,{reglist}

POP{reglist}=LDMIA SP!,{reglist}

子程序

子程序的调用需要用BL或者BLX来实现，一般很长的程序才会用BLX。子程序的调用格式一般如下，BL的工作是当前指令的下条指令地址存在LR中，然后转跳到子程序中。而在子程序中将LR寄存器的值放到堆栈中就保证了在子程序中还能继续调用子程序，其堆栈步骤分析如图所示

*****主程序*****
...
BL function
...
END

*****子程序块*****
PROC function
    PUSH {Rx-Ry,LR}
    ...
    POP {Rx-Ry,PC}
ENDP

1. BL将PC(main)放入BL，并把f1标号的地址放在PC中；f1将LR(PC(main))放入堆栈中

2. 把f1中的PC值放入LR寄存器，把f2标号的地址放入PC中；f2将LR(PC(f1))放入堆栈中

3. 将放入堆栈的f1地址弹出至PC中

4. 将放入堆栈的Main函数地址弹出至PC

如果说需要向子程序传递参数的话虽然说有毕竟是汇编程序有一定的自由度可以自己选择，到底是用寄存器直接传参数还是用堆栈又或是用memory传。但是寄存器这个最简单的方法有时候并不适用于过多参数的传递，尤其是在与C语言混合编程的时候，C语言是没有参数个数限制的。所以有一个标准制定出来方便统一标准和模式进行传参，这就是AAPCS。这个标准其实有两个版本，一个是ARM32另一个是ARM64，这里就只讲讲关于这个芯片的了,ARM32标准的内容如下：

R0-R3：程序通过这4个寄存器传递前4个参数，其余参数通过堆栈传递
程序输出的结果：32bit结果放到R0, 64bit结果放到R0和R1中, 128bit结果放到R0-R4中
R4-8R, R10, R11：程序使用这几个寄存器用于存储局部变量
R9用处跟平台相关，一般来说可以用作普通的寄存器

子程序三种参数传递方式

寄存器

直接放到寄存器R0-R3中就可以拿来用了。easy...

存储器

****主程序****
...
mov r0,#0x34
mov r1,#0xa1
ldr r3,=myspace
stmia r3,{r0,r1};这里把参数放进去
bl sub2
ldr r2,[r3]
...


****子程序****
sub2 proc
    push{r2,r4-r8,lr}
    ldmia r3,{r4,r5};把参数对应取出来放到r4,r5里去
    ...
    pop{r2,r4-r8,pc}
endp

堆栈

****主程序****
...
mov r0,#0x34
mov r1,#0xa1
push {r0,r1};压栈参数
bl sub2
pop {r0,r1}
...



****子程序****
sub2 proc
    push{r4-r8,lr}
    ldr r4,[sp,#24]
    ldr r5,[sp,#28];这两句提取堆栈中自己需要的参数
    ...
    pop{r4-r8,pc}
endp

3. 异常处理

(这一块我就留个坑好了。为什么？因为考试不考，回头用到再回来填坑，其实这个东西很容易理解，就理解成中断操作就好了，只不过回有固定的名字，处理的东西是一些异常事件而不是中断事件而已)

4. 混合编程

混合编程在嵌入式领域是一个非常重要的技术，可以让我们更容易接触到最底层的寄存器操作，从而对在指令层级上的优化更加简便。尤其在需要很强实时性的领域，人为的优化显得尤为重要。

1. 在C程序中调用汇编函数

****c程序****
#include "lpc17xx.h"
extern void func1(void);
import int func2(int a, int b);

void main(void)
{
    int k;
    func1();
    k=func2(2,3);
}


****汇编程序****
func1 proc
    export func1 [weak]
    push {Rm-Rn,LR}
    ...
    pop {PC}
endp

func2 proc
    export func2 [weak]
    push {R2-Rn,LR}
    ;在这个函数中可以用R0,R1的值作参数了
    ...
    ;结果放到R0中相当于c函数中的return
    pop {PC}
endp

2. 在汇编语言中调用C函数

****C程序****
void func1(void);
int func2(int a,int b);

void func1(void)
{
    ...
}

int func2(int a,int b)
{
    ...
}


****汇编程序****
eset_Handler   PROC
               EXPORT  Reset_Handler     [WEAK]
               EXPORT  func1             [WEAK]
               EXPORT  func2             [WEAK]
               ...
               BL func1
               ...
               MOV R0,#2
               MOV R1,#1
               BL func2
               ...
stop           B stop
               end

3. 在C程序中写汇编语句

>单句

_asm("mov R1,R2; sub R3,R4,R1")
或者
_asm{mov R1,R2; sub R3,R4,R1}

>多句

_asm{
    mov r1,r2
    add r3,r4,r5
}

需要注意的是在这种编辑方式下会有一些不支持的语句：

BX;BXL
用于传递变量值的LDR
乘法指令及其组合指令
用常数和MOV(MVN)对flag寄存器进行赋值
ADR和ADRL

>在C程序中定义汇编函数

_asm int func1(int a, int b)
{
    mov r0,r1
    ...
}

你可能感兴趣的:(MIPS,pipeline)

MTK CAMERA ISP6S SFP YoonAphrodite mtk camera mtk
1,mtkcam3/pipeline/pipeline/PipelineContextImpl.cpplaunchOneNode()2.mtkcam3/pipeline/pipeline/NodeActorImpl.cppinit()-->onInit()3.mtkcam3/pipeline/hwnode/p2/P2_StreamingNode.cppinit()4.mtkcam3/pipelin
MTK Camera HAL 与 FeaturePipe 架构解析：从硬件抽象到功能管线的工程落地路径
MTKCameraHAL与FeaturePipe架构解析：从硬件抽象到功能管线的工程落地路径关键词MTKCameraHAL、FeaturePipe架构、联发科影像系统、CAM-HAL3、PipelineModel、流控制管理、Node架构、Buffer管理、AndroidCameraFramework摘要MTK的Camera系统在Android平台下采用高度模块化的HAL与FeaturePipe架
Jenkins pipeline 部署docker通用模板 longze_7 jenkins docker Jenkinsfile jenkinspipeline
Jenkinsfile:Docker的NETWORK_NAME不要使用bridge默认网络，要使用自定义的网络如test默认bridge网络：容器间不能用名字互相访问，只能用IP。自定义网络：容器间可以用名字互相访问，Docker自动做了DNS解析。pipeline{agentanyenvironment{//定义镜像名称和标签作为环境变量IMAGE_NAME='my-application'IM
高通平台camera构架sensor驱动详解 a55662551 android camera 驱动 v4l2
1.Sensor驱动的基本概念与流程Sensor驱动的作用：Sensor驱动是Camera硬件与CamX框架之间的桥梁，负责控制Sensor的启动、数据采集、寄存器配置以及与图像处理单元（如IFE、BPS）的交互。通俗理解：就像工厂的“原料采集工”，负责从摄像头传感器（如CMOS）获取原始图像数据，并将数据传递到流水线（Pipeline）中进行加工。数据流关键步骤：Sensor初始化：配置电源、时
tcpdump交叉编译 weixin_45673259 tcpdump 测试工具网络
1.下载路径官网：https://www.tcpdump.org/2.编译解压：tar-xflibpcap-1.10.4.tar.xztar-xftcpdump-4.99.4.tar.xz编译libpcap./configure--host=mips-v720s229-linux--target=mips-v720s229-linuxCC=/opt/A1/mips-gcc720-uclibc229
redis管道 -redis pipeline -redis pipelining shuair redis redis bootstrap 数据库
redis管道文档redis单机安装redis常用的五种数据类型redis数据类型-位图bitmapredis数据类型-基数统计HyperLogLogredis数据类型-地理空间GEOredis数据类型-流Streamredis数据类型-位域bitfieldredis持久化-RDBredis持久化-AOFredis持久化-RDB+AOF混合模式redis事务官方文档官网操作命令指南页面：https
Flink 2.0 DataStream算子全景 Edingbrugh.南空大数据 flink flink 人工智能
在实时流处理中，ApacheFlink的DataStreamAPI算子是构建流处理pipeline的基础单元。本文基于Flink2.0，聚焦算子的核心概念、分类及高级特性。一、算子核心概念：流处理的"原子操作1.数据流拓扑（StreamTopology）每个Flink应用可抽象为有向无环图（DAG），由源节点（Source）、算子节点（Operator）和汇节点（Sink）构成，算子通过数据流（S
Redis 性能优化实战：管道、事务、缓存与连接管理全解析佑瞻数据库与知识图谱缓存 redis 性能优化
在日常开发中，我们常常会遇到Redis操作的性能瓶颈：频繁的命令交互导致网络开销激增，并发更新时的数据一致性难以保证，海量数据遍历引发的阻塞问题……其实，Redis早已为这些场景准备了“利器”。今天我们就深入探讨Redis的管道、事务、扫描迭代、客户端缓存以及连接管理技巧，用实战代码带你玩转性能优化。一、管道（Pipelines）：批量执行命令，减少网络往返当我们需要连续执行多个Redis命令时，
【亲测免费】如何构建适用于Android的Node.js：从零到实践陈宜旎Dean
如何构建适用于Android的Node.js：从零到实践build-nodejs-for-androidBuildnodejsforandroid(arm,arm64,x86,x64,mipsel)perfectlyandprovideprebuiltbinaries,andadockerimageasworkbench.项目地址:https://gitcode.com/gh_mirrors/bu
GlobalFoundries收购MIPS的背景以及意义 InnoLink_1024 芯片人工智能硬件架构人工智能架构
背景MIPS的历史与现状：MIPS的起源：MIPS（MicroprocessorwithoutInterlockedPipelineStages）是一种基于精简指令集（RISC）的指令集架构（ISA），由MIPS计算机系统公司（现为MIPSTechnologies）于1985年开发。MIPS曾是全球三大芯片架构之一（与ARM和x86齐名），广泛应用于嵌入式系统、网络设备、游戏机（如PlayStat
Jenkins Pipeline(二) tomorrow.hello Maven jenkins 运维
1.Pipeline变量在Jenkins管道（Pipeline）中，变量是一种非常有用的功能，它们可以帮助你在构建过程中存储和传递数据。Jenkins管道支持多种方式来定义和使用变量，包括环境变量、脚本变量以及全局变量。1.2脚本变量在pipeline脚本中，你可以使用Groovy脚本来定义和操作变量。pipeline{agentanystages{stage('Example'){steps{s
jenkins 自动化部署之后，不允许在工具上查看源代码小疯仔 jenkins 自动化运维
先来展示一下最终的效果在没有如何操作之前的时候，这个Jenkins部署完成之后会在工具上留有源代码，能点击进去，部署到甲方的服务器上的时候会被看到，这样就会造成源码泄露解决方案可以在Jenkinsfile文件中加入以下代码pipeline{agentanytools{nodejs'nodejs16.20.2'}//步骤stages{}//新增post阶段：在流水线结束后清理工作区post{alwa
Pipeline 管道，进程间通信 Ring__Rain C++c++
在Windows平台下，C++的管道（Pipeline）通信主要分为匿名管道（AnonymousPipes）和命名管道（NamedPipes）两种，分别适用于父子进程和无关进程间的通信。以下从原理、实现到代码示例详细说明：⚙️一、匿名管道（AnonymousPipes）适用场景：父子进程间的单向数据流（如重定向子进程输出）5。核心步骤：父进程调用CreatePipe创建读/写句柄。通过STARTU
【Spring AI】09. ETL 管道
文章目录ETLPipelineAPI概述入门指南ETL接口和实现DocumentReaderJsonReaderTextReaderPagePdfDocumentReaderParagraphPdfDocumentReaderTikaDocumentReaderDocumentTransformerTextSplitterTokenTextSplitterContentFormatTransfor
6. ETL Pipeline-SpringAI实战起凡7 Spring AI etl 嵌入式实时数据库 ai spring 语言模型
ETLPipelineETL是提取、转换、加载的缩写，从原始的文档到数据库需要经历提取（.doc、.ppt、.xlsx等）、转换（数据结构化、清理数据、数据分块）、写入向量数据库。这个过程可以进行多种处理，确保最后的数据适合AI问答。SpringAI提供了ETL框架。它是搭建知识库框架的基石。框架介绍DocumentReader：文档读取器，读取文档，比如PDF、Word、Excel等。如：Jso
SQLite JDBC驱动在MIPS64架构上的实现
本文还有配套的精品资源，点击获取简介：SQLiteJDBC驱动程序允许Java应用通过JDBCAPI与SQLite数据库交互。最新版本的sqlite-jdbc-3.32.3.2.jar支持在基于中国龙芯架构的MIPS64指令集的系统上运行，为开发者提供在特定硬件平台上使用SQLite数据库的能力。本驱动程序特别适合资源受限环境，支持SQL查询、数据操作等数据库操作。开发者可通过JDBC进行数据库编
[netty5: ChannelPipeline & ChannelHandlerContext ]-源码分析 idolyXyz netty5-源码阅读 netty
在阅读该篇文章内容前，推荐先阅读：[netty5:Channel&ServerChannel]-创建流程[netty5:ChannelHandlerMask]-源码分析[netty5:ChannelHandler&ChannelHandlerAdapter]-源码解析从Channel源码来看，Channel将出站操作全部委托给了ChannelPipeline。这么做的原因是为了实现职责分离和灵活的
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
Gradio全解5——Interface：高级抽象界面类（上）龙焰智能 Gradio全解教程 Interface API参数成员函数 launch load from_pipeline intergrate
Gradio全解5——Interface：高级抽象界面类（上）前言5.Interface：高级抽象界面类5.1Interface类详解5.1.1Interface示例1.代码及运行2.代码解析5.1.2InterfaceAPI参数5.1.3Interface类成员函数1.launch()2.load()3.from_pipeline()4.integrate()5.queue()参考文献前言本系列
TM56M152A 十速工业级32位闪存MCU控制器芯片外设接口+硬件加密引擎
TM56M152A（十速科技）产品解析与推广文案一、产品定位TM56M152A是十速科技（TenxTechnology）推出的工业级32位ARMCortex-M0微控制器，主打高性价比实时控制，集成丰富外设接口和硬件加密引擎，适用于智能家居、工业HMI、电机控制等场景。二、核心功能与参数特性参数/性能内核架构ARMCortex-M0@48MHz，1.25DMIPS/MHz存储配置64KBFlash
Unity URP法线贴图实现教程 Thomas_YXQ unity 贴图游戏引擎 Unity3D 性能优化开发语言单一职责原则
前言在UnityURP（UniversalRenderPipeline）中实现法线贴图效果，可以通过以下步骤完成。法线贴图通过修改表面法线方向模拟凹凸细节，无需增加几何复杂度。对惹，这里有一个游戏开发交流小组，希望大家可以点击进来一起交流一下开发经验呀！完整实现步骤：1.准备法线贴图使用图像软件（如Photoshop或Substance）创建法线贴图，或从资源商店获取导入设置：纹理类型：Defau
MIPS架构(无互锁流水级微处理器架构)是什么？ Yashar Qian #嵌入式计算机体系结构硬件架构嵌入式硬件
MIPS架构(无互锁流水级微处理器架构)是什么？MIPS（MicroprocessorwithoutInterlockedPipelineStages,“无互锁流水级微处理器架构”）是一种经典的RISC（精简指令集）处理器架构，由斯坦福大学团队在1980年代开发，后由MIPSTechnologies公司商业化。其设计哲学强调硬件简单性与高效流水线，曾广泛应用于嵌入式系统、网络设备、游戏主机等领域。
M30280F8HP#U5B 瑞萨16位工业MCU微控制器，CAN 2.0B+专用PWM，电机控制专家！
M30280F8HP#U5B（Renesas）产品解析一、产品定位M30280F8HP#U5B是瑞萨电子（Renesas）推出的16位高性能微控制器，属于M16C/80系列，主打工业实时控制与低功耗应用，集成丰富外设接口和增强型定时器，适用于电机控制、工业自动化、汽车电子等场景。二、核心功能与参数特性参数/性能内核架构瑞萨M16C内核@20MHz，1.25DMIPS/MHz存储配置128KBFla
Spring AI ETL Pipeline使用指南超级小忍 SpringAI spring 人工智能
前言（Introduction）版本声明：本文基于SpringAI1.0.0版本编写。由于SpringAI目前仍处于活跃开发阶段，API和组件可能在后续版本中发生变化，请注意及时关注官方文档更新以保持兼容性。在当今大数据和人工智能快速发展的背景下，ETL（Extract,Transform,Load）系统已经不再只是简单的数据搬运工。ETL是数据仓库和数据分析流程中的核心环节，它负责将分散的数据从
Jenkins Pipeline共享库配置错误深度解析与修复实战喜欢编程就关注我 jenkins 运维 Pipeline 共享库配置错误深度解析与修复实战代码
JenkinsPipeline共享库配置错误深度解析与修复实战一、共享库配置错误全景图谱1.1经典错误日志矩阵错误类型典型报错特征触发场景诊断关键点仓库克隆失败FailedtoclonerepositoryGit/SVN仓库地址错误/权限不足网络连通性/凭证配置符号解析失败unabletoresolveclass变量作用域错误/未正确导入类共享库加载顺序/命名空间冲突版本兼容性问题NosuchDS
【翻译】Part4: Texture samplers.
AtripthroughtheGraphicsPipeline2011,part4|Therygblog欢迎回来。上一部分讲的是顶点着色器，还大致介绍了通用的GPU着色器单元。总的来说，它们只是向量处理器，但它们可以访问一种在其他向量处理架构中不存在的资源：纹理采样器。纹理采样器是GPU流水线不可或缺的一部分，其复杂程度（以及趣味性！）足以单独写一篇文章来介绍，那接下来就开始吧。纹理状态在开始实际
STM32F103C8T6 单片机开发指南亿只小灿灿 C 单片机 stm32 嵌入式硬件
一、STM32F103C8T6简介1.1概述STM32F103C8T6是意法半导体（STMicroelectronics）推出的一款基于ARMCortex-M3内核的32位微控制器，属于STM32F1系列（"增强型"产品线）。它以高性能、低成本和丰富的外设资源著称，广泛应用于工业控制、消费电子、物联网等领域。1.2主要特性内核与性能ARMCortex-M3内核，最高72MHz主频1.25DMIPS
UOS下载不同架构软件包只想整天学习 UOS UOS 统信
添加架构sudodpkg--add-architectureamd64#添加AMD架构sudodpkg--add-architecturearm64#添加ARM架构sudodpkg--add-architecturemips64el#添加MIPS架构sudodpkg--add-architectureLoongarch64#添加LoongArch架构卸载架构sudodpkg--remove-arc
ADB 安装 APK 及处理安装弹窗的方法要站在顶端 APP自动化 adb
ADB安装APK及处理安装弹窗的方法总结✅背景说明在自动化测试或CI流程中（如JenkinsPipeline），我们经常需要通过ADB安装APK。但在某些设备上，安装过程会弹出“继续安装”按钮或其他确认界面，导致安装命令阻塞，无法继续执行后续操作。为此，我们需要：避免安装卡住自动点击安装按钮（如果必须）保证脚本兼容性（尤其适配Windows+Jenkins）方法一：使用adbinstall-r--
C#数据流处理：深入解析System.IO.Pipelines的奥秘阿蒙Armon C#工作中的应用 c#php 服务器
C#数据流处理：深入解析System.IO.Pipelines的奥秘在当今高并发、高性能的应用开发领域，高效处理数据流是一项至关重要的挑战。传统的StreamAPI在处理大量数据时，往往面临内存分配效率低、频繁数据拷贝、难以高效处理异步I/O等问题。为了解决这些痛点，.NET团队在.NETCore2.1中引入了System.IO.Pipelines库，为开发者提供了一套高性能、低延迟的数据流处理解
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen