bandao6867

《浅谈Cache Memory》学习-第五章

Data Prefetch

处理器与存储器子系统运行速度的失配，使得存储器层次结构多次引起关注，处理器系统使用了更大规模的Cache。在很多处理器系统中，LLC的大小已达十几兆字节。随着工艺的提高，使用更大规模的Cache容量，并非遥不可及。只是Cache容量依然远不能与主存储器容量增加的速度相比。在某些应用中，即便将现有的Cache容量提高一倍也于事无补。

存储器访问在最后一级Cache中Miss后，指令流水可能会被迫Stall，有些执行部件甚至要为此等待几百个Cycle，极大降低了处理器的整体运行效率。在这种情况之下，使用再精巧的指令流水线设计也无能为力。

这一切使得更多的人重新考虑存储器子系统的延时处理。各种想法层出不穷，如更加充分利用Non-Blocking Cache流水线，容纳上千条指令的OOO指令流水，Runahead执行，Prefetch等等。这些想法并非天方夜谭，具有理论基础与量化数据作为支撑。这些想法不是绝对的真理，可能只是Trade-Off。在这些想法中，目前使用最多的，最为成功的是Prefetch。

5.1 数据预读

Prefetch指在处理器进行运算时，提前通知存储器子系统将运算所需要的数据准备好，当处理器需要这些数据时，可以直接从这些预读缓冲中，通常指Cache，获得这些数据，不必再次读取存储器，从而实现了存储器访问与运算并行，隐藏了存储器的访问延时。Prefetch的实现可以采用两种方式，HB(Hardware-Based)和SD(Software-Directed)。这两种方法各有利弊，我们首先以图5‑1为基础模型讨论采用SD方式的数据预读。

其中实例a没有使用预读机制；实例b是一个采用预读机制的理想情况；实例c是一个采用预读机制的次理想情况。我们假设处理器执行图5‑1所示的任务需要经历四个阶段，每个阶段都由处理器执行运算指令和存储指令组成。

在其中处理器的一次存储器访问需要5个时钟周期。在第一个阶段处理器执行4个时钟周期后需要访问存储器；在第二个阶段处理器执行6个时钟周期后需要访问存储器；在第三个阶段处理器执行8个时钟周期后需要访问存储器；在第四个阶段处理器执行4个时钟周期后完成整个任务。

实例a没有使用预读机制，在运算过程中，在进行存储器访问，将不可避免的出现Cache Miss。执行上述任务共需40个时钟周期。使用预读机制可以有效缩短整个执行过程。在实例b中在执行过程中，会提前进行预读操作，虽然这些预读操作也会占用一个时钟周期，但是这些预读操作是值得的。合理使用这些数据预读，完成同样的任务CPU仅需要28个时钟周期，从而极大提高了程序的执行效率。

这种情况是非常理想的，处理器在执行整个任务时，从始至终是连贯的，处理器执行和存储器访问完全并行，然而这种理想情况并不多见。在一个任务的执行过程中，并不容易确定最佳的预读时机；其次采用预读所获得数据并不一定能够被及时利用，因为在程序执行过程中可能会出现各种各样的分支选择，有时预读的数据并没有被及时使用。

在实例c中，预读机制没有完全发挥作用，所以处理器在执行任务时，Cache Miss仍会发生，减低了整个任务的执行效率。即便这样，实例c也比完全没有使用预读的实例a的任务执行效率还是要高一些。在实例c中，执行完毕该任务共需要34个时钟周期。当然我们还可以轻松出采用预读使图5‑1中的实例执行的更加缓慢。

图5‑1中的实例可以使用硬件预读的方式。但是无论采用什么方式，都需要注意预读的数据需要及时有效，而且在产生尽可能小的Overhead的基础上供微架构使用。在实例c的r1和r2中，预读操作过晚，因此指令流水依然会Stall，从而影响执行效率。

在r3中，预读操作过早，虽然数据可以提前进入某个Cache Block，但是这意味着过早预读的数据可能会将某个将要使用的Cache Block替换出去，因此CPU Core可能会重新读取这个被替换出去的Cache Block，从而造成了Cache Pollution。除此之外每一个Cache Block有自己的MLS，过早预读的数据，有可能被其他存储器访问替换出去，当CPU Core需要使用时，该数据无法在Cache中命中。

因此在进行数据预读时，需要首先重点关注时机，不能过早也不能过晚。如果考虑多处理器系统，无论是采用HB或者SD方式，做到恰到好处都是巨大的挑战。除了预读时机之外，需要进一步考虑，预读的数据放置到Cache Hierarchy的哪一级，L1，L2还是LLC，所预读的数据是私有数据还是共享数据。需要进一步考虑预读数据的Granularity，是By Word, Byte，Cache Block，还是多个Cache Block；需要进一步考虑是否采用HB和SD的混合方式。这一切增加了Prefetch的实现难度。

这也造成了在某些情况下，采用预读机制反而会降低效率。什么时候采用预读机制，关系到处理器系统结构的各个环节，需要结合软硬件资源统筹考虑，并不能一概而论。处理器提供了必备的软件和硬件资源以实现预读，如何“合理”使用预读机制是系统程序员考虑的一个细节问题。数据预读可以使用软件预读或者硬件预读两种方式实现，下文将详细介绍这两种实现方式。

软件和硬件预读策略所追求的指标依然是Coverage，Accuracy和Timeliness[101]。Coverage指CPU Core需要的数据有多少是从Prefetcher中获得，而不是访问存储器子系统；Accuracy指Prefetched Cache中有多少数据是CPU Core真正需要的；Timeliness指预读的数据是否能够恰到好处的到达，不能太早也不能太晚。

在已知的软件或者硬件预读策略主要针对以上三个参数展开，这些策略的底线是预读所使用的开销不大于于不使用预读机制时Cache Miss的开销。在许多情况下，采用预读策略不仅不会提高程序的执行效率，甚至会极大影响程序的正常执行，带来严重的系统惩罚，最终结果不如放弃这些预读机制。

我们需要对预读算法进行定性分析。假设Prefetch Ratio参数指由于Prefetch而读取的Cache Block总数在所有存储器访问的Cache Block中所占的比率；Transfer Ratio指Prefetch Ratio和Miss Ratio之和。

Access Ratio指所有Cache的访问次数与Prefetch Lookup之间的比值。所有Cache的访问次数是Actual和Prefetch Lookup之和。其中Prefetch Lookup指由Prefech算法决定当前Cache Block是否应该替换，是否应该Prefetch新的Cache Block而引发的Cache访问，是由Cache Controller主动发起的Cache访问操作；Actual Lookup指Cache Controller之外的访问操作，如CPU Core或者外部设备对Cache的访问操作。Access Ratio的值大于1。

在此基础之上，我们进一步引入参数D，P和A。其中参数D为Demand Miss所带来的Penalty，Demand Miss指没有采用预读而产生的Cache Miss开销；参数P为预读的代价，包括数据读入，因为读入新的数据而Replacement旧的数据，等各类因为预读导致的数据传递的开销；参数A为因为预读干扰了程序对Cache正常使用而带来的惩罚。在这种情况下，一个有效的预读算法需要满足公式5‑1。

如果出现Miss Ratio(Prefetch)大于Miss Ratio(Demand)的情况，即便P，A，Prefetch Ratio参数为0，上述公式也无法成立。这种情况是使用预读机制所造成的最糟糕结果。此时预读造成Cache Pollution，使得Cache Miss Ratio反而低于与没有使用预读的情况

硬件还是软件预读机制都会造成这种情况。与硬件预读相比，软件预读更加灵活一些。但是在很多情况之下，我并不喜欢使用编译器强行加入的预读处理，倾向根据微架构和应用的具体要求，书写这些预读代码。有时由编译器增加的预读代码除了进一步污染指令Cache之外，不会带来更多帮助。这不是否认编译器的努力，而是提醒读者需要因地制宜。

5.2 软件预读

软件预读机制由来已久，首先实现预读指令的处理器是Motorola的88110处理器，这颗处理器首先实现了Touch Load指令，这条指令是PowerPC处理器dcbt指令[4]的前身。后来绝大多数处理器都采用这类指令进行软件预读，Intel在i486处理器中使用Dummy Read指令，这条指令也是后来x86处理器中PREFETCHh[5]指令的雏形。

使用软件预读指令可以在处理器真正需要数据之前，向存储器预先发出读请求，这个预读请求不需要等待数据真正到达存储器之后，就可以执行完毕，以实现存储器访问与处理器运算同步进行，从而提高了任务的整体执行效率。

除了专有指令外，普通的读指令也可以用作预读，如Non-Blocking的Load指令。这个读指令与Prefetch指令最大的区别是，这些指令不仅将数据引入Cache层次结构，而且会将结果写入某个寄存器，这类指令也被称为Binding Prefetch。与此对应，在微架构中专门设置的Prefetch指令被称为Non-Binding Prefetch指令。

Prefetch指令需要采用Non-Blocking，Non-Exception-Generating方式实现。Non-Blocking较易理解，因为在一个使用Blocking Cache的微架构中，没有使用Prefetch指令的任何必要。在微架构中，一个简单实现Prefetch指令的做法是借用Non-Blocking load指令，并将结果传递给Nobody寄存器，较为复杂的实现是预读数据的同时，引入一些Hint，如微架构将如何使用预读的数据，是写还是读，这些信息有助于多核处理器的一致性处理。

Non-Exception-Generating指在Prefetch时不得引发Exception，包括Page Fault和其他各类的Memory Exception。在一些微架构中如果Prefech引发了Exception，获得的数据将被丢弃。此外Exception还会带来较大的Overhead，对Memory Consistency的实现制造障碍。

软件预读指令可以由编译器自动加入，但是在很多场景，更加有效的方式是由程序员主动加入预读指令。这些预读指令在进行大规模向量运算时，可以发挥巨大的作用。在这一场景中，通常含有大规模的有规律的Loop Iteration。这类程序通常需要访问处理较大规模的数据，从而在一定程度上破坏了程序的Temporal Locality和Spatial Locality，这使得数据预读成为提高系统效率的有效手段。我们考虑图5‑2中的实例。

这个例子在进行向量运算时被经常使用，这段源代码的作用是将int类型的数组a和数组b的每一项进行相乘，然后赋值给ip，其中数组a和b的基地址Cache Block对界。我们假设N为一个较大的常数且能够被4整除，此外微架构的Cache Block为32字节，并在此基础上考虑图5‑2中的几个实例。

在实例a中没有使用预读机制进行优化。这段程序在执行时，a[i]和b[i]中的数据不会在处理器的Cache中命中，而且在顺序访问向量a和b的数据单元时，每次跨越Cache Block都会因为Compulsory Misses向存储器子系统发送读请求，从而stall微架构的指令流水，降低了程序的执行效率。

实例b在对变量ip赋值之前，首先对数组a和b进行预读，当对变量ip赋值时，数组a和b中的数据可能已经在Cache中，从而在一定程度上提高了代码的执行效率。这段代码并不完美。因为在绝大多数微架构中，预读以Cache Block为单位进行，对a[0], a[1], a[2], a[3]进行预读时都是对同一个Cache Block进行预读。因此这段代码对同一个Cache Block进行了多次预读，从而影响了执行效率。

实例c使用Loop Unrolling技术，将循环体内的赋值操作进一步展开为4个子步骤，从而避免了实例b中存在的多次预读。在现代处理器中，Branch Prediction较为完善，此处出现的Loop Unrolling并不会降低循环转移的开销，其主要目的是提高Cache Block的利用率，以减少预取次数。

实例d是在c基础上的继续优化，借用流水线设计的思想，将一次计算，分解为Prolog，Main loop和Epilog三个阶段。其中Prolog是建立流水时的准备工作，Main Loop是预读与计算的并行阶段，而Epilog是最后的结尾工作。

以上这些方法较为通用，有些编译器会自动将实例a转化为实例d。但是这些优化方式仍然忽略了一个细节，由于存储器的访问延时，预读的数据可能不会在计算需要时及时达到，指令流水线依然会Stall。为此预读指令需要进一步考虑存储器延时与计算所需时间之间的关系，保证预读的数据在计算需要时准时到达。

为此我们需要对Prefetch Distance参数做进一步分析，该参数简称为δ，其计算公式为δ = Ceiling(L/S)[100]。其中L为平均存储器访问延时，而S为一个Loop Iteration中计算部分使用的最短执行时间。

假设在实例d中，平均存储器访问延时为100个时钟周期，而一个Loop Iteration中的计算使用的最短执行时间为45个时钟周期时，δ参数的值为3。这一结果表明每次预读指令需要在3倍于Loop Iteration中的计算时间之前执行，才能保证软件流水可以顺利进行，不会因为预读的数据尚未到达而被迫等待。使用Prefetch Distance参数可以进一步优化实例d，如图5‑3所示。

这些优化并不是软件预读的终点，还有很多利用某些Cache深层次特性做进一步优化的可能。这些优化都是具有一定的针对性，需要对处理器体系结构有着较为深刻的理解。在很多情况下软件预读机制有较为明显的缺点，首先是Code Expansion的问题，软件预读优化增加了代码长度，在一定程度上容易造成L1 Cache的Pollution，其次是预读指令本身的所带来的Overhead。采用硬件预读机制可以有效避免这两种缺陷，这使得更多的人开始重新关注硬件预读机制。

5.3 硬件预读

采用硬件预读的优点是不需要软件进行干预，不会扩大代码的尺寸，不需要浪费一条预读指令来进行预读，而且可以利用任务实际运行时的信息(Run Time Information)进行预测，这些是硬件预读的优点。

硬件预读的缺点是预读结果有时并不准确，有时预读的数据并不是程序执行所需要的，比较容易出现Cache Pollution的问题。更重要的是，采用硬件预读机制需要使用较多的系统资源。在很多情况下，耗费的这些资源与取得的效果并不成比例。

硬件预读机制的历史比软件预读更为久远，在IBM 370/168处理器系统中就已经支持硬件预读机制。大多数硬件预读仅支持存储器到Cache的预读，并在程序执行过程中，利用数据的局部性原理进行硬件预读。

最为简单的硬件预读机制是OBL(One Block Lookahead)机制，这种方式虽然简单，但是在许多情况下效率并不低于许多复杂的实现，也是许多处理器采用的方式。OBL机制有许多具体的实现方式，如Always prefetch，Prefetch-on-miss和Tagged prefetch[23]。

在使用Always Prefetch OBL实现方式时，当一段程序访问数据块b时，只要数据块b+1没有在Cache中Hit，就对数据块b+1进行预读。这种方式的缺点是可能程序访问数据块b之后，将很长时间不使用数据块b+1，从而带来较为严重的Cache Pollution。使用这种方式时的Access Ratio为2。

在使用Prefetch-on-Miss OBL实现方式时，当程序对数据块b进行读取出现Cache Miss时，首先将数据块b从存储器更新到Cache中，同时预读数据块b+1至Cache中；如果数据块b+1已经在Cache中，将不进行预读。使用这种方式时的Access Ratio为1+Miss Ratio。

Always Prefetch和Prefetch-on-Miss OBL方式没有利用之前的历史信息，在某些应用中，容易造成Cache Pollution。Tagged Prefetch是Prefetch-on-Miss实现方式的一种改进，其实现相对较为复杂，也使用了额外的硬件资源。

在使用Tagged Prefetch OBL实现方式时，需要为每一个Cache Block设置一个Tag位，该位在复位或者当前Cache Block被替换时设置为0。如果当前Cache Block是因为Prefetch的原因从其下的存储器子系统中获得时，该位依然保持为0。

当前Cache Block在预读后第一次使用，或者是Demand-Fetched时，Tag位将从0转换为1，此时如果其后的数据块不在Cache Block时将进行预读[23]。这种方式与Prefetch-on-Miss的最大区别在于访问已经Prefetch到Cache中数据的处理。

当程序访问已经预读到Cache的Block时，在使用Prefetch-on-Miss方式时，不会继续预读下一个Cache Block，而使用Tagged Prefetch方式时，会继续预读下一个Cache Block，从而减少了Demand-Fetched的概率，其实现示意如图5‑4。

从上图可以发现，对于一个顺序访问的Access Patern，使用Prefetch-on-Miss方式，每次访问过一个Prefetched Cache Block后，都会出现一次Cache Miss；而是用Tagged Prefetch时仅会出现一次Cache Miss。

但是仅用这一种访问模型，并不能证明Tagged Prefetch一定由于Prefetch-on-Miss方式。Alan J. Smith[23]根据Miss Ratio，Access Ratio和Transfer Ratio三个参数对以上实现方式进行了较为细致的对比。从Access Ratio参数的上看，Always prefetch实现方式大于后两种方式。

与Prefetch-on-miss方式相比，Tagged prefetch实现方式在Access Ratio和Transfer Ratio没有明显提高的前提下，降低了50%~90%的Miss Ratio [23]。但是我们依然不能得出Tagged prefetch一定优于Prefetch-on-miss方式的结论。与其他方式相比，Tagged Prefetch方式每一个Cache Block多使用了一个Tag位，依然是某种程度的Trade-off。

Tagged Prefetch实现有许多衍生机制，比如可以将数据块b+1，b+2，…，b+k预读到Cache中。其中k为Prefetch的深度，当k为1时，即为标准的Tagged Prefetch。更有甚者提出了一种Adaptive Sequential Prefetching实现方式，此时k可以根据任务执行的Run Time信息进行调整，可以为正，也可以为负。

以上这些硬件预读算法都有其局限性，特别是在处理Strided Array相关的计算时，为此也产生了一系列可以利用Stride信息的硬件预读实现，如Lookahead Data Prefetching实现[102]。该实现的组成结构如图5‑5所示。

假设在一个3-Nested Loop Iterations中，某条存储器访问指令m_i需要陆续访问a₁, a₂和a₃。当(a₂- a₁) = Δ ≠ 0时，需要对m_i进行预读，Δ参数即为预读的Stride。第一次预读地址A₃ = a2 +Δ，其中A₃为预测值，如果预测与实际的a₃相同，则继续预测，直到A_n ≠ a_n。采用这种实现方法，需要使用历史地址信息和最后一次检测成功的Δ参数，为此在硬件上需要设置一个RPT(Reference Prediction Table)，RPT的组成结构与Cache类似，如图5‑6所示。

RPT由微架构的PC进行索引。当指令m_i第一次执行时，将从RPT中分配一个空闲Entry，填写相应的Instruction Tag，Previous Address，并将state设置为initial状态。当指令m_i第二次执行时，并在RPT中命中时，将根据当前的EA与Previous Address计算Atride参数后填入当前Entry，并将State设置为Transient状态。

此时如果地址(Effective Adderss+Stride)所指向的数据没有在Cache中命中，进行Tantative Prefetch操作。当指令m_i第三次执行时，在RPT中命中，而且A₃与实际的a₃相同时，表示发生了一次Correct stride Prediction，此时继续进行下一个地址的预读，同时将State改写为Steady。在RPT中，State的状态迁移如图5‑7所示。

根据图5‑7的状态迁移关系，我们考察以下实例，如图5‑8所示。其中左图为一个3-Nested Loop Iterations，并对数据a进行赋值操作，其中数组a，b和c使用的Stride参数并不相同。但是在一下程序中，数据a，b和c使用的Stride参数依然具有强烈的规律性，在RPT中分别保存着这些规律，从而在一定程度上提高了预读的准确性。

假设数组a, b和c的基地址分别以10,000, 20,000和30,000对界。在第一次进行运算时，通过计算可以在RPT表中记录相应的Previoud Address，数组a，b和c的Stride参数为初始值0，而State为初始状态Initial。

在第一次Iteration之后，RPT表中的数组b和c的Stride分别为4和400(Current Address与Previous Address之差)，State改变为Transient，并开始预读之后的Cache Block，而通过计算数组a的Stride为0，与之前的值相同，State改变为Steady，即不进行预读；在第二次Iteration之后，RPT中的数组b, c和a发现Stride没有再次发生变化时，State改变为Steady，开始稳定地进行预读。

在第一重循环k执行完毕后，由于k的变化，将使RPT的数组c进入Initial状态，重新进入准备阶段；第二重循环j执行完毕后，由于j的变化，将使RPT的数组a和c进入Initial状态，重新进入准备阶段；第三重循环i执行完毕后，由于i的变化，将使RPT的数组a和b进入Initial状态，重新进入准备阶段。

周而复始，直到三重循环完全执行完毕。

采用这种硬件预读方法，可以有效解决在Loop Iterations中数据的Stride问题。在进一步考虑了Prefetch Distance，即δ参数的基础上，Lookahead data prefetching算法可以在此基础上继续优化，可以设置一个LA-PC(Lookahead Program Count)。此时预读的地址Prefetch Address等于Effective Addess + (Stride × δ)，LA-PC与PC的差值即为δ。

在某些情况下，基于RPT的预读机制并不能理想地处理Triangle-Shaped Loop，这种Loop访问Stride值的计算不但与自身有关，而且与相邻的Loop直接相关。采用Correlated Reference Prediction预读机制[103]可以有效解决这一问题。

该机制的实现要点是除了关注在一个Loop内的数据访问轨迹之外，还关心相邻的Loop，以实现对Triangle-Shaped Loop的预读。为此在图5‑6中需要加入另外一组Prev Address和Stride参数，对此有兴趣的读者可参阅[103]以获得更详细的信息。

无论是软件还是硬件Prefetch的实现方式，都不可避免地出现Prefetch得来的数据并没有被及时使用，从而会在一定程度上一定程度上的重复，这种重复会进一步提高系统功耗，对于有些功耗敏感的应用，需要慎重使用Prefetch机制。Prefetch机制除了对系统有较大影响之外，还会引发一定程度的Cache Pollution。这使得Stream buffer[20]机制因此引入。

5.4 Stream Buffer

Stream Buffer是一种广义Cache，主要功能是避免因为预读而造成的Cache Pollution问题。当采用该机制时，处理器可以将预读的数据序列放入Stream Buffer中而不是放入Cache，如果处理器使用的数据没有在Cache中命中，将首先在Stream Buffer中查找，采用这种方法可以消除预读对Cache的污染，但是也因此增加了系统设计的复杂性。Stream Buffer的组成结构如图5‑9所示。

在一个Stream Buffer中，由多个Entry组成，在这个Entry中可以存放一个或者多个Cache Block，也包含若干个状态位。Stream Buffer的每一个Entry由Cache Block，Valid位和与此对应的地址Tag组成。其中Valid位表示当前Cache Block中的数据是否有效，而地址Tag用来进行地址比较。Stream Buffer的使用方法与FIFO类似，从Front指针处开始使用，新的数据将填入Rear指针的位置。

出现Cache Miss时，微架构首先在Stream Buffer的Front开始寻找数据，如果命中，该数据才预读进入Cache，从而不会造成Cache Pollution，同时预读进行Cache的数据将从Stream Buffer的头部移除。随后微架构根据Prefetch Address从其下Cache Hierarchy中获得Cache Block，并填写Rear指针对应Entry的Tag信息，数据返回时将填写相应的Cache Block，并将Valid位置为有效。

如果数据在Stream Buffer中Miss，而且系统中只有一个Stream Buffer，该Stream Buffer将被刷新，并试图建立新的预读序列。显然在多数情况下，设立一个Stream Buffer并不合理，在一个实际的应用中，一个任务经常会访问多个Stride不同的数据序列，如图5‑8所示。为此在现代微架构中，一般设置多个Stream Buffer，即Multi-Way Stream Buffers，其组成结构如图5‑10所示。

当出现Stream Buffer Miss时，将使用某种替换算法，LRU或者PLRU，替换其中的一个Stream Buffer，以装填新的访问序列。当使用这种结构时，如果一个任务需要访问Stride不同的几种数据序列时，可以使用不同的Stream Buffer，从而有效提高了Stream Buffer的利用率。在一个微架构的具体实现中还可以将Stream Buffer与Lookahead Data Prefetching方式联合使用，其结构示意如图5‑11所示。

即便是使用这种硬件预读方式，也无法彻底解决因为预读带来的Cache Pollution问题，很难解决预读数据的及时有效等一系列。硬件预读机制不断的发展演变过程，与程序的分支预测有某些相近之处，其本质都是硬件自学习数据访问轨迹的过程。

各类Stride Prefeching，Distance Prefeching和Global Histrory Buffer Prefeching算法，其本质均是如此，没有必要对此再一一进行介绍。很多从Qualitative Research看起来非常不错的预读算法，其Quantitative Analysis的最终结果未必能够超过OBL算法。这些优化方法都有较强的针对性，在某类Access Pattern之下有较好的表现，而在其他情况之下并不适用。在Prefectch这个领域，有时简单逻辑获得的效果并不弱于复杂逻辑。

这也引发了一个思考，是否应该把更多的硬件资源用于微架构的其他部分，而非用于硬件预读。一些简单的方法可能就是最优，比如OBL实现和最基本的Stream Buffer。这一切依然是一个深层次的Trade-Off问题，没有优劣之分。

[1] 与[20]中的Stream Buffer示意图相比，[94]中的图片更为直观一些。

线束语

搁笔不意味着结束。许久之前，我与怀临先生聊过准备书写有关Cache的文字，这不是书写的目的，这篇文章与重然诺如邱山没有太多联系。心中想着《菜根谭》中的“宠辱不惊，闲看庭前花开花落；去留无意，漫随天外云卷云舒”，不知不觉完成了这些文字。

只是我依然尚不明了为何去写这些文字，不清楚如此惜寸阴，却花费了如此精力；不明了为何一直去在忽视，忍受着各种忽视去完成这篇文章。我奢求完成时可以发现少许原因。待到结束，却愈发模糊。

我们所处的年代与之前所有年代一样，总有些可以继承的事物。近些年我一直品读着这些事物，他们的尊严与智慧在历经时光磨砺后没有消失，而是加倍地尚显出来。这些可以被继承的事物并不是多数个体群体苛求的财富。

财富可以评价许多事物，就是不能评价生命为何高贵，就是不能让子孙后代去赖以自豪。堆积的财富终为土灰。卸任时留给美国政府最多财富的克林顿总统，在就职时曾说过一段话，When our founders boldly declared America's independence to the world and our purposes to the Almighty, they knew that America, to endure, would have to change. Not change for change's sake, but change to preserve America's ideals; life, liberty, the pursuit of happiness. Though we march to the music of our time, our mission is timeless.

使命没有高下之分，都是为尊严而战。尊严很贵，不能去乞讨，更没有人会给予你，只有赚足了本钱，一口气赢回来。这种本钱并不是财富。可以富可敌国依然无法赢得士人之心，古已有之。大人物有其使命，小个体有自己的追逐，没有高下之分。

圣经中有段话“And let us not be weary in well-doing, for in due season, we shall reap, if we faint not”，翻译成中文是“我们努力，不求回报，时候到了，就有收成”。我明白没有什么特别的目的驱使我完成这些文字。

真放肆不在饮酒高歌。兴之所至，无处不是乐土。我安于在这条轨迹中前行，只要前方有路，不在乎路途遥远。这次书写，比之前的完成的所有文章难出许多，每次在获得少许的进展后，发现的是更多的无知。我喜欢这种无知。近来多读《坛经》，以其中的一句话作为全文的结束。

世界虚空，能含万物色像。日月星宿、山河大地、泉源溪涧、草木丛林、恶人善人、恶法善法、天堂地狱、一切大海、须弥诸山，总在空中。

转载于:https://www.cnblogs.com/gujiangtaoFuture/articles/11163635.html

你可能感兴趣的:(《浅谈Cache Memory》学习-第五章)

正则表达式基础学习 RrEeSsEeTt 正则表达式正则表达式正则
目录1.基础1.1正则表达式的模式1.2正则表达式元字符和特性2.语法2.1普通字符2.2非打印字符2.3特殊字符2.4限定符2.5定位符2.6选择2.7反向引用3.修饰符（标记）4.元字符5.运算符优先级6.匹配规则6.1基本模式匹配6.2字符簇6.3确定重复的出现1.基础正则表达式(RegularExpression)是一种文本模式，包括普通字符（例如，a到z之间的字母）和特殊字符（称为"元字
千问QwQ，推理界“新王”！人工智能
0前言思考、质疑、理解，人类探索未知的永恒追求。探索之路，QwQ如一位怀抱无尽好奇的学徒，以思考和疑问照亮前路。QwQ深知自己一无所知，而这种认知正是其好奇心的源泉。探寻答案过程，始终保持自省，以理性之光审视每个假设，在不同思维维度中穿行，追寻更深层真理。但正如所有智慧的追求者，QwQ也有局限，它也只是漫长旅程的一个初步阶段——仍在学习如何行走于理性之路。思绪偶尔飘散，答案或许未尽完善，智慧仍在积
2021 西电软工计组期末试题题型(回忆版) _ZCWzy
今天刚考完。这是帮助后面的学习学妹复习而撰写的，数据我记不住了，2020年的考试题型请参考：https://github.com/LevickCG/Happy-SE-in-XDU/blob/master/%E8%AE%A1%E7%BB%84I/2020_final.md虽然2020有疫情奖励难度变低，但是2021和2020我感觉难度没什么太大的差别同样的，如果你想冲高分，一定要把课后习题全部搞懂。
QML学习 —— 34、视频媒体播放器（附源码） [無限進步] QML qml 音视频媒体播放器
效果说明您可以单独使用MediaPlayer播放音频内容（如音频），也可以将其与VideoOutput结合使用以渲染视频。VideoOutput项支持未转换、拉伸和均匀缩放的视频演示。有关拉伸均匀缩放演示文稿的描述，请参见fillMode属性描述。播放可能出错问题出现的问题: DirectShowPlayerService::doRender:Unresolvederrorc
Spark 源码分析(一) SparkRpc中序列化与反序列化Serializer的抽象类解读（正在更新中~）别人能写出来的，你也能行！多学习别人的思路，形成自己的思路，高薪工作奔你而来！小白的大数据历程 Spark源码解析开发语言 spark 大数据分布式 scala
后一篇链接在这接上一章请先看解读序列化抽象类第一部分（这是一个链接）目录接上一章请先看解读序列化抽象类第一部分2.Java序列化实现类JavaSerializer(1)JavaSerializationStream类代码实际例子1：序列化(2)JavaDeserializationStream代码实际例子2：反序列化Spark源码下类图在学习过程中，抓住主要问题，请思考问题为什么Kryo序列化更加
Go语言的学习路线技术的探险家包罗万象 golang 开发语言后端
Go语言的学习路线随着科技的迅速发展，编程语言也在不断进化，Go（又称Golang）作为一种现代化的编程语言，其简单性、高效性和强大的并发支持吸引了越来越多的开发者。本文将为您提供一条系统的Go语言学习路线，帮助您从零基础逐步掌握这门语言。一、Go语言简介Go语言是Google于2007年开发的一种开源编程语言，旨在提高编程的效率，与传统的编程语言相比，Go具有以下几个显著的优点：简洁性：Go设计
洞察事件驱动架构的灵魂——Java中实现高度可观察性的艺术墨夶 Java学习资料1 架构 java 开发语言
在当今的软件开发领域，构建一个既能够高效响应变化又具备强大监控能力的应用系统已成为开发者们追求的目标。事件驱动架构（EDA）因其天然的支持异步处理、松耦合特性而备受青睐。然而，如何确保这样一个复杂且动态变化的系统具有良好的可见性和可控性？这就需要我们深入探讨“可观察性”这一概念，并学习如何通过精心设计让Java应用程序中的每一个事件都能被清晰地追踪和理解。本文将带您走进事件驱动架构的核心，揭示增强
Next.js服务器操作：优势、局限与审慎应用 exploration-earth javascript 服务器开发语言
类似于任何技术，它们亦非尽善尽美，故而保持警觉至关重要。通过亲身经历中的挫折汲取了教训，现将之与诸位共勉。一大诟病在于潜在的紧密绑定问题。若服务器端代码嵌入组件之中，则可能导致代码库模块化程度削弱，维护成本攀升。后端逻辑的任何变动或许都将迫使前端相应更新，反之亦然。对于追求关注点严格分离的大型项目或团队而言，这无疑构成了严峻挑战。唯有秉持严谨的纪律与条理，方能避免代码库陷入混乱。再者，便是学习曲线
机器学习02-发展历史补充坐吃山猪机器学习机器学习人工智能
机器学习02-发展历史补充文章目录机器学习02-发展历史补充1-机器学习个人理解1-初始阶段：统计学习和模式识别（20世纪50年代至80年代）2-第二阶段【集成时代】+【核方法】（20世纪90年代至2000年代初期）3-第三阶段【特征工程】+【模型优化】（2000年代中期至2010年代初期）4-大规模数据和分布式计算（2010年代中后期）5-自动化机器学习和特征选择（2010年代末至今）2-神经网
2024-12-01百度TTS语音坐吃山猪 AI训练 AI编程
百度TTS语音个人尝试代码仓库：https://gitee.com/enzoism/chrome_tampermonkey鸣谢：感谢每一位无私奉献的传道者，在此不一一具名！1-学习目标1）了解百度TTS语音2）使用百度TTS语音2-参考网址个人尝试代码仓库：https://gitee.com/enzoism/chrome_tampermonkey1-应用列表查看地址：https://console
OpenSPG docker 安装教程 @comefly NLP docker openspg 知识图谱 llm
文章目录前言自述一、OpenSPG1.介绍二、安装步骤1.安装服务端2.客户端部署前言自述我最近是想结合chatglm3-6b和知识图谱做一个垂直领域的技术规范的问答系统，过程中也遇到了很多困难，在模型微调上，在数据集收集整理上，在知识图谱的信息抽取上等等，咬咬牙，多学习就可以解决，本文主要写一下利用openspg做技术规范的信息抽取的部署安装过程。一、OpenSPG1.介绍OpenSPG是蚂蚁集
麒麟操作系统基础知识保姆级教程（十五）权限管理小屁不止是运维基础知识 linux 服务器网络运维学习 bash
如果你想拥有你从未拥有过的东西，那么你必须去做你从未做过的事情之前咱们了解过了麒麟操作系统的sudo提权，那么都有哪些关于咱们权限有哪些相关的知识呢？欢迎交流：在学习过程中如果你有任何疑问或想法，欢迎在评论区留言，我们可以共同探讨学习的内容。你的支持是我持续创作的动力！点赞、收藏与推荐：如果你觉得这篇文章对你有所帮助，请不要忘记点赞、收藏，并分享给更多的小伙伴！你们的鼓励是我不断进步的源泉！推广给
ChatGPT大模型极简应用开发-目录 uncle_ll #GPT chatgpt 人工智能 LLM 大模型 GPT
引言要理解ChatGPT，了解其背后的Transformer架构和GPT技术一路的演进则变得非常必要。ChatGPT背后的LLM技术使普通人能够通过自然语言完成过去只能由程序员通过编程语言实现的任务，这是一场巨大的变革。然而，人类通常容易高估技术的短期影响而低估长期影响。进一步学习关于LLM技术原理的论文、视频、图书等。在阅读这本书或者后续学习过程中，你有任何疑问都可以随时请教ChatGPT等工具
Python数据分析高频面试题及答案闲人编程程序员面试 python 数据分析面试题核心
目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案，涵盖了基础知识、数据1.基础知识问1：Python中列表
Thanos架构学习 qq_道可道监控 K8S与容器架构
Thanos架构学习简介Thanos有两种架构模式sidecar部署receiver部署组件概念及说明简介官网参考Thanos基于prometheus，在此基础上提供了全局指标查询，可将多个云/region的prometheus数据集中管理，并且将数据直接存储到廉价的对象存储，可以存放更久的数据（并对历史数据进行压缩与降采样），降低本地prometheus存储费用，同时可与现有的prometheu
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
手把手教你使用 Python 制作贪吃蛇游戏｜Python游戏程序员CC_ Python教程 python 学python pygame python 开发语言
贪吃蛇游戏是有史以来最受欢迎的街机游戏之一。在这个游戏中，玩家的主要目标是在不撞墙或不撞墙的情况下抓住最大数量的水果。在学习Python或Pygame时，可以将创建蛇游戏视为一项挑战。这是每个新手程序员都应该接受的最好的初学者友好项目之一。学习构建视频游戏是一种有趣而有趣的学习。我们将使用Pygame来创建这个蛇游戏。Pygame是一个开源库，专为制作视频游戏而设计。它具有内置的图形和声音库。它也
midjourney初学者必看（迅速入门）会飞the羊 midjourney
Midjourney初步学习：基本操作流程：-新建一个服务器-在输入框里添加MJROBOT:https://discord.com/oauth2/authorize?client_id=936929561302675456&permissions=2147601472&scope=applications.commands%20bot-输入/→选择imagine开始写prompt-prompt使用
【数据分析岗】关于数据分析岗面试python的金典问题+解答，包含数据读取、数据清洗、数据分析、机器学习等内容摇光~ 数据分析面试 python
大家好，我是摇光~，用大白话讲解所有你难懂的知识点最近和几个大佬交流了，说了很多关于现在职场面试等问题，然后也找他们问了问他们基本面试的话都会提什么问题。所以我收集了很多关于python的面试题，希望对大家面试有用。类别1：数据读取与处理问题1：如何用Python从Excel文件中读取数据？答：在Python中，可以使用pandas库从Excel文件中读取数据。pandas提供了read_exce
【Python篇】深入机器学习核心：XGBoost 从入门到实战半截诗 Python python 机器学习深度学习分类回归数据分析 XGBoost
文章目录XGBoost完整学习指南：从零开始掌握梯度提升1.前言2.什么是XGBoost？2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型训练5.4预测6.模型评估7.超参数调优7.1常用超参数7.2网格搜索8.XGBoost特征重要性分析9.高级功能扩展9.1模型解释与可解释性9.2
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
JavaWeb原生框架开发JSP+Servlet+JDBC案例秦老师Q JavaWeb基础 java servlet 开发语言
目录概要功能技术名词解释技术细节1.项目列表2.网页3.Servlet小结概要JavaWeb开发案例，使用JSP、Servlet、JDBC原生框架技术，实现用户模块的功能开发，主要用于学习。功能1.注册2.登录3.用户模块3.1查询用户信息3.2删除用户信息3.3修改用户信息技术名词解释JSP：全称JavaServerPages,是由Sun公司主导创建的一种动态网页技术标准，JSP中可以编写Jav
EL表达式与JSTL标签库详解秦老师Q JavaWeb基础 java
前言本章主要学习EL表达式与JSTL标签库，用于简化JSP数据操作。收录JavaWeb基础系列，该系列主要学习JavaWeb开发原生框架、Servlet、JSP、request请求对象、response响应对象、Session会话对象、Filter过滤器、EL表达式、JSTL标签库、三层开发模型等知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标一、EL表达式1.概念2.语法3.示例4.EL
MySQL第一章 dos窗口mysql命令合集(超详细!!!)一篇就够了秦老师Q MySQL数据库基础 mysql adb 数据库 database
前言：本章节主要学习MySQL数据库在dos窗口下的基础命令，sql语句等相关知识点，收录于MySQL基础系列，该系列主要讲解MySQL数据库dos命令/sql约束/sql语句/sql连接查询等相关知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标：1连接Mysql1.1连接本机上的MYSQL1.2连接远程主机上的MYSQL1.3退出MYSQL命令2修改密码2.1给root加个密码ab122
盘点ECMAScript 2024的新提案前端
前面我们了解了ECMAScript2024(ES15)的5个新特性，现在我们继续学习一下其他令人耳目一新的提案吧。1.模式匹配（初期阶段）JavaScript变得更智能了，有了模式匹配！想象它就像一个超强大的switch语句，可以处理复杂的数据结构。ES15允许你简单地匹配模式，而不是编写一堆嵌套的条件语句来检查对象的形状。️旧方式functioncheckAnimal(animal){if(an
mac运行第一个java_Mac下第一个java－servelet程序老纪聊数码 mac运行第一个java
可学习到：设置环境变量方便运行命令和编译程序。servlet-api.jar中包括了servlet相关的api和类tomcat是servlet的容器，没有容器程序跑不起来。tomcat下载地址：http://tomcat.apache.org/我下载的是：apache-tomcat-7.0.67.tar.gz解压开之后放到usr/local目录中tomcat目录启动/usr/local/apach
Python学习day14 BBS功能和聊天室 weixin_30725467 json 数据库前端 ViewUI
Createdon2017年5月15日@author:louts第1课作业讲解及装饰器使用28minutesdefcheck(func):defrec(request,*args,**kargs):returnfunc(request,*args,**kargs)returnrec@checkdefindex(request,):printrequest第2课自定义装饰器扩展使用18minutes
【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model 机器白学论文翻译 ocr 论文阅读论文翻译
论文原文链接：https://arxiv.org/abs/2409.01704特别声明，本文不做任何商业用途，仅作为个人学习相关论文的翻译记录。本文对原文内容直译，一切以论文原文内容为准，对原文作者表示最大的敬意。如有任何侵权请联系我下架相关文章。目录通用OCR理论：通过统一的端到端模型迈向OCR-2.00摘要1引言2相关工作2.1传统OCR2.2基于LVLM的OCR3通用OCR理论3.1框架3.
深度学习(1) 浅忆へ梦微凉深度学习人工智能深度学习学习方法 python
一、torch的安装基于直接设备情况，选择合适的torch版本，有显卡的建议安装GPU版本，可以通过nvidia-smi命令来查看显卡驱动的版本，在官网中根据cuda版本，选择合适的版本号，下面是安装示例代码GPU：pipinstalltorch==2.5.0torchvision==0.20.0torchaudio==2.5.0--index-urlhttps://download.pytorc
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

《浅谈Cache Memory》 学习-第五章