Yahooo-

计算机体系结构（国防科大）-第七章-多处理机

1 共享存储器体系结构
- 1.1 并行计算
- 1.2 多处理机Cache一致性
2 互联网络
- 2.1 互联网络的性能参数
- 2.2 静态连接网络
- 2.3 动态连接网络
3 同步和同时多线程
- 3.1 用一致性实现锁
- 3.2 同时多线程
4 并行处理器的性能评测
5 多处理机实例

1 共享存储器体系结构

1.1 并行计算

并行计算：指同时对多个任务或多条指令或多个数据进行处理。完成此项处理机的计算机系统称为并行计算机系统，它将多个处理机通过网络以一定的连接方式有序地组织起来。

并行计算的应用分类：

计算密集型
数据密集型
网络密集型

并行计算体系结构的分类：

单指令单数据流（SISD）
单指令多数据流（SIMD）
多指令单数据流（MISD）
多指令多数据流（MIMD）

MIMD机器分为两类：

集中式共享存储器结构，UMA(uniform access)
分布式存储器结构
分布式存储器优于采用集中式共享存储器结构
分布式存储器结构需要搞宽带的互联。

分布式存储器结构：

优点：
- 可降低对存储器和互联网带宽要求；
- 对局部存储器的访问延迟低。
缺点：处理器之间的通信复杂，各处理器之间的延迟较大。

两种地址空间的组织方案：

分布式共享存储器（DSM）或可缩放共享存储器体系结构：物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址。
多计算机：这个地址空间由多个独立的地址空间构成，它们在逻辑上也是独立的，远程处理器不能对其直接寻址

两种通信模型：

共享地址空间的机器：利用load和store指令中的地址隐含地进行数据通信。
多个地址空间的机器：通过处理器间显式地传递消息完成（消息传递机器，根据简单的网络协议，通过传递消息来请求某些服务或传输数据，从而完成通信）。

衡量通信机制的性能：

通信带宽
通信延迟：通信延迟 = 发送开销+跨越时间+传输延迟+接收开销。
通讯延迟的隐藏：将通信和计算或多次通信之间重叠，以实现通讯延迟的隐藏。

共享存储器通信主要有以下优点：

与常用的对称式多处理机使用的通信机制兼容。
当处理器通信方式复杂或程序执行动态变化时易于编程，同时在简化编译器设计方面也占有优势。
当通信数据较小时，通信开销较低，带宽利用较好。
通过硬件控制的Cache减少了远程通信的频度，减少了通信延迟以及对共享数据的访问冲突。

消息传递通信机制的主要优点包括：

硬件较简单。
通信是显式的，从而引起编程者和编译程序的注意，着重处理开销大的通信。当然，可在支持上面任何一种通信机制的硬件模型上建立所需的通信模式平台。在共享存储器上支持消息传递相对简单，因为发送一条消息可通过将一部分地址空间的内容复制到另一部分地址空间来实现。在消息传递的硬件上支持共享存储器就困难得多。

并行处理面临的挑战：

程序中有限的并行性
相对较高的通信开销

在并行处理中，负载平衡、同步和存储器访问延迟等影响性能的因素常依赖于高层应用特点，如应用程序中数据的分配，并行算法的结构以及数据在空间和时间上的访问模式等。

依据应用特点可把多机工作负载大致分成两类：单个程序在多处理机上的并行工作负载和多个程序在多处理机上的并行工作负载。

反映并行程序性能的一个重要的度量是计算与通信的比率。如果比值较高，就意味着应用程序中相对于每次数据通信要进行较多的计算。计算／通信比率随着处理的数据规模增大而增加，随着处理器数目的增加而降低。

1.2 多处理机Cache一致性

多个处理器共享一个存储器，当处理器规模较小时，这种机器十分经济。支持对共享数据和私有数据的Cache缓存。私有数据供一个单独的处理器使用，而共享数据供多个处理器使用。共享数据进入Cache产生了一个新的问题：Cache的一致性问题的一致性问题。

不一致产生的原因：

I/O操作：Cache中的内容可能与由I／O子系统输入输出形成的存储器对应部分的内容不同。
共享数据：不同处理器的Cache都保存有对应存储器单元的内容。

实现一致性的基本方案：

共享数据的迁移
共享数据的复制

Cache一致性协议

关键：跟踪共享数据块的状态；
共享数据状态跟踪技术：
- 目录：物理存储器中共享数据块的状态及相关信息均被保存在目录中。
- 监听：Cache中保存着各个块的共享状态信息，Cache控制器通过监听总线来判断它们是否有总线上请求数据块。
协议：
- 写作废协议：在一个处理器写某个数据项之前保证它对该数据项有唯一的访问权。
- 写更新协议：当一个处理器写某数据项时，通过广播使其他Cache中所有对应的数据项拷贝进行更新。
- 写作废与写更新差别：
  - 对同一数据的多个写而中间无读操作的情况，写更新协议需进行多次写广播操作，而在写作废协议下只需一次作废操作。
  - 对同一块中多个字进行写，写更新协议对每个字的写均要进行一次广播，而在写作废协议下仅在对本块第一次写时进行作废操作。
  - 从一个处理器写到另一个处理器读之间的延迟通常在写更新模式中较低。而在写作废协议中，需要读一个新的拷贝。
  - 在基于总线的多处理机中，写作废协议成为绝大多数系统设计的选择。
监听协议及其实现：
- 小规模多处理机中实现写作废协议的关键利用总线进行作废操作，每个块的有效位使作废机制的实现较为容易。
- 写直达Cache，因为所有写的数据同时被写回主存，则从主存中总可以取到最新的数据值。
- 对于写回Cache，得到数据的最新值会困难一些，因为最新值可能在某个Cache中，也可能在主存中。
- 在写回Cache条件下的实现技术
  - 用Cache中块的标志位实现监听过程。
  - 给每个Cache块加一个特殊的状态位说明它是否为共享。
  - 因为每次总线任务均要检查Cache的地址位，这可能与CPU对Cache的访问冲突。可通过下列两种技术之一降低冲突：复制标志位、采用多级包含Cache。
基于目录的Cache一致性
- 存储器分布于各结点中，所有的结点通过网络互连。访问可以是本地的，也可是远程的。
- 不支持Cache一致性：规定共享数据不进入Cache，仅私有数据才能保存在Cache中。
- 优点：所需的硬件支持很少(因为远程访问存取量仅是一个字（或双字），而不是一个Cache块)
- 缺点：
  - 实现透明的软件Cache一致性的编译机制能力有限。
  - 没有Cache一致性，机器就不能利用取出同一块中的多个字的，开销接近于取一个字的开销。这个优点是因为共享数据是以Cache块为单位进行管理的。当每次访问要从远程存储器取一个字时，不能有效利用共享数据的空间局部性。
  - 诸如预取等延迟隐藏技术对于多个字的存取更为有效，比如针对一个Cache块的预取。
- 解决Cache一致性问题的关键：
  - 目录协议：目录：用一种专用的存储器所记录的数据结构，它记录着可以进入Cache的每个数据块的访问状态、该块在各个处理器的共享状态以及是否修改过等信息。
  - 对每个结点增加目录表后的分布式存储器的系统结构。

2 互联网络

概念：互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络，这些结点可能是处理器、存储模块或者其它设备，它们通过互连网络进行信息交换。在拓扑上，互连网络为输入和输出两组结点之间提供一组互连或映象（mapping）。

2.1 互联网络的性能参数

网络规模：网络可用图来表示。这种图由用有向边或无向边连接的有限个结点构成。

结点度：与结点相连接的边的数目称为结点度(node degree)。这里的边表示链路或通道。链路或通道是指网络中连接两个结点并传送数字信号的通路。在单向通道的情况下，进入结点的通道数叫做入度(in degree)，而从结点出来的通道数则称为出度(out degree)。结点度是这两者之和。结点度应尽可能地小并保持恒定。

网络直径:网络中任意两个结点间最短路径长度的最大值称为网络直径。网络直径应当尽可能地小。

等分宽度:在将某一网络切成相等两半的各种切法中，沿切口的最小通道边数称为通道等分宽度b (channel bisection width)。

结点间的线长(或通道长度)：它会影响信号的延迟、时钟扭斜和对功率的需要。对于一个网络，如果从其中的任何一个结点看，拓扑结构都是一样的话，则称此网络为对称网络。对称网络较易实现，编制程序也较容易。

路由（routing）：在网络通信中对路径的选择与指定。通常见到的处理单元之间的数据路由功能有移数、循环、置换(一对一)、广播(一对全体)、选播(多对多)、个人通信(一对多)、混洗、交换等。

互联函数：为了反映不同互连网络的连接特性，每一种互连网络可用一组互连函数来定义。如果把互连网络的N个入端和N个出端各自用整数0，1，…，N- 1代表，则互连函数表示互连的出端号和入端号的一一对应关系。令互连函数为f,则它的作用是：对于所有的0≤j≤N-1, 同时存在入端j连至出端f(j)的对应关系。

几种数据路由功能：

循环
置换
均匀混洗
超立方体路由功能
广播和选播
消息传递机制
- 存储转发：每个结点有一个包缓冲区，包先进入缓冲区，当所需要的输出通道和接收结点的包缓冲区可用时，就将它传输给下一结点。
- 虫蚀（wormhole）把包进一步分成小片，硬件路由器有片缓冲区，同一个包中所有片像不可分离的同伴一样，以流水方式顺序传送。只有片头包含目标地址，所有片必须跟随片头。
- 维序按多维网络维序的特定顺序来选择后续通道。由于唯一性，可能产生死锁。
- 虚拟自适应将一个物理通道分成几个虚拟的通道，根据后续各虚拟通道的忙闲情况自适应选择后续通道。

影响互连网络性能的因素为：

功能特性——即网络如何支持路由、中断处理、同步、请求／消息组合和一致性。
网络时延——即单位消息通过网络传送时最坏情况下的时间延迟。
带宽——即通过网络的最大数据传输率，用M字节／秒表示
硬件复杂性——即诸如导线、开关、连接器、仲裁和接口逻辑等的造价。
可扩展性——即在增加机器资源使性能可缩放的情况下，网络具备模块化可缩放的能力。

2.2 静态连接网络

静态网络： 使用直接链路，它一旦构成后就固定不变。这种网络比较适合于构造通信模式可预测或可用静态连接实现的计算机系统。

分类：

线性阵列(linear array) 这是一种一维的线性网络，其中N个结点用N-1个链路连成一行。内部结点度为2，端结点度为1。直径为N-1，N较大时，直径就比较长。等分宽度b=1。线性阵列是连接最简单的拓扑结构。这种结构不对称，当N很大时，通信效率很低。在N很小的情况下，实现线性阵列是相当经济和合理的。由于直径随N线性增大，因此当N比较大时，就不应使用这种方案了。线性阵列与总线的区别是很大的，总线是通过切换与其连接的许多结点来实现时分特性的，而线性阵列则允许不同的源结点和目的结点对并行地使用其不同的部分(通道)。
环和带弦环(chordal ring) 环是用一条附加链路将线性阵列的两个端点连接起来而构成的。环可以单向工作，也可以双向工作。它是对称的，结点度是常数2。双向环的直径为N／2，单向环的直径是N。如果将结点度由2提高至3或4，即可得到两种带弦环。增加的链路愈多，结点度愈高，网络直径就愈小。16个结点的环网络直径3。全连接网络(completely connected network)的结点度为15，直径为1。
循环移数网络(barrel shifter) ，其结点数N=16，它是通过在环上每个结点到所有与其距离为2的整数幂的结点之间都增加一条附加链而构成的。这就是说,如果｜j-i｜=2r，r=0,1,2,…,n-1，网络规模N=2n，则结点i与结点j连接。这种循环移数网络的结点度为d=2n-1，直径D= n／2。循环移数网络的连接特性与结点度较低的任何带弦环相比是有了改进。对N=16的情况，循环移数网络的结点度为7，直径为2。
树形和星形(tree and star) ，一棵5层31个结点的二叉树。一般说来，一棵k层完全平衡的二叉树有N=2k-1个结点。最大结点度是3，直径是2(k-1)。由于结点度是常数，因此二叉树是一种可扩展的结构，但其直径较长。星形是一种2层树，结点度较高，为d=N-1(度)。直径较小，是一常数2。胖树形1985年Leiserson提出将计算机科学中所用的一般树结构修改为胖树形(fat tree)。胖树的通道宽度从叶结点往根结点上行方向逐渐增宽，它更象真实的树，愈靠近树根的枝叉愈粗。使用传统二叉树的主要问题之一就是通向根结点的瓶颈问题，这是因为根部的交通最忙。胖树的提出使该问题得到了缓解。
网格形和环
- 网形N= nk个结点的k维网络的内部结点度为2k，网络直径为k(n-1)。纯网络形不是对称的。边结点和角结点的结点度分别为3或2。n为每维上的结点数二维网格两个结点之间的路径数为K=(X+Y)!/(X!Y!)，XY分别为两结点之间距离增量。对三维网格，两个结点之间的路径数为K= (X+Y+Z )!/ (X!Y!Z! ) ，XYZ分别为两结点之间距离增量。
- 环形网可看做是直径更短的另一种网格。这种拓扑结构将环形和网格组合在一起，并能向高维扩展。环形网沿阵列每行和每列都有环形连接。一般说来，一个n×n二元环网的结点度为4，直径为2*[n/2」.环网是一种对称的拓扑结构，所有附加的回绕连接可使其直径比网格结构减少二分之一。
超立方体 ，这是一种二元n-立方体结构，它已在nCUBE和CM-2等系统中得到了实现。一般说来，一个n-立方体由N=2n个结点组成，它们分布在n维上，每维有两个结点。4-立方体可通过将两个3-立方体的相应结点互连组成。一个n-立方体的结点度等于n，也就是网络的直径。实际上，结点度随维数线性地增加，所以很难设想超立方体是一种可扩展结构。k元n-立方体的结点可用基数为k的n位地址A=a0a1a2…an来表示，其中ai代表第i维结点的位置。为简单起见，所有链路都认为是双向的。网络中每条线代表两个通信通道，每个方向一个。低维k元n-立方体称为环网，而高维二元n-立方体则称为超立方体。
低维网络在负载不均匀情况下运行较好，因为它们有较多的资源共享。在高维网络中，连线常分配给指定的维，各维之间不能共享。例如，在二元n-立方体中，可能有的线已达到饱和，而物理上分配给其它维的相邻的连线却都还空闲。网络直径的变化范围很大。但随着硬件路由技术的不断革新(如虫孔方式），路由已不是一个严重问题，因为任意两结点间的通信延迟在高度流水线操作下几乎是固定不变的。链路数会影响网络价格，等分宽度将影响网络的带宽。对称性会影响可扩展性和路由效率。

2.3 动态连接网络

概念：

为了达到多用或通用的目的，需要采用动态连接网络，它能根据程序要求实现所需的通信模式。它不用固定连接，而是沿着连接通路使用开关或仲裁器以提供动态连接特性。
按照价格和性能增加的顺序，动态连接网络的排队次序为总线系统、多级互连网络(MIN)和交叉开关网络
采用动态网络的多处理机的互连是在程序控制下实现的。定时、开关和控制是动态互连网络的三个主要操作特征。

动态网络分类：

根据级间连结方式，单级网络(single-stage network)也称循环网络(recirculating network), 因为数据项在到达最后目的地之前可能在单级网络中循环多次。单级网络的成本比较低，但在建立某种连接时可能需要多次通过网络。交叉开关和多端口存储器结构都属于单级网络。
多级网络由一级以上的开关元件构成。这类网络可以把任一输入与任一输出相连。级间连接模式的选择取决于网络连接特性。不同级的连接模式可能相同也可能不相同，这与所设计的网络的类型有关。Omega网、Flip网和Baseline网都是多级网络。
- 如果同时连接多个输入输出对时,可能会引起开关和通信链路使用上的冲突，这种多级网络称为阻塞网络(blocking network)。阻塞网络的实例有Omeage网(Lawrie,1975)、Baseline网(Wu和Feng,1980)、Banyan网(Goke和lipovski,1973)和Delta网(Patel,1979)。
- 如果多级网络通过重新安排连接方式可以建立所有可能的输入输出之间的连接，则称之为非阻塞网络(nonblocking network)。这类网络中，任何输入输出对之间总可以建立连接通路。Benes网络(Benes,1965)具有这种功能。

总线系统：

总线系统实际上是一组导线和插座，用于处理与总线相连的处理器、存储模块和外围设备间的数据业务。总线只用于源(主部件)和目的(从部件)之间处理业务。在多个请求情况下，总线仲裁逻辑必须每次能将总线服务分配或重新分配给一个请求。
系统总线在处理机、I／O子系统、存储模块或辅助存储设备(磁盘、磁带机等)之间提供了一条公用通信通路。公用总线是在分时基础上工作的。总线研制中的重要问题有总线仲裁、中断处理、一致性协议和总线事务的处理等。

交叉开关网络：

在交叉开关网络中，每个输入端通过一个交叉点开关可以无阻塞地与一个空闲输出端相连。交叉开关网络是单级网络，它由交叉点上的一元开关构成。交叉网络主要用于中小型系统。
从存储器读出的数据一旦可用时，该数据通过同一交叉开关回送给请求的处理器。通常，这类交叉开关网络需要使用n×m个交叉点开关。正方形交叉开关网络(n＝m)可以无阻塞地实现n!种置换。
在交叉开关网络的每一行中可以同时接通多个交叉点开关，所以交叉点开关网络中n对处理器可以同时传送数据。
交叉开关网络的带宽和互连特性最好。
交叉开关网络每个周期可以实现n个数据传输，与每个总线周期只传一个数据相比，它的频宽最高。交叉开关网络对小型多处理机系统来说性能价格比较高。但单级交叉开关网络一旦构成后将不能扩充。

多端口存储器：

许多大型的多处理机系统都采用多端口存储器结构。其主要思想是将所有交叉点仲裁逻辑和跟每个存储器模块有关的开关功能移到存储器控制器中。
由于增加了访问端口和相应的逻辑线路，存储器模块的成本就变得较为昂贵。每个存储器模块的n个输入端口与n个开关相连，一次只能接收n台处理器中的一个请求。
多端口存储器结构是一个折衷方案，它介于低成本低性能的总线系统和高成本高带宽的交叉开关系统之间。总线被所有处理器和与之相连的设备模块分时地共享。多端口存储器则负责分解各台处理器的请求冲突。
当m和n值很大时，这种多端口存储器结构将变得十分昂贵。典型的多处理机应用配置是四台处理机和16个存储器模块。

多级网络：

多级网络可用于构造大型多处理机系统。每一级都用了多个a×b开关，相邻级开关之间都有固定的级间连接。为了在输入和输出之间建立所需的连接，可用动态设置开关的状态来实现。
各种多级网络的区别就在于所用开关模块和级间连接模式的不同。一个a×b开关模块有a个输入和b个输出。一个二元开关与a=b=2的2×2开关模块相对应。在理论上a与b不一定要相等，但实际上a和b经常选为2的整数幂，即a=b=2k，k≥1。最简单的开关模块是2×2开关。常用的级间连接模式包括混洗、交叉、立方体连接等。
构成动态网络的总线、多级网络、交叉开关中，总线的造价最低，但其缺点是每台处理器可用的带宽较窄。总线所存在的另一个问题是容易产生故障。有些容错系统，如用于事务处理的Tandem多处理机等，常采用双总线以防止系统产生简单的故障。
由于交叉开关的硬件复杂性以n2上升，所以其造价最为昂贵。但是，交叉开关的带宽和路由性能最好。如果网络的规模较小，它是一种理想的选择。
多级网络则是两个极端之间的折衷。它的主要优点在于采用模块结构，因而可扩展性较好。然而，其时延随网络的级数而上升。另外，由于增加了连线和开关复杂性，价格也是一种限制因素。

3 同步和同时多线程

基本硬件原语：

原子交换（Atomic Exchange）它的功能是将一个存储单元的值和一个寄存器的值进行交换。
测试并置（test_an d_set）先测试一个值，如果符合条件则修改其值。
读取并加1 （fetch_and_increment）返回存储单元的值并自动增加该值。
指令对LL&SC从第二条指令的返回值可以判断该指令对的执行是否成功。

3.1 用一致性实现锁

采用多处理机的一致性机制来实现旋转锁（Spin-locks）。旋转锁是指处理器环绕一个锁不停地旋转而请求获得该锁。当锁的占用时间很少以及加锁过程延迟很低时可采用旋转锁。

        DADDUI R2，R0, ＃1
lockit：EXCH  R2 ,0( R1)；原子交换
        BNEZ R2，lockit；是否已 加锁?

两点好处：

可使环绕的进程对本地Cache块进行操作；
可利用锁访问的局部性。

本地Cache旋转锁的代码：

lockit：LD R2，0( R1)；取锁值
        BNEZ R2，lockit；锁不可用
        DADDUI R2，R0, ＃1；存入锁值
        EXCH R2，0( R1)；交换
        BNEZ R2，lockit；如果锁不为0转移

3.2 同时多线程

将线程级并行转换为指令级并行：

同时多线程技术是一种在多流出、动态调度处理器上开发线程级并行和指令级并行的改进的多线程技术；
同时多线程使多个线程以重叠的方式共享单个处理器的功能单元。为实现这种共享，处理器必须保存各个线程的独立状态。例如，需要复制每个线程的独立的寄存器文件，独立的程序计数器（PC），以及独立的页表等等。对于线程访问的存储器，可以通过支持多道程序技术的虚拟存储机制来实现共享。另外，硬件必须能够较快地完成线程间的切换。
同时多线程（SMT）开发的基础是使用动态调度技术的处理器已经具有了开发线程级并行所需的硬件设置。具体来说，动态调度超标量处理器有大量的虚拟寄存器组，可以用来保存每个独立线程的寄存器状态（假设每个线程都有一个独立的重命名表）。
由于寄存器重命名机制提供了唯一的寄存器标识符，多个线程的指令可以在数据路径上混合执行，而不会导致各线程间源操作数和目的操作数的混乱。这表明多线程技术可以通过在一个乱序执行的处理器上为每个线程设置重命名表、保留各自的PC值、提供多个线程的指令结果提交的能力来实现。

同时多线程处理器的设计：

细粒度调度方式下对单个线程的性能的影响设置优先线程。
其他主要问题
- 设置用来保存多个上下文所需的庞大的寄存器文件；
- 必须保持每个时钟周期的低开销，特别是在关键步骤上，如指令流出和指令完成。前者有更多的候选指令需要考虑，后者要选择提交哪些指令的结果；
- 需要保证由于并发执行多个线程带来的Cache冲突不会导致显著的性能下降。
由于同时多线程在多流出超标量处理器上开发线程级并行，所以最适合于应用到面向服务器市场的高端处理器上。

同时多线程的性能：

HP公司在Alpha 21464处理器上支持了同时多线程；
Intel Pentium 4 Xeon处理器也支持了同时多线程；
超标量处理器上增添8个线程的同时获得的性能提高，单位是每拍的指令数。这里假设增添同时多线程不会导致时钟周期的开销恶化。测试程序包括多道程序执行的SPEC子集，Web服务程序Apache，数据库OLTP和决策支持DSS的测试程序。
使用同时多线程所获得的吞吐率的提高很显著，达1.7到4.2倍，平均3倍。

4 并行处理器的性能评测

平均方法：

存储受限评测法：保持每个处理器使用的存储器资源恒定。
时间受限评测法：在理想的加速比下，保持总运行时间恒定。在处理器数量和问题规模变化的情况下系统的性能和加速比的相应变化。

5 多处理机实例

T1 Multiprocessor

Sun公司2005推出的服务器处理器
多核多处理机致力于开发TLP而非ILP
使用多核和多线程来提高吞吐率
每个Ti 处理器包含8个处理器核,每个核支持4个线程
每个处理器核由一个简单的六栈单发射流水线构成
T1 采用细粒度多线程，在每个时钟周期都进行线程切换

Origin 2000

分布共享存储器结构的大规模并行多处理机系统，采用超结点的模块结构，可以从1个处理器扩展到128个处理器。
Origin 2000采用超标量MIPS R10000处理器，运行Unix的64位IRIX操作系统。
Origin基于NUMA体系结构的。每个结点可安装1个或2个MIPS R10000微处理器、第二级高速缓存（L2 Cache）、主存储器、目录存储器及Hub等，Hub用于连接微处理器、存储器、I／O和路由器等。
Origin存储器系统每个结点的主存储器容量为4GB。结点的Hub内含4个接口和交叉开关。存储器最大传输率为780Mb／s，I／O和路由器接口最大传输率为2×780Mb／s，即1．56G b/s。
128处理器构成的Origin 2000系统由4个立方体组成，在立方体之间传送数据多经过了一级路由器。
在结点内部实现的是SMP（对称多处理器）结构，由于只有两个处理器，所以不存在SMP结构的总线瓶颈问题。在结点之间实现的是大规模并行处理结构。

你可能感兴趣的:(硬件架构)

Tesla的FSD 架构设计 WSSWWWSSW 智能驾驶汽车人工智能 FSD
特斯拉的FSD（完全自动驾驶）架构设计以端到端神经网络为核心，结合专用硬件加速、海量数据训练和持续OTA迭代，形成了一套高度集成的系统。以下从硬件、软件、算法、数据处理和安全机制五个维度展开分析：一、硬件架构：从HW3.0到AI5的算力跃迁HW3.0基础设计采用三星14nm工艺的定制SoC，包含12个Cortex-A72CPU核心、2个NPU（合计73.7TOPS算力）和Mali-G71GPU，支
AI小智项目全解析：软硬件架构与开发环境配置 Despacito0o ai语音助手人工智能硬件架构 struts
AI小智项目全解析：软硬件架构与开发环境配置一、项目整体架构AI小智是一款基于ESP32的智能物联网设备，集成了语音交互、边缘计算等功能。整体系统架构如下：终端设备：ESP32模组作为核心通信方式：WebSocket实现实时音视频传输MQTT连接物联网后台管理系统HTTP进行系统间数据交换二、软件架构详解2.1后端技术栈#核心技术栈backend_stack={"语言":"Python","框架"
LLM大模型命名规则与部署硬件实践手册
文章目录一、理论基础：从信息编码到系统设计1.1命名系统的信息论基础1.2硬件架构与模型运行的关系1.3量化技术的数学原理二、国际主流模型命名规则深度解析2.1OpenAI：极简主义与功能导向2.2AnthropicClaude：诗意命名的技术内涵2.3GoogleGemini：统一品牌下的分层架构2.4MetaLlama：开源社区的透明化命名三、国内主流模型命名规则与文化内涵3.1百度文心：知识
自动驾驶：特斯拉 Model Y全自动驾驶交付的技术原理 InnoLink_1024 自动驾驶人工智能自动驾驶人工智能机器学习
特斯拉ModelY首次实现全程无人控制的全自动驾驶交付，依赖于其先进的FSD（FullSelf-Driving）系统，结合强大的硬件和软件架构。以下从自动驾驶技术的角度，详细介绍其工作原理：1.硬件架构：HW5.0感知与计算平台特斯拉ModelY的全自动驾驶交付基于最新的**HW5.0（Hardware5.0）**平台，其核心硬件包括：传感器套件：12个高清摄像头：提供360°视觉覆盖，分辨率高达
AI算力综述和资料整理木鱼时刻人工智能
目录总体介绍计算精度传输协议GPU池化资源调度CUDA技术GPU硬件参考链接总体介绍AI算力是人工智能系统的核心基础设施，涵盖了从计算精度、传输协议到硬件架构的完整技术栈。计算精度混合精度训练原生满血版DeepSeek671B是FP8精度。FP16在训练计算力占比有80-90%，FP32占比10%-20%。大模型训练中通常会用到FP16（半精度浮点数），但并不是只使用FP16，而是采用**混合精度
YOLOv8模型在RDK5开发板上的部署指南：.pt到.bin转换与优化实践 pk_xz123456 python 算法仿真模型 YOLO 人工智能 rnn 深度学习开发语言 lstm
以下是针对在RDK5开发板（基于NVIDIAJetsonOrin平台）部署YOLOv8模型的详细技术指南，涵盖从模型转换、优化到部署的全流程：YOLOv8模型在RDK5开发板上的部署指南：.pt到.bin转换与优化实践——基于TensorRT的高性能嵌入式部署方案第一章：技术背景与核心概念1.1RDK5开发板硬件架构NVIDIAJetsonOrinNX核心参数：1024-coreAmpereGPU
GIC600通用中断控制器参考手册：项目推荐文章
GIC600通用中断控制器参考手册：项目推荐文章【下载地址】GIC600通用中断控制器参考手册《ARMv8架构通用中断控制器GIC600参考手册》是开发者深入理解与应用GIC600的权威指南。手册全面解析了GIC600的硬件架构、编程接口及中断处理机制，帮助开发者在ARMv8架构下高效实现中断控制。无论是硬件设计还是软件开发，本手册都提供了详尽的技术支持，是开发者不可或缺的参考资料。通过本手册，您
小米YU7智能座舱的技术栈推演分析 Alex艾力的IT数字空间微服务知识图谱图像处理数据分析聚类 AudioLM nlp
小米YU7的智能座舱以“人车家全生态”战略为核心，深度融合小米在消费电子领域的优势与汽车智能化需求，构建了从硬件到软件、从交互到生态的完整技术体系。技术栈解析如下：一、硬件架构：高性能芯片与多屏交互旗舰级芯片组合高通骁龙8Gen3座舱SoC：采用4nm工艺，支持1.35秒极速启动应用、15分钟整车OTA升级，提供流畅的车机交互体验。英伟达DRIVEAGXThor平台：算力达700TOPS，基于Bl
从台式电脑硬件架构看前后端分离开发模式程序猿全栈の董电脑硬件架构状态模式
在软件开发领域，前后端分离早已成为主流架构设计理念。它将系统的业务逻辑处理与用户界面展示解耦，提升开发效率与系统可维护性。有趣的是，我们日常生活中常见的台式电脑硬件架构，竟与这一理念有着异曲同工之妙。今天，就让我们从台式电脑的硬件组成出发，深入探讨其与前后端分离开发模式的内在联系。文章目录一、台式电脑硬件架构与前后端的类比1.1主机：后端的硬件化身1.2显示屏：前端的硬件呈现二、二者分离模式的共同
异构计算解决方案（兼容不同硬件架构） ARM2NCWU 硬件架构
异构计算解决方案通过整合不同类型处理器（如CPU、GPU、NPU、FPGA等），实现硬件资源的高效协同与兼容，满足多样化计算需求。其核心技术与实践方案如下：一、硬件架构设计异构处理器组合‌主从协作模式‌：采用通用CPU（如ARMCortex-M3）作为主处理器，搭配专用协处理器（如MSP430微控制器）处理特定任务（如射频通信），通过串口/USB/以太网实现通信。众核架构‌：集成CPU、GPU、N
深入GPU编程：从硬件架构到内核优化 Kaydeon 硬件架构
深入GPU编程：从硬件架构到内核优化在当今由大型模型驱动的AI时代，GPU集群已成为推动技术进步的核心引擎。然而，仅仅让代码在GPU上“运行”与让其“高效运行”之间存在着巨大的性能鸿沟。对于动辄需要数千甚至数万GPU小时进行训练的超大规模模型而言，这一鸿沟直接关系到研发成本、迭代速度和最终的科研成果。一个未经优化的操作可能在不经意间将训练时间延长数倍，造成巨大的资源浪费。PyTorch、Tenso
软考高级系统架构设计师备考计划（嵌入式工程师专版）指令集诗人软考系统架构软考
软考高级系统架构设计师备考计划（嵌入式工程师专版）一、备考核心策略嵌入式背景优势系统架构设计硬件架构实时系统知识体系构建备考四阶段二、四阶段备考计划（总时长：5-6个月）阶段1：基础巩固（1.5个月）时间学习内容嵌入式关联强化每日投入第1-2周计算机组成原理嵌入式处理器架构对比(ARMvsRISC-V)2小时第3-4周操作系统原理RTOS与通用OS差异分析2.5小时第5-6周软件工程基础嵌入式开发
嵌入式软硬件架构值得一读资源文件介绍：经典书籍，助力嵌入式开发凌克昌
嵌入式软硬件架构值得一读资源文件介绍：经典书籍，助力嵌入式开发去发现同类优质开源项目:https://gitcode.com/嵌入式系统作为现代科技的重要组成部分，其软硬件架构设计至关重要。《嵌入式软硬件架构，值得一读》项目是一本深入浅出的嵌入式系统开发书籍，以下是该项目的详细介绍。项目介绍《嵌入式软硬件架构，值得一读》是一本专为嵌入式系统开发人员打造的经典书籍。它全面地介绍了嵌入式系统的基本概念
查看服务器或系统架构（amd64、arm64...）爱宇阳服务器服务器运维
要确定您的服务器或系统是基于i386、armhf、amd64还是arm64架构，可以通过一系列命令行工具来获取相关信息。以下是具体的方法和步骤：1.使用uname命令uname-m是最常用的方法之一，它可以快速地显示系统的硬件架构。根据输出的不同字符串，您可以判断出具体的架构类型：uname-m如果输出为x86_64或amd64，则表示这是64位的Intel/AMD处理器架构。如果输出为i686或
x86、amd64和arm64区别 L.Cheng Zend webstorm
不清楚WebStorm选择哪个版本？x86、amd64和arm64区别x86、amd64和arm64是指不同的处理器架构，它们主要区别在于指令集和硬件架构。这些架构影响着软件兼容性、性能和硬件设计。1.x86指的是：32位的x86架构（又叫i386或x86-32），由Intel最早在1978年推出。位宽：32位，也就是每次可以处理32位的数据。常用平台：最常用于较老的桌面和笔记本电脑，早期的Win
嵌入式开发之嵌入式系统硬件架构设计时，如何选择合适的微处理器/微控制器？ start_up_go 嵌入式开发之路嵌入式硬件系统搭建嵌入式硬件核心处理器选型
在嵌入式系统硬件架构设计中，选择合适的微处理器/微控制器（MCU/MPU）是关键环节，需从多维度综合评估。以下是系统化的选择策略及核心考量因素：一、明确应用需求与核心指标1.性能需求处理能力：根据任务复杂度确定主频、指令集架构（ISA）。简单控制任务（如家电开关）：8位/16位MCU（如AVR、51单片机）即可。复杂运算（如图像处理、电机矢量控制）：需32位MCU（如ARMCortex-M4/M7
AI软件栈：LLVM分析（一） kkk12344 AI软件栈
文章目录AI软件栈后端编译LLVMIRLLVM的相关子项目AI软件栈后端编译AI软件栈的后端工作通常与硬件架构直接相关，为了实现一个既能适配现代编程语言、硬件架构发展的目标，所以提出了LLVM具备多阶段优化能力提供基础后端描述，便于进行编译器开发兼容标准编译器的行为LLVMIRLLVM设计了一套底层描述策略（也可以称之为虚拟指令集，LLVMIR），属于低级中间表示，携带了程序的类型信息，即方便了静
深度解析PECI：平台环境控制接口硬件架构二进制coder 服务器开发硬件架构 fpga开发
深度解析PECI：平台环境控制接口硬件架构一、PECI正确定义与核心功能PECI（PlatformEnvironmentControlInterface，平台环境控制接口）是Intel定义的专有接口标准，主要用于：处理器与平台控制单元(如EC/BMC)之间的环境参数通信高精度温度监控系统动态功耗管理平台健康状态监测二、PECI硬件架构详解1.物理层特性特性规格说明接口类型单线双向串行总线电气标准1
【Zephyr OS】介绍流浪_彩虹嵌入式开源项目嵌入式硬件 risc-v linux
介绍Zephyr项目是一个可扩展的实时操作系统(RTOS)，支持多种硬件架构，针对资源受限的设备进行了优化，并在构建时考虑了安全性。ZephyrOS基于专为资源受限和嵌入式系统设计的小型内核：从简单的嵌入式环境传感器和LED可穿戴设备到复杂的嵌入式控制器、智能手表和物联网无线应用。Zephyr内核支持多种架构，包括ARMCortex-M、Intelx86、ARC、NiosII、TensilicaX
T2080开发板--国产高性能嵌入式平台的核心载体机载总线仿真测试国产化网络安全
T2080开发板作为国产高性能嵌入式平台的核心载体，其基于天脉3操作系统的开发应用正逐步渗透到工业控制、网络安全、边缘计算等关键领域。这款由Phytium公司推出的开发板搭载了腾锐D2000系列处理器，采用8核FTC663架构，主频可达2.3GHz，配合天脉3实时操作系统的强实时特性，为国产化自主可控解决方案提供了新的技术路径。###硬件架构与性能优势T2080开发板的硬件设计充分体现了国产芯片的
十八、【ESP32全栈开发指南： SPI接口深度使用】爱睡觉的王宇昊 ESP32 单片机嵌入式硬件
一、SPI协议基础与ESP32硬件架构1.控制器选择专用控制器：SPI0/SPI1（固定用于Flash/PSRAM，不可配置）通用控制器：SPI2_HOST（HSPI）：引脚固定或通过GPIO矩阵重映射SPI3_HOST（VSPI）：支持全引脚自定义2.引脚分配原则//HSPI默认引脚（推荐用于高速外设）#defineHSPI_MISO12//固定引脚#defineHSPI_MOSI13#defi
14、探索并行处理技术及其在现代计算中的应用 AWS云计算并行处理多核处理器集群计算
探索并行处理技术及其在现代计算中的应用1.引言随着信息技术的迅猛发展，现代计算环境正经历着前所未有的变革。并行处理技术作为一种提高计算效率的重要手段，逐渐成为研究热点。本文将深入探讨并行处理技术的基础理论、应用场景以及面临的挑战，并通过具体的案例和技术细节，展示如何有效地实现并行处理。2.并行处理技术概述并行处理是指通过多个处理器或核心同时执行多个任务，以提高计算速度和效率。根据不同的硬件架构，并
（十二）深度学习计算性能：硬件架构、算法效率与理论极限分析只有左边一个小酒窝动手学深度学习深度学习硬件架构算法
1编译器和解释器在深度学习中，编译器和解释器是两种不同的执行模式，它们对模型的执行效率和灵活性有着重要影响。以下是关于编译器和解释器的详细介绍：1.1符号式编程（SymbolicProgramming）符号式编程是一种通过定义计算图来表示程序执行流程的方式。在深度学习中，计算图由一系列节点组成，每个节点表示一个操作或张量。这种编程方式能够在执行前对整个计算过程进行优化，提高计算效率。符号式编程的主
3-2-1 ARM架构简明教程：硬件架构与汇编指令 2402_86608154 freertos arm开发架构硬件架构
3-2-1ARM架构简明教程：硬件架构与汇编指令1.为什么要学习ARM架构？在学习RTOS（实时操作系统）或者单片机编程的时候，我们经常会遇到任务栈（Stack）、任务调度等概念，而这些都与CPU的架构密切相关。只有深入理解ARM处理器的架构，你才能真正掌握RTOS的核心。今天，我们就从ARM硬件架构和基础汇编指令这两个方面，来快速入门ARM架构。2.ARM处理器的架构2.1计算机的组成如果你曾经
LabVIEW超声频率跟踪 LabVIEW开发 LabVIEW开发案例 LabVIEW开发案例
LabVIEW开发超声波发生器频率自动跟踪系统，适配工业级硬件架构，解决传统超声设备因负载变化导致的频率失谐问题。以STM32为主控核心，结合LabVIEW图形化编程优势，实现硬件控制、数据采集、频率跟踪一体化，适用于精密加工、医疗超声、材料检测等高频振动场景。应用场景精密机械加工：在超声磨削、切割中实时跟踪换能器谐振频率，确保加工精度（如陶瓷零件表面粗糙度≤0.5μm）。医疗超声设备：适配超声碎
LabVIEW轴角编码器自动检测 LabVIEW开发 LabVIEW开发案例 LabVIEW开发案例
LabVIEW开发轴角编码器自动检测系统，针对指控系统中高故障率的轴角编码器性能检测需求，通过模块化硬件架构与软件设计，实现编码器运转状态模拟、扭矩/转速实时监测、19位并行编码采集译码、数据自动分析及报告生成等功能，解决传统检测依赖指控系统、缺乏独立测试手段的问题。系统采用大品牌硬件组件，结合LabVIEW图形化编程优势，提升检测效率与准确性，适用于编码器生产调试与维修场景。应用场景生产制造：在
降本增效新选择：下一代防火墙如何平衡安全性能与运维成本？柏睿网络安全运维
在网络安全预算增速放缓（Gartner预测2025年企业安全预算增长率降至8.7%）与威胁复杂度指数级上升的双重压力下，企业亟需打破"安全投入无底洞"的困局。下一代防火墙（NGFW）通过智能硬件架构、自动化运维体系、弹性资源分配三大核心路径，实现安全性能与成本效益的最优平衡，成为数字化转型中的"降本增效刚需解"。一、传统防火墙的成本黑洞：三大痛点倒逼技术革新痛点维度传统硬件防火墙企业隐性成本举例硬
I/O系统深度解析：从电子信号到系统调用摘取一颗天上星️ 考研计算机外设嵌入式硬件 windows linux
在计算机的王国里，CPU是威严的国王，内存是高效的宰相，而I/O设备则是遍布全国的使者。理解I/O系统如何运作，是掌握计算机组成原理与操作系统协同工作的关键钥匙。一、硬件基础：I/O设备的物理世界1.I/O设备的硬件架构设备控制器控制逻辑设备控制器数据缓冲区状态寄存器物理设备设备寄存器系统总线CPU/内存设备控制器：每个I/O设备的"大脑"，负责：转换电子信号（如磁盘磁信号→数字信号）管理数据缓冲
基于TMS320F28335DSP的光伏逆变器设计方案：Boost升压与单相全桥逆变电路实现及MPPT技术解析 oEoushsyc sass
光伏逆变器设计方案及深入分析：基于TMS320F28335与电路PCB原理图与源代码随着能源转型与可再生能源战略的实施，光伏技术正在成为解决电力供需问题的关键技术之一。在设计高效、稳定的光伏逆变器时，为了确保性能与可靠性，我们需要深度研究光伏逆变器的硬件架构。接下来，我们将重点关注使用TMS320F28335芯片及其相关的PCB原理图、源代码方案，并与广大开发者分享其中涉及的亮点和细节。一、逆变器
FlagOS 新里程：开源面向多种硬件架构的统一AI 编译器 FlagTree 智源研究院官方账号开源人工智能
为了推动不同架构AI硬件系统的创新和落地，打造开源、统一的AI系统软件生态，智源研究院联合多家机构开源了AI编译器FlagTree。FlagTree的开源，是开源、统一AI系统软件生态FlagOS发展进程中又一个重要的里程碑事件。至此，FlagOS已经形成了具备高性能通用AI算子库FlagGems/FlagAttention、统一AI编译器FlagTree、大模型训推一体框架FlagScale和统
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt