biaobiao_hust

AMBA CHI

1. CHI简介

一致性集线器接口（CHI Coherent Hub Interface）是AXI一致性扩展（ACE）协议的演进。CHI适用于需要一致性的各种应用，包括移动、网络、汽车和数据中心。

AMBA总线最常见的协议 – APB>AHB>AXI>ACE>CHI，它们的复杂度、性能和设计难度都是递增的。CHI协议是AMBA的第五代协议，可以说是ACE协议的进化版，将所有的信息传输采用包（packet）的形式来完成。但是从接口的角度看，CHI和ACE，AXI这些协议完全不一样了。

1.1 术语

术语	描述
Transaction	一个transaction执行一个单独的操作，如一个transaction可以是读memory或写memory
Message	协议层术语，用于定义两个组件之间交换信息的粒度,如：RequestData responseSnoop request一个数据响应message可能由多个packets组成
Packet	端到端跨越interconnect的传输粒度，一个message可能由一个或多个packets组成，每个packet包含有源和目的节点的ID来保证在interconnect上独立路由
Flit	最小流控单位，一个packet可以由一个或多个flits组成，对于同一个packet的所有flits在interconnect上传输必须遵循同样的路径，对于CHI，所有的packets都是由一个flit组成
Phit	物理层传输单位，一个flit可以由一个或多个phits组成，phit定义为两相邻网络设备之间的一个传输，对于CHI，所有的flits都是由一个phit组成
PoS	Point of Serialization，位于ICN内，用于Requests之间的保序（HNF同时具有PoS和PoC的功能）
PoC	Point of Coherence，一致性节点，用于保证所有访问同一个memory地址的请求都可以得到同一份数据
PoP	Point of Persistence（PoP）是内存系统中的一个点，当系统电源断开时，会保持对内存的写入，当电源恢复时，会可靠的恢复对内存的写入。
PoPA	Point of Physical Aliasing (PoPA)，在一个物理地址空间（PAS）中的位置更新对所有其他物理地址空间可见。
Downstream cache	downstream cache是以RN的视角定义的，RN的downstream cache可以通过CHI请求访问
Requester	Requester可以指独立产生原始transactions的组件（master），也可以指ICN
Completer	Completer可以指ICN，也可以是SN
Master	通常是一个系统中最上游的agent
Slave	通常是一个系统中最下游的agent
Endpoint	slave的另一个名字，指的是一个transaction的最终目的地
Protocol Credit	一个P-credit用于保证completer有能力接收一个transaction
Link layer Credit	一个L-credit用于保证另一边的link可以接受不了一个flit
ICN	interconnect的简称，用于协议节点之间的通讯的CHI传输机构，ICN可能也包含协议节点，如HN和MN
IPA	intermediate Physical Address，中间物理地址，在两级地址系统中，第一级产生IPA，第二级产生物理地址
RN	请求节点，产生协议transaction，包含读和写
HN	Home节点，位于ICN，用于接收来自RN的协议transaction，完成相应的一致性操作并返回一个响应
SN	从属节点，用于接收来自HN的请求，完成相应的操作并返回一个响应
MN	其他节点，位于ICN，用于接收来自RN的DVM操作，完成相应的操作并返回一个响应
IO Coherent node	IO一致性节点产生的snoop请求不会导致数据被cache，因此IO一致性节点也不会接收到任何snoop请求
snoopee	正在接收snoop的RN。
Write-Invalidate protocol	该协议是指当RN往一个共享地址写数据时，必须先把所有共享的数据备份都无效掉，然后再进行写操作，CHI采用的就是该协议
In a timely manner	协议中没有定义在某个绝对的时间后，某件事必须发生，但是及时发生可以使系统效率更高
Don’t Care	表示该域段可以设置为任何值，包括非法值和保留值，任何组件收到的包中如果包含设为Don’t care的域段，都必须忽略该域段
Inapplicable	表示该域段值不会用于信息处理

1.2 组件名称

类别	组件名
RN	请求节点。生成到互连的协议事务，包括读取和写操作。请求节点被进一步分类为：
RN-F	完全一致性请求节点：包含硬件一致性cache允许产生所有协议定义的transactions；支持所有的snoop transactions
RN-D	IO一致性请求节点，支持DVM操作：不包含硬件一致性cache；可以接收DVM操作；可以产生协议定义的一部分transactions
RN-I	IO一致性请求节点：不包含硬件一致性cache；不能接受DVM操作；可以产生一部分协议定义的transactions；不要求具有snoop功能
HN	Home Node，位于从请求节点接收协议事务的互连器内的节点。主节点被进一步归类为：
HN-F	用于接收所有的请求操作，除了DVM操作：POC点，通过监听RN-Fs，管理各Master一致性，完成所有的snoop响应后，发送一个响应给发出请求的RN；PoS点，用于管理多个memory请求的顺序；可能包含目录或监听过滤，以此来减少大量的snoop request
HN-I	处理有限的一部分协议定义的Request请求：PoS点，管理访问IO subsystem的顺序；不包含PoC点，也不具备处理snoop请求
MN	用于接收来自RN发送的DVM操作，完成相应的操作，并返回一个响应
SN	Slave Node，用于接收来自HN的请求，完成相应的操作并返回一个响应；
SN-F	指的是Normal memory，可以处理Non-snoop读写请求、atomic请求、以及这些命令的其它形式、CMO请求
SN-I	指的是Peripheral或Normal Memory，可以处理Non-snoop读写、atomic操作、以及这些命令的其它形式、CMO请求

2. CHI介绍

CHI 旨在实现可扩展性，能够构建小型、中型或大型系统。这些系统使用多个组件，范围从处理器集群、图形处理器和内存控制器，到 I/O 桥、PCI Express（PCIe）子系统和互联本身。

2.1 CHI 网络拓扑

CHI 定义了 CHI 网络中的不同组件，但没有定义用于连接这些组件的拓扑。这种拓扑灵活性允许根据性能、功耗和面积要求驱动组件连接。拓扑有：

        • 环形拓扑：在环中，每个组件直接连接到另外两个组件，形成一个所有组件都可以相互通信的环。这种拓扑的缺点是延迟随环中组件数量的增加而线性增加。这是因为事务必须遍历环，直到到达目的地。因此，环形拓扑最适合中等规模的系统。
        • 网格拓扑：与环相比，网格包含更多事务到达目的地的路径，因此减少了事务的传输时间。这提供了更高的系统带宽，但是占用了更多的面积。网格拓扑最适合大规模系统。
        • 交叉开关：这种拓扑允许每个节点连接到每个可能的节点。这种设计提供了最佳性能，因为每个组件都与需要通信的组件直接连接。这种拓扑的缺点是连接所有组件的成本。这是因为随着每个附加组件，系统所需的导线数量可能会显著增加。因此，交叉开关最适合小型系统。

在此图中，圆圈表示网络中的请求者和从组件。方形表示用于在请求者和从端之间路由事务的中间组件。

2.2 CHI 协议迭代

        目前有六个版本的 CHI 协议：A 到 F。本文描述 A 到 C 的问题以及之间的主要差异。
        CHI-A 是 CHI 协议的第一个版本。它提供了一个传输层，具有减少拥塞的功能。描述了 CHI 的基本行为。此规范包括：
        • 新通道、CHI 术语和组件命名的定义
        • 请求、监听过滤器和缓存状态转换的示例
        • 事务排序、独占访问和分布式虚拟内存（DVM）操作的规则
        CHI-B 扩展了 CHI-A，但不能直接向后兼容 CHI-A。它添加了支持 Armv8.1 和 Armv8.2 系统扩展的功能，例如：
        • 更大的物理地址宽度
        • 原子事务
        • DVM 的 VMID 扩展
        • 通道字段、事务结构和可靠性、可用性和可维护性（RAS）特性的描述
        • 直接内存传输和直接缓存传输功能，减少内存和监听访问延迟
        CHI-C 是 CHI-B 的次要扩展。此扩展主要添加了减少请求危险生命周期的功能。CHI-C 还添加了两个操作码，以减少完成确认的时间，并对协议进行了更改以支持这些操作码。

2.3 CHI 缓存行状态

        CHI 使用了类似于 ACE 的一致性模型，增加了对监听过滤器和基于目录的系统的支持。CHI 还使用与 ACE 相同的术语来定义缓存状态，并添加了部分和空缓存行状态。
        • 有效和无效：用于描述缓存行是否存在于本地缓存中。
        • 如果缓存行有效，则必须是唯一或共享的：唯一意味着缓存行仅存在于此缓存中，而不在任何其他请求者本地缓存中。仅当缓存行处于唯一状态时，才能对本地缓存行进行存储。共享意味着缓存行存在于此缓存中，并且可能存在于其他请求者本地缓存中，也可能不存在。
        • 如果缓存行有效，它必须是Clean或Dirty的：Clean表示缓存不负责更新主内存。由于在另一个缓存中进行的先前更新，缓存行仍然可以保存与主内存不同的值。Dirty表示相对于主内存修改了缓存行。当此行从此缓存中逐出时，请求者必须确保更新主内存，或者将脏责任传递给系统中的另一个组件。
        • 一行可以处于部分和空状态：空缓存行没有有效的数据字节，但行的所有权仍然属于请求者。部分缓存行可以具有一些有效字节，包括无字节或所有字节。这是因为状态已更新，但尚未写入有效字节，或者因为已写入所有字节，但尚未更新状态。在此状态下监听缓存行时，可以给出的响应有额外的限制。

        无效（Invalid，对应I态）：缓存行不在缓存中。
        唯一脏（Unique Dirty，对应M态）：此缓存行仅存在于此缓存中，并相对于主内存进行了修改。在此状态下，请求者可以对缓存行执行写操作，因为该行已处于唯一状态。如果监听指示，缓存行必须转发给请求者。
        唯一脏部分（Unique Dirty Partial）：此缓存行仅存在于此缓存中，并被认为相对于主内存进行了修改。它可以具有一些有效字节，其中一些包括无字节或所有字节。在此状态下，请求者可以对缓存行执行写操作，因为该行已处于唯一状态。对于监听，即使监听指示也不能将缓存行直接转发给原始请求者。
        共享脏（Shared Dirty，对应O态）：相对于主内存修改了此缓存行，而且这个特定的缓存有责任更新主内存。由于缓存行是共享的，它可能存在于一个或多个本地缓存中，但这并不是必须的。如果该行存在于多个缓存中，这些缓存将在共享干净状态下拥有此行。
        唯一干净（Unique Clean，对应E态）：与主内存相比，缓存行没有被修改，并且仅存在于单个本地缓存中。它可以在不通知其他缓存的情况下进行修改。
        唯一干净空（Unique Clean Empty）：缓存行仅存在于此缓存中，但没有有效字节。缓存行可以在不通知其他缓存的情况下进行修改。如果监听请求该行，则不得将该行返回给Home或直接转发给原始请求者。
        共享干净（Shared Clean，对应S态）：缓存行可能存在于一个或多个本地缓存中。与主内存相比，该行可能已被修改，但此缓存不负责在逐出时将行写回内存。

3. CHI协议基础

CHI通过节点类型对系统中的不同组件进行分类，并提供了节点之间通信的方法。

3.1 节点

主要有三种类型的节点：请求节点（RNs，生成事务，如读和写请求，这些事务发送到HNs）、基节点（HNs，负责对请求进行排序，向SNs生成事务，并可以发出监听或处理DVM操作）和从节点（SNs）。此外，还有杂项节点（MNs）。总结如下：

	完全一致	IO一致	DVM	MN
RN	一致性缓存接受并响应监听	无一致性缓存不接受或响应监听	在其他所有方面与RN-I相同
HN	对一致性内存的请求进行排序向RN-Fs发送监听	对I/O子系统的请求进行排序		处理由RN发送的DVM事务
SN	连接支持一致性内存空间的存储器设备	连接支持一致性内存空间的存储器设备

• 请求者：是通过发出请求消息启动事务的组件。可用于独立发起事务的组件，也可用于互联组件，其发出下游请求消息，可独立或作为系统中正在发生的其他事务的副作用。

• 完成者：是响应从其他组件接收到的事务的组件。可以是互联组件（如HN或MN），也可以是位于互联之外的组件（如从属组件）。

3.2 系统地址映射

系统中的每个组件都被分配一个唯一的节点ID。CHI使用系统地址映射（SAM）将物理地址转换为目标节点ID。为了能够确定发出请求的目标节点ID，每个RN和HN都必须具有SAM。以下图示展示了RN SAM将物理地址映射到HN节点ID，以及HN SAM将物理地址映射到SN节点ID：

RN SAM必须满足以下要求：

• 它必须完全描述整个系统地址空间

• 任何不对应于物理组件的物理地址必须映射到一个可以提供适当错误响应的节点

• 所有RN必须对RN SAM有一致的视图。

3.3 节点通道

与ACE相比，CHI使用不同的通道，TX通道用于发送消息，RX通道用于接收消息：

• 请求（REQ）：发送读和写请求、缓存维护请求和DVM请求

• 响应（RSP）：发送各种类型消息的完成响应，范围从写和缓存管理响应到无数据监听响应和操作完成确认。

• 监听（SNP）：发出监听或发送DVM操作数据传输消息和标记为DAT的，发送写和读数据，以及带数据的监听响应

下图显示了RN-F上CHI请求者接口上的通道：

当RN-F发出读请求时，它在其TXREQ通道上发送请求。当读数据返回时，RN-F在其RXDAT通道上接收数据。每个节点上的TX信号连接到目标节点上的RX信号。在SNP通道上以下约束：

• 只有HN-F和MN在SNP通道上发出消息

• RN-F仅在SNP通道上接受监听

• MN仅在SNP通道上接受DVM消息监听

3.4 切片Flit

所有协议消息都以Flit（切片）的形式发送。Flit是一种打包的控制字段和标识符集合，用于传递协议消息。在Flit中发送的一些控制字段包括操作码、内存属性、地址、数据和错误响应。每个通道需要不同的Flit控制字段。例如，请求通道上用于读或写的Flit需要一个地址字段，而数据通道上的Flit需要数据和字节使能字段。与PCIe或以太网协议中的字段不同，Flit中的字段不会在多个数据包上串行化。相反，它们是并行发送的。

在CHI中传递Flit的握手机制与ACE中的不同。每个通道都关联有一个FLITV信号，发射器将该信号设置为高电平以表示Flit有效。然后在下一个上升CLK边沿上进行传输。只有当发射器先前收到接收器的信用LCRDV信号时，才能发送Flit。

为了在Flit中提供额外的信息，CHI定义了多个标识符字段。例如：

• 源ID字段（SrcID）：用于路由Flit。该字段标识Flit的发送者，是发送消息的组件的节点ID。

• 目标ID字段（TgtID）：用于路由Flit。目标ID值是接收消息的节点的ID。除了监听Flit之外，每个Flit都包含目标ID字段。HN-F可以使用任何机制来路由监听，例如向所有RN-F广播监听，或使用监听过滤器仅针对RN-F的子集。无论使用什么机制，当监听Flit离开互连时，它已经针对特定节点。

• 事务ID字段（TxnID）：出现在每个Flit中。此字段是一个8位字段，用于标识源节点和目标节点之间的每个事务。来自RN的每个未完成请求都必须具有唯一的TxnID。在任何时候，RN最多可以有256个未完成的事务。

• 请求操作码（Opcode）：出现在REQ Flit中。这指定了事务类型，并且是决定事务结构的主要字段。例如，不同类型的读请求，写请求或无数据请求。

• 数据缓冲区ID（DBID）：仅出现在响应和数据Flits中。目标节点使用此标识符来表示接收写数据的可用性，并释放需要完成确认的事务。

◦ 对于写操作，请求者在收到完成者的响应中的DBID值之前不能发送写数据

◦ 一些读事务已完成确认结束，这是请求者表示已收到读数据的地方。将读数据发送回请求者时，数据flit包含一个DBID值，供请求者在发送完成确认消息时使用。

4. 事务流程

事务是节点完成请求所需的系统消息集合。以下示例中，我们展示了在请求者和完成者之间的写请求中使用标识符。请求者被分配节点ID 1，完成者被分配节点ID 2。以下描述了事件顺序：

1. 请求者向完成者发送具有事务ID（TxnID）3的写请求。请求者中的源ID（SrcID）字段填充了请求者的节点ID。目标ID（TgtID）字段填充了完成者的节点ID。此步骤如下图所示：

2. 完成者将请求的事务ID和源ID分配给一个可用的数据缓冲槽。在本例中，请求被分配了数据缓冲区ID（DBID）0。

3. 完成者向请求者发送带有TxnID 3和DBID值0的DBIDResp消息，如下图所示：

4. 请求者使用接收到的DBID作为事务ID向完成者发送写数据。

5. 当事务完成时，对应于DBID 0的缓冲槽将被释放。

4.1 ReadNoSnp事务流程

以下示例展示了完成ReadNoSnp事务所需的消息序列。请求节点0发出ReadNoSnp请求，完成节点5提供读数据。以下描述了事件顺序：

1. 请求节点0向CHI互连发出一个ReadNoSnp，目标为Home节点3。该事务在请求者节点的TXREQ通道上发送。此步骤如下图所示：

2. 基节点3在其TXREQ通道上向完成节点5发出ReadNoSnp请求，以检索数据，如下图所示：

3. 完成节点5在其TXDAT通道上发出CompData响应，将数据返回给基节点3，如图所示：

4. 基节点3将CompData响应发送给请求节点0。请求节点0在RXDAT通道上接收数据，如图所示：

4.2 WriteNoSnp事务流程

本节介绍了从请求节点0到完成节点5的WriteNoSnp事务的流程。以下描述了事件的顺序：

1. 请求节点0在TXREQ通道上向基节点3发送WriteNoSnp消息，如图所示：

2. 基节点3向请求节点0响应一个CompDBIDResp消息。此响应表明它可以接受写数据，并且WriteNoSnp对其他请求者是可观察的。此消息通过基节点的TXRSP通道发送。此步骤如下图所示：

3. 以下两个步骤可以按任意顺序发生：

（a）基节点3向完成节点5发出WriteNoSnp消息，并收到CompDBIDResp响应，如图所示：

（b）或者，请求节点0可以通过其TXDAT通道将WriteNoSnp的写数据发送到基节点3，如图所示：

4. 在收到来自完成节点的CompDBIDResp和来自请求节点的写数据后，基节点3在TXDAT通道上将写数据发送到完成节点5，如图所示：

4.3 完成确认

CHI使用完成确认响应来维护以下事务的顺序：

• 由完全一致请求节点（RN-F）发起的事务

• 由这些RN-F事务引发的监听事务

完成确认确保在一致事务完成后，按顺序在RN-F之后接收到监听事务。

HN-F可以通过暂停事务来维护事务顺序。例如，RN-F可能已经有一个正在处理的针对特定缓存行的未完成事务。如果系统中的另一个请求者发起一个导致对同一行进行监听的事务，HN-F可以暂停这个后来的事务。当原始的RN-F完成一致事务时，RN-F使用其TXRSP通道向HN-F发送完成确认（CompAck）消息。然后，HN-F解除等待完成确认的监听阻塞。这种机制与ACE中的RACK/WACK功能类似。

并非CHI中的每个事务都需要完成确认。请求Flit包含一个ExpCompAck字段，用于表示何时需要完成确认。如果需要完成确认，RN-F在请求中将ExpCompAck设置为1，并在请求完成时发出CompAck响应。流程如下：

请求节点（RN-F）发起一个具有ExpCompAck = 1的请求。
基节点完成请求。
基节点向RN-F发送Comp或CompData。
RN-F向基节点发送CompAck。
基节点现在可以向RN-F发送等待中的监听。

以下示例展示了在需要读请求中的完成确认时发送的消息：

1. 请求者向完成者发送一个读请求，请求地址为0x8000，ExpCompAck字段设置为1，如图所示：

2. 完成者为读地址分配一个任意的DBID位置，阻止互连发出针对将来一致请求的监听。这个位置如图所示：

3. 完成者使用CompData响应回应请求者，同时表示事务完成并发送读数据。响应中的DBID字段填充了用于存储读地址的DBID位置。这一步如下图所示：

4. 请求者发送一个CompAck消息。CompAck使用从完成者那里接收到的DBID值作为事务ID，如图所示：

完成者清除地址0x8000的DBID位置，允许互连向该位置发出未来的监听。

4.4 带有监听的CompAck

本示例展示了在需要多个请求节点访问相同可缓存内存位置的完成确认时发送的消息。在此示例中，CHI互连向所有缓存请求者广播监听。或者，它可以使用监听过滤器并仅针对本地存在该行的请求者。以下列表描述了事件的顺序：

1. 请求者节点0向基节点3发送地址A的MakeUnique消息。当请求者节点0向基节点3发出完成确认时，此事务完成。这一步如下图所示：

2. 基节点3向请求者节点1和2发送地址A的SnpMakeInvalid监听，如图所示：

3. 请求者节点1和2以SnpResp_1响应。这些响应意味着地址A已失效。基节点3可以按任意顺序接收SnpResp_I。这一步如下图所示：

4. 请求者节点2向基节点3发送地址A的ReadShared请求。请注意，基节点3仍未对请求者节点0的MakeUnique消息作出回应。现在，直到请求者节点0发送MakeUnique的完成确认消息，由ReadShared请求生成的监听将被阻塞。这一步如下图所示：

5. 由于在步骤3中收到的监听响应，基节点3向请求节点0发送Comp_UC消息。
6. 请求节点0发送CompAck消息并解除对地址A的监听阻塞。
7. 基节点3为地址A生成向请求节点0和1的SnpShared监听。
8. 请求节点1以SnpResp响应，表示它没有数据。
9. 请求节点0以SnpRespData响应，发送地址A的最新数据。基节点3可以按任意顺序接收这两个响应。
10. 收到两个监听响应后，基节点3将监听数据返回给请求节点2。
11. 请求节点2向基节点3发送完成确认。基节点3可以向地址A生成未来的监听。

4.5 CHI中的端点顺序和请求顺序

事务可以按端点顺序和请求顺序排序，如下所述：

• 端点顺序保持从单个请求者到单个从属地址范围的事务顺序。例如，在端点顺序中，向从属的可编程寄存器组发出多个设备访问。

• 请求顺序保持来自单个请求者到同一地址的事务顺序。例如，当向重叠的非缓存地址（如Normal NC、Device-GRE和Device-nGRE）发出多个请求时，需要排序。当设置请求顺序时，CHI不要求地址匹配的精确粒度，粒度由实现定义。

注：如果设置端点顺序，请求顺序是隐含的。请求Flit中的Order字段控制排序类型。只有一些请求类型可以使用请求顺序和端点顺序。这些请求类型是：

• ReadNoSnp和任何ReadOnce类型的请求：

◦ 请求者发出需要排序的ReadNoSnp或ReadOnce类型请求

◦ 从属接受请求并以ReadReceipt消息回应。ReadReceipt信号表明可以发出下一个有序请求

◦ 通过发出ReadReceipt响应，从属保证按收到的顺序维护请求

• WriteNoSnp和WriteUnique类型的请求：

◦ 请求者发出需要排序的WriteNoSnp或WriteUnique类型请求

◦ 从属以DBIDResp消息回应以表示可以接受消息。DBIDResp响应表示数据缓冲区插槽可用于接受写数据，并且请求者可以发出下一个有序请求。

◦ 通过发出DBIDResp，从属保证按收到的顺序维护请求

事件顺序如下：

请求者使用ReqOrder设置向从属发起读请求1。
请求者向从属发出带有ReqOrder设置的读请求2，但由于请求1仍未完成，请求者被阻止发送请求。
从属以ReadReceipt消息回应读请求1，表示请求已被接受。
以任意顺序：
请求者向从属发送读请求2。
从属将读请求1的读数据返回给请求者。

4.6 请求重试

有时目标节点可能没有足够的资源来接受请求。为防止在资源不可用时阻塞请求通道，CHI提供了一个请求重试机制。请求重试机制使用协议信用（Protocol Credits）来指示资源可用性。确定和记录处理请求所需的协议信用（PCrd）类型是从节点的责任。

该机制可以使用不同类型的协议信用来跟踪不同的资源。例如，读请求和写请求可以使用单独的数据缓冲区，因此每个缓冲区可以使用不同类型的协议信用来指示可用性。不同类型的协议信用值由实现定义。

以下示例描述了伴随请求重试发送的消息序列。在此示例中，请求者节点1发出请求，因为完成者无法接受请求。以下描述了事件顺序：

1. 每个请求最初都是在没有协议信用的情况下发出的。请求Flit中有一个名为AllowRetry的控制字段。第一次发送请求时将此字段设置为YES表示请求没有使用协议信用。当AllowRetry为YES时，请求中的PCrdType字段必须为0。以下图表显示了请求设置：

2. 在示例中，目标节点由于请求缓冲区已满而无法接受请求，因此返回一个RetryAck消息。

3. RetryAck响应Flit中设置了一个PCrdType字段，其值表示需要重试请求所需的信用类型。在此示例中，PCrdType的值为2，如图所示：

4. 当目标节点可以接受请求时，它在RSP通道上发送一个PCrdGrant消息。PCrdGrant响应Flit使用PCrdType字段来指示已变为可用的协议信用类型。请求者只有在PCrdGrant消息和RetryAck响应中的协议信用类型匹配时才能重试请求。在这个例子中，两个字段都必须设置为2。如果协议信用类型匹配，目标节点现在可以保证接受请求。

5. 请求者重新发出请求，并将AllowRetry字段设置为0。将AllowRetry字段设置为0表示向目标节点指示请求正在使用已授予的协议信用。

5. DVM操作

与ACE一样，CHI支持分布式虚拟内存（DVM）操作。DVM请求传递操作以支持维护虚拟内存系统。

5.1 DVM操作事务

CHI使用DVM操作来管理虚拟内存。DVM操作执行以下事务：

• 事务查找边缘缓冲器（TLB）失效

• 指令缓存失效

• 分支预测器失效

• DVM同步

在CHI中，所有DVM操作都分为两部分发送到MN。这与ACE不同，在ACE中，一些DVM操作需要两部分，而其他操作只需要一部分。以下列表描述了CHI中的部分顺序：

• DVM操作的第一部分作为请求发送给MN，Opcode字段设置为DVMOp。请求Flit使用地址字段来编码操作的属性。

• DVM的第二部分作为数据Flit发送，只有在请求节点收到MN的DBID响应后才发送。这第二部分携带了DVM操作所针对的地址。

当MN收到DVM操作的两个部分时，MN会向参与一致性域的请求节点生成DVM Snoop。MN在节点监听通道上发送两部分的DVM Snoop。DVM Snoop的两个部分必须使用相同的TxnID和Opcode SnpDVMOp，并使用以下参数：

• 第一部分使用地址字段来编码操作属性和目标地址的高位

• 第二部分使用地址字段发送地址的其余位

为了区分这两部分，CHI要求地址字段的bit[3]设置为0以表示第一部分，设置为1表示第二部分。DVM监听的第二部分可能在第一部分之前到达RN。

5.2 DVM操作类型

CHI定义了两种类型的DVM操作：非同步DVM（DVM Non-Sync）和同步DVM（DVM Sync）。DVM操作的属性决定了RN在响应DVM Snoop之前是否必须等待操作完成。

同步DVM仅执行同步操作，没有其他操作。

非同步DVM是TLB、指令缓存和分支预测器的失效操作。非同步DVM不需要在发出更多DVM操作之前完成DVM操作的执行。这允许有多个非同步DVM未完成。

在以下示例中，RN-F可以发出多个分支预测器或指令缓存失效，接收RN-F或RN-D不必立即执行操作：

RN-F或RN-D接收到一个指示DVM Non-Sync的DVM Snoop。
RN-F或RN-D向MN发出Snoop响应。Snoop响应确认收到DVM消息，但不表示请求节点已经执行了DVM操作。
MN向发起RN-F发送完成消息，表示已接受DVM操作。

为确保所有未完成的DVM请求已执行，需要执行以下步骤：

RN-F向MN发出同步DVM操作，也称为DVM Sync。需要在发出DVM Sync之前接收完成响应的任何DVM请求都必须先完成。
MN在监听通道上向所有RN-F和RN-D发出DVM Sync。
每个目标RN确保其所有未完成的DVM操作已执行。
每个RN向MN发出一个Snoop响应，表示所有操作已执行。
MN向最初发出同步DVM操作的RN-F发送DVM Sync的完成响应。

CHI DVM Sync与ACE中的DVM Sync类似。两者都检查之前发出的DVM操作是否已完成。不同之处在于，CHI不需要DVM完成消息。

5.3 DVM操作流程

本节描述了一个TLB失效DVM请求，后续有一个同步DVM操作，并展示了以下事件：

• DVM请求的不同部分

• MN生成的监听操作

• DVM同步如何确保之前的DVM操作已执行

事件顺序如下：

请求节点0向MN发出一个TLB失效DVM请求。
MN用DBIDResp消息响应，表示可以接受DVM请求的第二部分。
请求节点0向MN发出写数据消息。这是DVM消息的第二部分。
MN将DVM请求的两个部分发送给请求节点1。
请求节点1通过向MN发送监听响应来确认DVM请求。
MN接收到监听响应。
MN向请求节点0发出完成消息。
请求节点0向MN发出一个DVM同步操作。
MN向请求节点0发出DBIDResp消息。
请求节点0向MN发送写数据消息。这是DVM同步消息的第二部分。
MN向请求节点1发出DVM同步监听操作。
请求节点1完成所有未完成的DVM操作。
请求节点1向MN发送监听响应，表示已完成所有操作。
MN向请求节点0发出完成消息。这是对DVM同步请求的响应。

6.缓存贮存（stashing）

缓存贮存是一种在系统内特定缓存中安装数据的机制。CHI-B引入了这个特性以提高系统性能。缓存贮存机制通过在数据即将使用的地方附近分配一个缓存行来提高系统性能。当使用数据时，这将导致更低的内存访问延迟。

通常，缓存贮存（Stash）请求由RN-I和RN-D节点发起。缓存贮存请求是一个建议，而不是一个强制性动作。接收缓存贮存请求的设备可以忽略该请求。

CHI支持两种主要形式的缓存贮存：包含写数据的贮存事务，以及无数据的贮存事务。两种形式的缓存贮存都可以将不同的缓存级别作为贮存目标。缓存贮存支持已添加到ACE5-Lite协议中。CHI协议在缓存贮存方面非常灵活，允许贮存请求采用多种形式。

6.1 事务流程

缓存贮存的基本事务流程如下：

RN在请求通道上发起一个缓存贮存请求。
缓存贮存请求被转发给HN-F。
HN-F可以：
• 忽略缓存贮存请求。RN-F将贮存监听视为非贮存版本并做出相应的响应。或者，
• 接受请求并生成针对RN-F的监听。RN-F响应并将缓存行提取到其缓存中。
被指定进行贮存的RN-F接收到一种特殊类型的noop请求，称为贮存监听。

RN-F可以：

• 使用DataPull机制提供一个充当关联缓存行读请求的监听响应

• 在不使用DataPull的情况下提供监听响应，然后为该缓存行发出独立的读请求

• 在不获取该行的情况下提供监听响应，忽略缓存贮存暗示

6.2 贮存监听请求

所有缓存贮存请求都会发送到HN-F节点。当HN-F处理缓存贮存请求时，它会向目标RN-F生成贮存监听。CHI定义了四种不同的贮存监听请求，每种请求对应于初始缓存贮存事务。以下表格详细介绍了这些请求：

贮存缓存事务	HN-F发出的监听请求	RN-F采取的操作
WriteUniquePtlStash	SnpUniqueStash	使缓存行无效并返回数据（如果数据已更改，则带有写数据）
WriteUniqueFullStash	SnpMakeInvalidStash	如果存在，则使缓存行无效（带有写数据）
StashOnceShared	SnpStashShared	针对缓存行发出共享请求（无数据）
StashOnceUnique	SnpStashUnique	针对缓存行发出唯一请求，为未来写做准备（无数据）

6.3 缓存贮存控制字段

CHI为缓存贮存添加了请求、监听、响应和数据Flit的控制字段。这些字段表示：

• 贮存目标的NodeID

• RN-F内的特定逻辑处理器缓存，如L2缓存

• 是否使用DataPull机制

Request Flit对于缓存贮存请求使用以下字段：

• StashNID保存贮存目标的节点ID。如果RN-F被选为贮存目标，StashNID字段将填充RN-F的节点ID。

• StashNIDValid。如果在贮存时应使用StashNID字段，StashNIDValid将为1。

• StashLPID指定RN-F内的逻辑处理器ID。此字段允许将较低级别的缓存（如L2缓存）指定为贮存目标。

• StashLPIDValid。如果在贮存时应使用StashLPID字段，StashLPIDValid将为1。

Snoop Flit还包含以下字段：

• StashLPID和StashLPIDValid。如果缓存贮存请求指示StashLPID有效（StashLPIDValid = 1），监听将使用缓存状态请求中的StashLPID值。如果没有指定StashLPID（StashLPIDValid = 0），则贮存的数据可以放置在RN-F内的共享缓存中。

• DoNotDataPull：如果此字段设置为1，则贮存目标无法请求DataPull，因此无法使用DataPull机制。

6.4 带写数据的事务

如果请求者正在写入新数据并需要一个目标来存储该数据，则发出WriteUniqueStash事务。写入的数据可以是完整或部分缓存行。CHI使用以下操作码之一来指示带有贮存暗示的写：

• WriteUniquePtlStash表示部分缓存行写

• WriteUniqueFullStash表示完整缓存行写

本节介绍I/O请求者如何发出带有写数据的贮存暗示。贮存事务的目标是系统中的RN-F。事件顺序如下：

1. RN-I发出带有写数据的WriteUniqueFullStash请求。为简化起见，此示例未描述HN-F的DBIDResp。如下图所示：

2. HN-F接受贮存请求，然后向RN-F发出SnpMakeInvalidStash请求，如下图所示：

3. RN-F接收到NH-F的监听。
4. RN-F接受贮存暗示并发出监听响应，如图所示：
5. 如果使用DataPull机制，RN-F发出隐式读请求的监听响应，或者发出监听响应和单独的读请求。为简化起见，本示例中使用隐式监听响应和读请求，但未使用完整的DataPull流程。
6. HN-F将从RN-I接收到的写数据发送给RN-F

6.5 无写数据的事务

请求方在将缓存用作贮存目标但不写入数据时，使用无数据贮存事务。CHI对于无数据贮存请求使用以下操作码：

• 如果预期贮存目标会读取缓存行，则发出StashOnceShared。此操作码表示在分配后，缓存行应处于共享状态。

• 如果预期贮存目标会写入缓存行，则发出StashOnceUnique。此操作码表示缓存行应处于唯一状态，从而使贮存目标在将来需要时能立即写入缓存行。

以下示例描述了没有写数据的贮存暗示。RN-I向RN-F发送贮存请求，将RN-F作为贮存目标，并且HN-F和RN-F都接受贮存暗示。

事件顺序如下：

1. RN-I向HN-F发出StashOnceUnique请求，指示RN-F是目标且没有写数据。以下图示显示了这个步骤：

2. HN-F接受贮存请求。

3. HN-F向主内存发出ReadNoSnp请求以获取缓存行，并向RN-F发出 SnpStashUnique 监听，如图所示：

4. 主内存将缓存行返回给HN-F，如图所示：

5. RN-F对监听作出回应，请求缓存行。

6. HN-F将缓存行转发给RN-F。

贮存请求不需要有效的贮存目标。如果未指定贮存目标，则请求中的目标HN-F成为贮存目标。然后，HN-F选择是否将缓存行分配到其缓存中。以下步骤描述了无写数据的贮存暗示，目标是系统缓存。事件的顺序如下：

RN-I向HN-F发出StashOnceShared请求。将StashNIDValid字段设置为0以定位HN-F。
HN-F向主内存发出ReadNoSnp请求以获取指定的缓存行。
主内存将缓存行返回给HN-F。
HN-F将缓存行分配到其缓存中。

6.6 DataPull机制

DataPull机制是通过Snoop响应暗示读请求的一种方式，因此不需要单独的读请求来获取要贮存的缓存行。DataPull仅适用于贮存Snoop请求，而不适用于其他任何snoop。

接收要求DataPull的请求的RN-F可以选择是否使用DataPull或发送单独的读请求。如果RN-F选择不请求DataPull，它会响应snoop，然后可以稍后发送读请求以获取缓存行。在本节中，我们描述了RF-F利用DataPull机制作为贮存事务的一部分接收数据的过程。DataPull的完整事务流程如下：

HN-F发出贮存Snoop并将Snoop Flit中的DoNotDataPull字段设置为0。这表明RN-F贮存目标可以请求DataPull。
接收到DoNotDataPull = 0的RN-F可以选择在其Snoop响应中请求DataPull。在此示例中，RN-F选择请求DataPull。
RN-F通过在Response Flit中设置两个字段来请求DataPull：
• 将DataPull字段设置为1
• 使用将用于返回读数据的TxnID填充DBID字段
RN-F接收到读取的数据。
RN-F向HN-F发送CompAck消息。

以下图示显示了StashOnceUnique事务的DataPull机制的时序：

在此图示中，示例系统包含：

• 发起请求的一个RN-D

• 一个作为贮存目标的RN-F

• 一个HN-F

• 一个SN-F

示例中的完整事务流程如下：

RN-D向HN-F发出StashOnceUnique请求。StashNID字段的值表示RN-F1是贮存目标。
HN-F接受贮存请求。
HN-F发出：
• 一个ReadNoSnp请求到SN-F
• 一个SnpStashUnique Snoop到RN-F1
HN-F向RN-D发送完成响应。
RN-F1接受贮存暗示。
RN-F1使用SnpResp_I_Read DataPull请求响应SnpStashUnique。SnpResp_I_Read响应表示隐式读请求。DBID字段将事务ID设置为Y。
SN-F将缓存行返回给HN-F。
HN-F将缓存行转发给RN-F1，其中：
• TxnID = Y
• DBID = Z
RN-F1向HN-F发出完成确认响应，TxnID = Z。

下一个示例显示了WriteUniquePtlStash事务的DataPull机制的时序：

在此示例中，系统具有：

• 一个RN-D节点

• 两个RN-F节点：RN-F1和RN-F2。当发送贮存请求时，RN-F2持有缓存行。

• 一个HN-F节点

示例中的事务流程如下：

RN-D向HN-F发出WriteUniquePtlStash请求。贮存目标是RN-F1。
HN-F接受贮存请求。
HN-F向RN-D返回DBIDResp。
HN-F生成一个SnpCleanInvalid Snoop到RN-F2。这是因为RN-F2持有缓存行，并将SnpUniqueStash发送到贮存目标RN-F1。
RN-F2使缓存行无效。
RN-F2返回一个带有Dirty数据的Snoop响应给HN-F。
RN-F1发出一个带有隐式读请求的Snoop响应。DBID字段将贮存数据的TxnID设置为Y。
HN-F接收到Snoop响应。
HN-F向RN-D发出完成响应。
RN-D将贮存请求的写数据发送给HN-F。HN-F现在同时拥有写数据和Snoop响应中的数据。HN-F为缓存行创建新数据。
NH-F将缓存行的所有权发送给RN-F1。响应字段为：
• TxnID = Y
• DBID = Z
RN-F1发送一个带有TxnID = Z的CompAck响应。

7. I/O释放（Deallocation）

CHI-B为I/O请求者提供了在完全一致节点中释放（重分配）缓存行的能力。I/O释放事务提供了一个暗示，即应该使缓存行无效，并且脏数据应该写回到内存或被丢弃。因为这些请求仅仅是暗示，一个完全一致节点可以选择不使缓存行无效，而只是将数据返回给I/O请求者。换句话说，如果忽略了使缓存行无效的暗示，这些请求将被视为普通的ReadOnce事务。因为它们可以被忽略，I/O释放请求不是缓存维护操作的替代品。

CHI为I/O释放定义了两种请求类型：ReadOnceCleanInvalid和ReadOnceMakeInvalid。这两种请求都有助于避免缓存污染，因为在不久的将来不再使用这些数据。这两种请求类型的区别在于，ReadOnceMakeInvalid不需要将脏数据写入到下一级内存，这可能导致系统中的脏数据被丢弃。这意味着在使用这种类型的请求时必须谨慎。

7.1 I/O释放事务示例

本节描述了两个事务流程的示例。第一个示例使用ReadOnceCleanInvalid并将脏数据写回主内存。第二个示例使用ReadOnceMakeInvalid并丢弃脏数据。这两个示例中的系统都有：

• 完全一致请求节点（RN-F）设备。RN-F以脏状态持有请求的缓存行

• I/O一致请求节点（RN-I）设备

• CHI互连

• 主存

在第一个示例中，ReadOnceCleanInvalid事务流程读取数据使其无效，并将其写回主存。此示例的完整事务如下：

1. RN-I向HN-F发出ReadOnceCleanInvalid事务，如图所示：
2. HN-F向RN-F发送SnpUnique请求，请求缓存行，如下图所示：

3. RN-F使缓存行无效并将脏数据发送到HN-F。

4. HN-F将数据返回给RN-I并将数据写入主内存，使其保持干净状态。

在第二个示例中，ReadOnceMakeInvalid事务读取数据并使RN-F中的缓存行无效，但是并没有将脏数据写入主内存，而是丢弃了数据。此示例的完整事务流程如下：

1. RN-I向HN-F发出ReadOnceMakeInvalid事务，如图所示：

2. HN-F向RN-F发送SnpUnique请求，请求缓存行，如下图所示：

3. RN-F使缓存行无效并将脏数据发送到HN-F。

4. HN-F将数据返回给RN-I，然后丢弃脏数据。

注：如果在代理读取已失效的脏缓存行之前将其覆盖，ReadOnceMakeInvalid请求可能导致数据丢失。仅在您知道将来不再使用此数据时才使用此事务。

8. DMT、DCT和PrefetchTgt

在CHI-A中，读数据和Snoop数据都通过Home Node传输，然后发起请求的节点才接收到它。通过Home Node的传输增加了这些请求的访问延迟。为了减少这种延迟，CHI-B增加了直接内存传输（DMT）和直接缓存传输（DCT）机制。下表总结了CHI-A和CHI-B中从SN或RN到RN的数据传输差异：

	SN到RN	RN到RN
CHI-A	从SN读取的数据必须在返回RN的途中经过HN	从RN获取的Snoop数据必须在返回RN的途中经过HN
CHI-B	直接内存传输（DMT）：SN数据绕过HN，直接传输到RN	直接缓存传输（DCT）：RN数据绕过HN，直接传输到RN

为了支持DMT和DCT操作，在请求、Snoop和数据flit中添加了额外的标识符。这些额外的字段指定了以下信息，以便正确地将数据和任何需要的响应路由到正确的端点：

• 读数据的最终目标

• 原始请求的TxnID

• 向SN-F发出请求的HN，或者向RN-F发出Snoop的HN。HN仍然需要CompAck通知，说明DMT或DCT已完成。

CHI-B问题还增加了Prefetch Target（PrefetchTgt）事务，以减少内存访问的访问延迟。PrefetchTgt事务直接从RN-F发送到SN-F，不需要返回任何数据。存储器控制器可以将此作为提示，并为PrefetchTgt请求缓冲数据。如果在数据位于缓冲区时收到对该数据的普通请求，缓冲区将提供更快的访问时间。

8.1 直接内存传输(DMT)

在以下示例中，您可以比较读请求在有DMT和没有DMT的情况下，读取数据所采取的路径。对于没有DMT的读请求，事务流程如下：

1. CPU向HN-F发出读请求，如图所示：

2. HN-F在地址上发生缓存未命中，并向内存控制器发出读请求，如下图所示：

3. 内存控制器获取读请求的数据，然后将数据发送回HN-F。

4. HN-F将读取的数据返回给请求缓存行的CPU。在到达目的地之前，读取的数据需要返回到HN-F。

在第二个示例中，使用了DMT，事务流程修改如下：

1. CPU向HN-F发出读请求，如图所示：

2. HN-F在地址上发生缓存未命中，并向内存控制器发出读请求，如下图所示：

3. 内存控制器获取读请求的数据

4. 内存控制器将数据发送到发起CPU，而不是HN-F

使用DMT时，读取的数据绕过HN-F，直接发送给发出读请求的CPU。大多数读请求都可以使用DMT机制，包括由缓存存储操作产生的隐式DataPull读。不能使用DMT的请求包括：

• 独占访问

• ReadNoSnp 请求，其中 ExpCompAck = 0 且 Order != 0

• ReadOnce 请求，其中 ExpCompAck = 0 且 Order != 0

为了支持DMT，CHI包含以下标识符字段：

• 请求Flit使用返回节点ID（ReturnNID）和返回事务ID（ReturnTxnID）字段

• 数据Flit使用基节点ID（HomeNID）字段

下面的示例中的图示显示了DMT事务流程的时序，重点关注标识符字段的使用：

在此示例系统中有：

• 具有节点ID 1的RN-F（RN-F_NID1）

• 具有节点ID 2的HN-F（HN-F_NID2）

• 具有节点ID 3的SN-F（SN-F_NID3）

示例中的DMT事务流程以如下方式使用标识符字段：

• RN-F向HN-F发送具有TxnID = A和ExpCompAck = 1的ReadOnce请求

• HN-F的缓存中没有请求的数据，因此它向SN-F发出ReadNoSnp请求。ReadNoSnp请求包括：

◦ TxnID = B

◦ ReturnNID = 1。这表示应将读取的数据发送到具有节点 ID 1 的 RN-F

◦ ReturnTxnID = A。这与原始 ReadOnce 请求的 TxnID 匹配。

• 当SN-F准备好返回读取的数据时，它发送带有以下内容的CompData_UC消息：

◦ TxnID = A。这与SN-F收到的ReturnTxnID的值匹配

◦ HomeNID = 2。这是HN-F的节点 ID

◦ DBID = B。这与HN-F发送的ReadNoSnp的TxnID匹配

• RN-F向HN-F发送具有TxnID = B的CompAck消息。这与CompData_UC消息中的DBID字段匹配。

• HN-F收到CompAck后，可以停止跟踪它发送给SN-F的ReadNoSnp消息。

在 CHI-B 中，针对某些 ReadOnce 和 ReadNoSnp 事务，包含了一种优化的 DMT 序列。该序列要求 SN-F 节点识别请求 Order 字段中的值 0x1，并向 HN-F 发送 ReadReceipt 响应。此项新增功能可减少 HN-F 节点处事务的生命周期，从而有可能释放资源。

相比之下，CHI-A 在 Order 字段中将值 0x1 标记为保留，并且不要求 SN-F 提供 ReadReceipt。允许发送 ReadReceipt 响应的唯一节点是 HN 至 RN 和 SN-I 至 HN-I。

下图显示了一个 ReadOnce 事务的优化 DMT 序列示例，其中 HN-F 缓存中没有请求的地址：

在此示例中，事务流程如下：

RN-F向HN-F发出TxnID = A的ReadOnce请求。
HN-F向SN-F发出具有以下内容的ReadNoSnp请求：
• Order = 0x01
• TxnID = B
ReturnNID 字段获取RN-F的节点ID。
ReturnTxnID字段获取原始ReadOnce请求的TxnID。
SN-F接受事务。
SN-F向HN-F发出ReadReceipt。
当数据准备好时，SN-F使用原始TxnID将读数据发送到RN-F。

HN-F 收到 Read Receipt 后，立即取消分配请求。这种取消分配减少了 HN-F 处事务的生命周期，并释放了资源。如果这是 CHI-A，那么 HN-F 需要等待从 RN-F 收到 CompAck 响应，然后才能停止跟踪 ReadNoSnp 事务。

8.2 预取目标(PrefetchTgt)

为了进一步增强直接内存传输，CHI-B提供了预取目标（PrefetchTgt）请求，以减少SN-F处内存访问延迟。PrefetchTgt消息是从RN直接发送到SN-F的提示。该请求不需要响应，因此RN不会将其作为未完成请求进行跟踪。

SN-F可以选择忽略请求，或者获取指定地址的数据。如果SN-F决定获取数据，它会将数据缓冲，直到收到该地址的正常读请求。假设在不久的将来，通过完全相干家节点HN-F的正常路径上会有一个单独的读事务。

在SN-F处对数据进行缓冲可减少读事务的内存访问延迟，并隐藏HN-F系统缓存中首先进行的本地查找的任何额外延迟。

由于不需要响应，PrefetchTgt中的TxnID字段不适用，CHI-B要求在发送请求时将其设置为0。例如，RN向SN-F发出请求。这是完成PrefectTgt事务所需的唯一步骤，双方都不会发送其他Flit。

PrefetchTgt请求可能会提前很长时间发送，以至于SN-F会将缓冲数据驱逐出去，为其他读请求腾出空间。为了避免PrefetchTgt请求造成拥塞，CHI-B使用Data Flit中的DataSource字段来报告使用PrefetchTgt的有效性。此字段由内存控制器设置，表示读取的数据是否受益于之前的PrefetchTgt提示。DataSource字段可能的值为：

• 0x6表示PrefetchTgt请求有用

• 0x7表示读取的数据未从PrefetchTgt中受益，且无效

如果足够多的PrefetchTgt请求被确定为无效，RN可以停止发出这些请求。通常，RN只实现RN系统地址映射（RN SAM）。此SAM针对HN-F，且不知道SN-F节点ID。为了支持PrefetchTgt事务，RN也需要HN系统地址映射。HN SAM将地址转换为SN-F TgtID。

例如，PrefetchTgt提示可以优化DMT。CPU在DMT读取未命中之前发出PrefetchTgt请求。在PrefetchTgt事务之后，当DDR控制器收到读请求时，已经准备好读数据。示例中的完整流程如下：

CPU向DDR控制器发出PrefetchTgt提示。
DDR控制器接受提示并开始检索数据的过程。
两件事情并行发生：
• CPU向HN-F发出与PrefetchTgt相同地址的读请求。
• DDR控制器开始接收读数据并将其缓冲，以备后续读取。
CPU向HN-F发出读请求
读请求在HN-F处导致缓存未命中。
HN-F向DDR内存发出读请求。
由于数据已经在DDR控制器处缓冲，DDR立即将读取的数据返回给CPU。通过使用PrefetchTgt请求，DMT读事务在DDR内存访问中几乎没有延迟。

8.3 直接缓存传输(DCT)

为了减少监听命中延迟，CHI-B使用直接缓存传输机制（DCT）。DCT类似于对监听的DMT，并允许从RN-F的监听数据绕过HN-F，直接到达原始请求者。当数据需要在请求者之间来回传输时，此机制有助于提高系统性能。

受益于DCT的用例包括信号量（semaphores）和生产者-消费者工作负载。例如，您可以比较读请求在使用和不使用DCT的情况下读数据的路径。在没有DCT的情况下，整个系统级流程如下：

CPU A向HN-F发出读请求。
该请求在HN-F处导致缓存未命中。
HN-F向CPU B发出监听，后者持有缓存行。
CPU B将缓存行的数据返回给HN-F。
HN-F将数据返回给最初请求它的CPU A。

使用相同的初始事务并添加DCT，整个系统级流程进行如下优化：

CPU A向HN-F发出读请求。
该请求在HN-F处导致缓存未命中。
HN-F向CPU B发出监听，后者持有缓存行。
CPU B绕过HN-F，直接将数据返回给发出读请求的CPU A。

通过使用DCT，监听命中的访问延迟得到降低。

8.4 转发监听请求

为了支持DCT，CHI-B添加的元素之一是转发监听请求。转发监听请求告诉被监听的RN-F将监听数据直接发送到原始请求者。除了原子事务和独占读取外，所有可监听的读都可以使用DCT。转发类型的监听在监听Flit中引入了新的标识符字段，如下所示：

• 转发节点ID（FwdNID），其功能类似于DMT中的ReturnNID。它保存原始请求者的节点ID。

• 转发事务ID（FwdTxnID），其功能类似于DMT中的ReturnTxnID。它保存原始读请求的TxnID。

• 返回源（RetToSrc）指示RN-F将监听数据发送到HN-F，此外还要发送给请求的RN-F。将数据发送到RN-F可以使将来针对该地址的请求在HN-F缓存中命中，并避免产生额外的监听。

在响应转发监听时，响应和数据Flit都使用新的转发状态（FwdState）字段。该字段告诉HN-F在任何本地监听过滤器跟踪中，向请求RN-F提供了什么缓存状态。被监听的RN-F中的缓存状态，即转发监听的结果，会像往常一样在RESP字段中提供给请求RN-F。原始请求者会在CompData消息中接收到监听数据，作为正常的读数据响应，如下图所示：

在此图中，响应包含与DMT响应相同的HomeNID和DBID字段：

• HomeNID字段包含被绕过的HN-F的节点ID

• DBID字段包含转发监听的TxnID

然后，RN-F将这些字段用作发送给HN-F的CompAck响应的TgtID和TxnID。以下两个示例展示了当RetToSrc设置为0或1时，标识符字段如何填充。这些示例中的系统具有：

• 两个具有节点ID 1和2（RN-F_NID1和RN-F_NID2）的RN-F

• 在两个实例中，RN-F2都在其缓存中保存了所请求的地址

• 一个具有节点ID 3的HN-F

以下图示显示了当RetToSrc = 0时，DCT的事务流程：

在此图中，事务流程如下：

RN-F_NID1向HN-F发出ReadNotSharedDirty请求。该请求具有TxnID = A。
该请求在HN-F处导致缓存未命中。
HN-F向RN-F_NID2发出SnpNotSharedDirtyFwd监听。
监听具有：
• TxnID = B
• FwdNID = 1。该值与RN-F_NID1的节点ID匹配。表示它是监听数据的目的地。
• FwdTxnID = A。该值与读请求的原始TxnID匹配。
• RetToSrc = 0
由于请求中的RetToSrc设置为0，RN-F_NID2使用SnpRespFwded消息回应HN-F。此响应中有两个重要字段：
• RESP显示缓存行从UC状态转移到SC状态
• FwdState告诉HN-F发送给原始请求者的缓存状态。在此示例中，即SC状态。
RN-F_NID2向RN-F_NID1发送CompData消息，其中包括：
• TxnID = A。这是监听请求中的FwdTxnID值。
• HomeNID = 3。这是HN-F的节点ID。
• DBID = B。这是监听请求的TxnID
• RESP = SC（Shared Clean）。这显示了数据以SC状态提供，与监听响应中的FwdState字段值相匹配。
RN-F_NID1向HN-F发送CompAck消息，TxnID = B。这完成了ReadNotSharedDirty请求。

下面的图示中的第二个示例显示了相同的ReadNotSharedDirty请求，但RetToSrc = 1：

在此图中，事务流程如下：

RN-F_NID1向HN-F发出具有TxnID = A的ReadNotSharedDirty请求。
请求在HN-F处导致缓存未命中。
HN-F向RN-F_NID2发出SnpNotSharedDirtyFwd监听。监听具有：
• TxnID = B
• FwdNID = 1
• FwdTxnID = A
• RetToSrc = 1
RN-F_NID2使用CompData消息将缓存行转发到RN-F_NID1，其中包含以下字段：
• TxnID设置为监听中的FwdTxnID值。
• DBID设置为监听中的TxnID值。
• RESP显示返回的缓存行可以在SC状态下缓存。
由于RetToSrc = 1，RN-F_NID2将缓存行发送到HN-F。缓存行以SnpRespDataFwded消息发送，其中FwdState = SC（共享干净）和RESP = SC_PD（共享干净_传递脏）。RESP中的此值告诉HN-F，缓存行在RN-F2处于SC状态，且RN-F2将该缓存行的回写责任传递给HN-F。
收到监听数据后，RN-F_NID1向HN-F发送带有TxnID = B的CompAck响应。

9. 原子操作

为了支持Armv8.1架构中添加的原子指令，CHI-B提供了原子事务。互连使用原子事务将原子操作及其操作数从一个设备传输到另一个设备。使用原子操作而不是独占访问可以减少其他代理无法访问数据的时间。原子事务可以执行多个原子操作，并且可以在处理器内部或外部执行。

原子操作是在没有另一个请求者干扰的情况下执行的读-修改-写序列。与AXI中的独占访问一样，原子事务允许请求者修改内存的特定区域的数据，同时确保其他请求者的写入不会破坏数据。

在AXI3和4以及CHI-A中，请求者获取数据，执行操作，然后将结果写回以完成原子访问。CHI-B包含将原子操作传输到互连的选项，这允许操作更靠近数据所在位置执行。这提高了效率，减少了数据对其他请求者不可访问的时间。

为了执行原子操作，目标需要一个算术逻辑单元（ALU）。也就是说，要使用原子操作，HN、SN或两者都需要一个ALU。来自CHI-B的原子事务支持是可选的，因此HN和SN并不总是需要具有ALU。请求者有一个配置引脚BROADCASTATOMIC，可以用于在下游系统不支持原子事务时阻止请求者生成原子事务。

完整的原子事务结构是：

• 请求者向互连发出原子事务

• HN或SN具有ALU，因此它执行原子操作

• 根据操作，互连可能将地址的原始数据返回给请求者

10. RAS特性

CHI-B添加了可靠性、可用性和可维护性（RAS）特性，以支持Armv8 RAS规范。RAS特性有助于错误检测和系统调试，并在以下列表中进行描述：

• 数据损坏和数据检查表示数据已损坏

• 追踪标记功能用于性能分析和调试

10.1 数据损坏和数据检查

典型的系统只能检测到多位错误，而无法纠正。这就是为什么多位错误通常被称为不可纠正的错误。相比之下，许多系统可以纠正单位错误。

Arm RAS规范允许在不立即引发异常的情况下，将不可纠正的错误从生产者传播到消费者。为了允许传递损坏的数据，CHI-B包含数据损坏和数据检查的RAS特性。这两个特性表明数据在系统的某个点已经损坏。CHI-B允许数据包中Poison、Datacheck和RespErr字段之间的互操作性。

将数据标记为已损坏，并不立即表示发生了错误，这使得数据可以在系统中传播，直到数据被消耗。推迟错误指示意味着系统不必在每次检测到不可纠正的错误时引发异常。相反，可以将Poison字段分配给与相应缓存行一起的缓存。这允许系统访问和使用未损坏的数据。

数据损坏以64位为单位，这意味着数据包中的Poison字段为每64位数据设置一个位，以表示它已损坏。例如，一个256位数据字段将具有一个4位宽的Poison字段。数据损坏必须对数据的有效部分进行准确处理。如果一个64位的数据Flit无效，那么该Flit的Poison将返回一个不关心值。

在发生以下情况之一时，损坏的数据被认为已消耗：

• 数据用于计算

• 数据传播到不支持数据损坏的组件。因为这个组件不能使用Poison字段，所以它将停止跟踪被损坏的数据。为了跟踪该数据，系统必须得到一个异常。

数据检查特性为数据字段提供奇偶校验保护。实现可以在互连的各个点测试DataCheck字段以查找损坏的数据。DataCheck以8位粒度操作，因此DataCheck字段中的每个位对应于数据字段中的一个字节。

10.2 追踪标记

CHI-B包含TraceTag字段以帮助调试和性能分析。TraceTag的宽度只有1位，并且该字段被添加到每个通道。如果Flit中的TraceTag字段被设置，它表示向系统指示该Flit被标记为追踪目的。事务中的所有后续Flit也必须设置TraceTag。这包括从原始请求生成的所有新事务。

例如，如果从RN-F到HN-F的请求中设置了TraceTag，那么从HN-F到SN-F的读请求也必须设置TraceTag字段。请求节点可以在初始请求中设置TraceTag，或者可以在互连的中间点设置TraceTag。例如，可以对互连的观察点进行编程，以在HN-F处为地址A的请求设置TraceTag。这个编程为HN-F处发出的任何针对地址A的Flit设置TraceTag，但从RN到HN-F的初始请求可能没有设置TraceTag。

例如，初始TraceTag在互连中设置，然后为后续Flit设置。互连被编程以跟踪MakeUnique请求。事务流程如下：

1. 请求节点0向主节点发出地址A的MakeUnique请求，如下图所示：

2. 互连在由MakeUnique请求生成的监听和监听响应中设置TraceTag。

3. 请求节点2向主节点3发送地址A的ReadShared请求。从ReadShared生成的监听没有设置TraceTag。这一步如下图所示：

4. HN-F向请求节点0发送完成信号。完成信号已设置TraceTag。

在此示例中，MakeUnique和ReadShared都针对地址A，但是只有在主节点3看到MakeUnique请求后才设置了TraceTag字段。为ReadShared请求生成的所有Flit都未被标记为追踪。

11. 协议迭代和扩展

本节介绍了从CHI A版到C版的变化，并提供了一些新增功能的示例。

11.1 从CHI-A到CHI-B的变化

以下表格描述了在CHI-B中所做的添加

CHI-B新增	描述
MESI协议支持	CHI-B增加了对MESI一致性协议的支持。这支持不使用Owned或Shared Dirty缓存状态的RN-F以及简化的Snoop过滤器。此更改添加了新的操作码ReadNotSharedDirty和SnpNotSharedDirty，它们保证数据不会以SharedDirty状态返回。SNP Flit还添加了字段DoNotGoToSD，以确保被监听的RN-F不会使缓存行处于SharedDirty状态。
SharedClean状态返回	CHI-B增加了以Shared Clean状态返回缓存行的功能。HN-F可以通过在非转发类型的Snoops中使用RetToSrc字段来请求Shared Clean状态的缓存行副本。如果多个RN-Fs持有缓存行，HN-F仅为一个被监听的RN-F设置RetToSrc字段。这鼓励系统缓存中存在更多共享数据，而不仅仅是在CPU缓存中。这有助于减小监听RN-F以获取缓存行副本时存在的延迟。
WriteDataCancel操作码允许取消写请求	此操作码在Data Flit上发布，仅适用于三种事务：WriteUniquePtl、WriteUniquePtlStash和WriteNoSnpPtl。为避免死锁情况，CHI-A允许系统中的一个RN使用Streaming Ordered WriteUniques Optimization（WUO）。使用WriteDataCancel操作码，可以在多个RN使用WUO时打破死锁情况。当使用WriteDataCancel时：• 为完成事务，仍必须发送所有响应和Data Flit。• 必须发送具有清零的Data和BE字段的WriteDataCancel消息
CleanSharedPersist	为了将缓存行清理到持久性点，Armv8.2中添加了DC CVAP指令。有关持久性点的更多信息，请参阅Armv8-A架构配置文件的Arm架构参考手册Armv8。为支持Persistent Memory Transactions，添加了CleanSharedPersist操作码。执行DC CVAP指令会生成一个CleanSharedPersist事务。对持久性内存的支持是可选的，由配置输入引脚BROADCASTPERSIST指示：• 如果BROADCASTPERSIST = 1，可以向下游发布CleanSharedPersist事务。• 如果BROADCASTPERSIST = 0，请求方必须将CleanSharedPersist事务转换为CleanShared事务
CMO传播到SN	可以将Cache Maintenance Operations从HN传播到SN。这允许SN支持HN下游的缓存。可以通过支持可选的BROADCASTCACHEMAINTENANCE、BROADCASTINNER和BROADCASTOUTER信号来控制CMO传播。当所有这些信号都存在且未触发时，CleanShared，CleanInvalid和MakeInvalid事务不会向下游发出。
DVM增强	虚拟机标识符字段从8位扩展到16位。为支持此增强功能，SNP Flit中添加了VMIDExt字段以传输额外的8位（VMID[15:8]）。此字段在DVM Snoops的第一部分中填充，第二部分中设置为0。VMID[15:8]在DVM请求的第二部分中传输，填充数据字段的位63:56。

以下功能在CHI-B中已弃用

• 屏障事务和内部及外部共享域。由DMB或DSB指令生成的所有屏障事务必须在内核内终止。CHI-B互连不支持屏障，因此RN不应向外部发出它们。

• 内部和外部共享域。请求仅标记为可Snoop或不可Snoop。由于仅支持两种类型，Request Flit的SnpAttr字段从2位减少到1位。

11.2 从CHI-B到CHI-C的变化

以下表格描述了在CHI-C中添加的内容

CHI-C新增	描述
CompAck响应更早发送	CHI-C中的RN在接收到第一个数据Flit后可以发出CompAck消息。以前，RN需要等待所有读数据Flit到达后才能发出CompAck响应。
数据Flit操作码字段宽度增加	数据Flit的操作码字段大小从3位增加到4位。这使得数据Flit宽度比CHI-B多1位。更宽的操作码字段需要支持新的数据消息DataSepResp。由于数据Flit增加了1位，CHI-C设备与CHI-B设备不直接兼容
合并写数据和CompAck	CHI-C添加了一条新消息NCBWrDataCompAck，允许将CompAck响应与WriteUnique事务的写数据一起发送。
将读的响应和数据分开	读事务可以接收完成和读数据的独立响应。为支持此功能，添加了两个新消息：• 在RSP通道上发送的RespSepData消息。此消息表示读已达到序列化点。HN将此消息发送给RN。此消息缩短了HN处的读请求寿命，因为RN可以在无序读后立即发送CompAck响应。从RN到HN的有序读有几个限制：◦ RN必须在发送CompAck给HN的有序读之前至少等待一个DAT Flit。◦ HN不得发送ReadReceipt响应，因为RespSepData消息充当ReadReceipt。• 在数据通道上发送的DataSepResp消息。这是仅发送读数据的数据消息。此消息可以由HN或SN发送，具体取决于是否使用DMT。

11.3 读事务示例

读序列使用ReadNoSnpSep请求，该请求旨在与数据内存传输（DMT）一起使用，并从HN发送到SN。当SN看到此请求时，它知道要使用DataSepResp消息将读数据返回给RN独立响应和数据读序列可用于大多数读类型。此新序列的例外情况是

• 原子事务

• 排他访问

• 需要排序且无完成确认的ReadNoSnp或任何ReadOnce变体

以下两个示例演示了使用独立响应和数据消息的读序列。第一个示例显示了SN-F单独发送数据。第二个示例显示了HN-F执行相同操作。在这两种情况下，系统由以下部分组成：

• 一个RN-F，RN-F_NID1

• 一个HN-F，HN-F_NID2

• 一个SN-F，SN-F_NID3

以下图表显示了当响应来自HN，数据来自SN时的完整事务流程：

在此图表中，事务流程如下：

RN-F向HN-F发出具有TxnID = A的ReadNotShareDirty请求。
HN-F向SN-F发出ReadNoSnpSep请求，表明它不应向RN-F发送CompData响应。这意味着SN-F需要使用DataSepResp消息返回读取的数据，并将Order字段设置为1。这类似于优化的DMT序列。
HN-F对请求进行序列化。
HN-F向RN-F发出RespSepData消息。TxnID与原始请求的TxnID匹配，DBID字段与ReadNoSnpSep的TxnID匹配。
SN-F确认请求并向HN-F发送ReadReceipt消息作为响应。
RN-F接收到RespSepData。
RN-F在未等待读数据的情况下向HN-F发出CompAck消息。
当数据可用时，SN-F使用DataSepResp消息将读数据发送给RN-F。 DataSepResp消息的TxnID，HomeNID和DBID字段与DMT序列相同。

在之前的CHI版本中，RN-F必须等到接收到ReadNotSharedDirty请求的数据后才能发送CompAck。通过使用单独的响应和数据序列，显著减少了HN-F处事务的生命周期。

在这第二个示例中，读数据通过DataSepResp消息由HN-F返回。以下图表显示了响应和数据都来自HN时的完整事务流程：

在此图表中，事务流程如下：

RN-F向HN-F发出ReadClean请求。
HN-F用RespSepData消息回应RN-F。
与前一个示例不同，HN-F向SN-F发送普通ReadNoSnp。
RN-F接收到RespSepData响应。
RN-F向HN-F发送CompAck消息。
SN-F使用CompData消息将数据发送给HN-F。
HN-F使用DataSepResp消息将数据发送给RN-F。字段值为：

• TxnID与原始请求匹配。

• HomeNID为2，是HN-F的节点ID。

• DBID字段为B。

与第一个示例一样，在接收到CompAck消息后，HN-F能够停止跟踪ReadClean请求。使用单独的响应和数据序列，HN-F在RN-F接收到数据之前收到了CompAck消息。

11.4 组合写数据和CompAck示例

CHI-C提供了一种合并了CompAck响应和写数据的消息，称为NCBWrDataCompAck，其中NCBW代表非拷贝写回。这个新消息可以用于：

• 任何WriteUnique变体

• 流式有序WriteUnique

由于NCBWrDataCompAck传输写数据，因此必须在数据通道上发送。在发送数据之前，RN必须等待：

• 一个DBIDResp消息

• 一个Comp响应

Comp和DBIDResp消息可以作为两个单独的响应发送，也可以作为组合的CompDBIDResp发送。我们来看两个关于NCBWrDataCompAck如何工作的示例。第一个示例使用组合的CompDBIDResp消息，第二个示例使用单独的消息。示例系统有一个RN-F和一个HN-F。这个例子使用组合的CompDBIDResp：

• RN-F向HN-F发送一个WriteUniqueFull请求，值为：

◦ TxnID = A

◦ ExpCompAck = 1

• HN-F发送CompDBIDResp，其中：

◦ TxnID与原始请求相同。

◦ DBID = B

• RN-F发送了结合CompAck与写数据的NCBWCompAck消息。

以下图表显示了组合CompDBIDResp事务流程：

在第二个示例中，系统保持不变，但HN-F发送单独的Comp和DBIDResp消息。

• RN-F向HN-F发送WriteUniqueFull请求，值为：

◦ TxnID = A

◦ ExpCompAck = 1

• HN-F执行两个操作：

◦ 发送与WriteUniqueFull的TxnID匹配的Comp消息

◦ 发送DBIDResp响应，表示它可以接收写数据。TxnID与Write请求的TxnID匹配，DBID = B

• RN-F接收两个消息。

• RN-F发送具有TxnID = B的NCBWrDataCompAck消息。

以下图表显示了单独的Comp和DBIDResp事务流程：

你可能感兴趣的:(网络)

50.第二阶段x64游戏实战-代码实现特征码定位计算机王逆向学习 x64游戏反游戏外挂 c++汇编游戏攻防特征码搜索
免责声明：内容仅供学习参考，请合法利用知识，禁止进行违法犯罪活动！本次游戏没法给内容参考于：微尘网络安全上一个内容：49.第二阶段x64游戏实战-封包-代码实现自动登录现在找了很多基址了，但是游戏一更新，代码就会有变化，然后之前找的基址就没法用了，有得重新找，这是一个体力活，为了避免重新找就可以使用特征码进行定位，特征码定位也不是绝对的，可能需要多个版本才能让它不出错，如果特征代码进行了改动也还是
Linux——内核——网络协议
Linux网络协议栈是Linux内核中实现网络通信的核心组件，其设计遵循分层架构，支持多种网络协议和功能。以下从协议栈的分层结构、关键组件、工作流程、数据包处理机制、优化与调试等方面进行详尽阐述：一、协议栈的分层结构Linux网络协议栈基于TCP/IP模型，分为四层：应用层提供用户接口，支持HTTP、FTP、SSH等协议。通过SocketAPI与传输层交互，实现数据收发。传输层TCP：面向连接，提
LSTM（Long Short-Term Memory）模型的深度解析 AI扶我青云志 lstm rnn 深度学习
在6.28号我发了一个博客《RNN（循环神经网络）与LSTM（长短期记忆网络）输出的详细对比分析》，但是我并未详细讲解LSTM，LSTM是循环神经网络中的一个模型，然而通过这篇博客给大家深度解析一下LSTM，重点关注其内部结构和参数。LSTM是为了解决标准RNN在处理长序列时出现的梯度消失/爆炸问题而设计的一种特殊循环神经网络结构。它的核心在于引入了门控机制和细胞状态，使得网络能够有选择地记住或忘
【Java面试】RocketMQ是如何做到零消息丢失的？
一、生产阶段：确保消息可靠发送同步发送与重试机制生产者采用同步发送（send()方法）并等待Broker返回SendResult，仅当状态为SEND_OK（刷盘和主从同步均成功）时确认发送成功。默认同步重试3次，可通过setRetryTimesWhenSendFailed(10)调整重试次数，应对网络抖动等问题。事务消息机制Half消息：生产者先发送半消息到Broker的HALF队列（对消费者不可
学习记录：DAY33 2301_79760424 每日学习记录学习
前端学习之旅：Node.js模块与HTTP服务前言----------------------------------------又是许久许久没有更新，在苦哈哈弄完期末，然后花一天时间把计算机网络课设写了之后。现在又即将回到前后端学习的状态。我想现在正处于一个调整期的状态。一个是随着blog的不断堆积，有必要把它们整理成更具有逻辑性的知识片。另一个是我需要了解当前前后端需要学习的路线，这样我可以有
GRU与LSTM之间的联系和区别 AI扶我青云志机器学习人工智能深度学习
前面我们谈到RNN与LSTM之间的关系，而GRU也是循环神经网络中的一种模型，那么它与LSTM有什么区别呢？接下来我来对GRU（GatedRecurrentUnit）模型进行一次深度解析，重点关注其内部结构、参数以及与LSTM的对比。GRU是LSTM的一种流行且高效的变体，由Cho等人在2014年提出，旨在解决与LSTM相同的长期依赖问题，但通过更简化的结构和更少的参数来实现。核心思想：简化LST
细粒度IP定位参文27（HGNN）：Identifying user geolocation（2022年）
[27]F.Zhou,T.Wang,T.Zhong,andG.Trajcevski,“Identifyingusergeolocationwithhierarchicalgraphneuralnetworksandexplainablefusion,”Inf.Fusion,vol.81,pp.1–13,2022.（用层次图、神经网络和可解释的融合来识别用户的地理定位）论文地址：https://do
ADB常用命令转身，就是永别测试工具 adb
ADB常用命令设备连接与管理adbdevices：列出当前连接的设备，显示设备序列号和状态（如device或offline）。adbconnect：通过网络连接设备（需开启设备的ADB调试网络权限）。adbdisconnect：断开网络连接的设备。adbkill-server：终止ADB服务进程。adbstart-server：启动ADB服务进程。应用管理adbinstall：安装应用（如adbi
华为和H3c--交换技术
华为和H3c–交换技术一、VLAN的作用和交换网络链路类以及VLAN封装1、VLAN的作用和优势1）VLAN的作用隔离广播域2）VLAN的优势降低广播网络占用带宽资源安全性强屏蔽VLAN间访问增强设备的稳定性2、隔离广播的方式1）物理隔离通过路由器设备实现成本高2）VLAN交换机创建VLAN将接口加入到不同的VLAN中，VLAN之间相互隔离一个VLAN表示一个广播域3、交换网络链路的类型和Trun
WebRTC基础介绍
WebRTC全称为：WebReal-TimeCommunication。它是为了解决Web端无法捕获音视频的能力，并且提供了peer-to-peer（就是浏览器间）的视频交互。WebRTC汇集了先进的实时通信技术，包括：先进的音视频编解码器（Opus和VP8/9），强制加密协议（SRTP和DTLS）和网络地址转换器（ICE＆STUN）。根据最初的定义，WebRTC被指定为P2P（peer-to-p
【网络编程】EPOLL 事件触发机制的服务器啟明起鸣网络服务器运维
文章目录业务拆解EPOLL机制介绍EPOLL的核心变量和函数EPOLL程序流程图C代码实现准备工作服务器代码代码运行效果总结推荐一个零声教育学习教程，个人觉得老师讲得不错，分享给大家：[Linux，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK等技术内容，点击立即学习:https:/
UDP服务器主要是指什么意思？ wanhengidc udp 服务器网络协议
UDP的全称为用户数据报协议，是一种在计算机网络中常用的传输协议，属于是传输层协议，UDP属于是一种无连接的协议，在发送数据信息之前，发送方和接收方不需要建立任何握手连接，主要是用于发送小量数据的实时应用。UDP服务器则是一种基于UDP协议实现的网络服务端程序，能够用来接收、处理和响应客户端发送的UDP数据报，UDP服务器与TCP服务器相比较来说，UDP服务器不需要建立连接，但是也不能够保证数据信
电信路由模式改桥接模式！想尝一尝被打赏的味道桥接模式
记录一下，怕日后忘记！第一步先进去超级管理后台http://192.168.1.1:8080/超级帐号是：telecomadmin密码：nE7jA%5m里面网络设置可以看到宽带账号，但是看不到密码，致电10000号，愉快的重置了。短信已收到密码；【20240-12-16】换了新猫后，上面的方案失效了。新密码账号：telecomadmin密码：pQCT!mW6直接在192.168.1.1登录就行了，
LLCC68IMLTRT：Semtech新一代LoRa®射频收发器芯片，IoT设备续航翻倍深圳市尚想信息技术有限公司物联网收发器收发器芯片升特半导体工业传感器
LLCC68IMLTRT（Semtech）产品解析与推广文案1.产品概述LLCC68IMLTRT是Semtech（升特半导体）推出的一款高性能、低功耗LoRa®Sub-GHz射频收发器芯片，支持远距离无线通信，适用于物联网（IoT）、智能表计、工业传感器网络等场景。2.主要功能与优势（1）远距离&低功耗通信LoRa®调制技术：通信距离>5km（城市环境），>15km（郊区）。超低功耗：接收电流仅5
从数据抓取到智能分类：用 LangChain + 爬虫构建自动化工作流的实战笔记大模型之路大模型（LLM）人工智能 langchain
一、从人工到自动化的迫切需求在数字化时代，信息的快速获取与处理成为个人和组织高效运转的关键。然而，许多重复性强、耗时长且缺乏创造性的任务，如定期收集和整理网络信息并制作成特定格式的内容，依然占据着人们大量的时间和精力。本文作者就面临这样的困境：每两周需花费数小时访问多个大学网站，提取活动信息，手动将其整理成繁琐的HTML表格，并确保在Outlook中格式正确无误。这一过程不仅涉及大量枯燥的重复劳动
网络基础(1) Mr_Xuhhh 网络 c++c语言算法 qt 开发语言
网络基础协议定义：减少通信的成本，用于快速共识**本质：**一种约定计算机之间，如何实现约定呢？通过OSI（国际标准化组织），OSI标准，不产生代码协议分层协议本质上也是软件，在设计上为了更好地进行模块化，解耦合，也是被设计成为层次结构的所有软件都是层次的，模块化的网络协议就是分层的结论1:两种视角，普通用户，工程师*结论2：*同层之间，在“直接”通信结论3：分层之后，可以无障碍替换任意一层计算机
在mac下手动编译迁移的android版webrtc组件 jwybobo2007 WebRTC webrtc android
我原先使用的android版webrtc是在linux下编译的，现在因为某些原因需要把整个库迁移到mac下编译。把代码迁移完后，正常是需要通过gclientsync重新构建编译环境，但是由于网络限制等方面原因，会导致完成的比较慢。在摸索一阵后，找到了一种方式可以快速的编译出webrtc，步骤如下：假设已经有NDK、depot_tools、ninja，并且可以正常使用了1.修改src/build/c
【Torch】nn.Dropout算法详解油泼辣子多加深度学习算法
1.定义nn.Dropout是PyTorch中用于防止神经网络过拟合的正则化层。其核心思想是在训练阶段随机“丢弃”（置零）部分神经元的输出，以减少网络对特定神经元的过度依赖；在推理阶段则保持所有神经元输出不变。2.输入与输出输入（Input）任意形状的浮点张量（如torch.float32、torch.float64等），常见于全连接层或卷积层的激活输出。输出（Output）与输入张量形状、dty
Redis总结傲祥Ax redis 数据库 Redis重点总结
一、Redis是什么？key-value形式的非关系型数据库，基于内存（64位系统默认是物理内存的四分之三），单线程多路io复用，通常当缓存使用，提高查询效率。二、为什么使用Redis？2.1快（内单异高算）内存存储，单线程模型，异步操作，高效的网络通信，优化的算法和数据结构2.2作用2.2.1五大数据类型Redis存储，key-value形式，value的五种数据类型String，List，Se
详解 websocket 协议 Super乐 PHP websocket websocket
一、websocket是什么？websocket是一个基于应用层的网络协议，建立在tcp协议之上，和http协议可以说是兄弟的关系，但是这个兄弟有点依赖http，为什么这么说呢？我们都知道HTTP实现了三次握手来建立通信连接，实际上websocket的创始人很聪明，他不想重复的去造轮子，反正我兄弟已经实现了握手了，我干嘛还要重写一套呢？先让它去冲锋陷阵呢，我坐收渔翁之利不是更香吗，所以一般来说，我
计算机网络高频面试题
1、介绍一下ISO七层网络模型？ISO七层网络模型（OSI参考模型）是国际标准化组织（ISO）提出的网络通信框架，将网络通信划分为七个逻辑层次，每层提供特定的服务并与相邻层交互。其核心目的是实现不同厂商设备的互操作性，并简化网络通信的设计与故障排查。（1）OSI七层模型的结构：物理层（PhysicalLayer）功能：负责传输原始比特流，定义电压、接口等物理特性。关键技术：双绞线、光纤、无线信号（
数智管理学（二十七）虚谷23 数智管理学企业数智化创业创新数据分析人工智能大数据
第二章数智化重塑管理的核心概念第四节三者的协同作用：构建数智化管理新生态在当今数智化浪潮的深刻影响下，企业管理领域正经历着前所未有的变革与重塑。数据驱动、网络化协作和动态资源配置作为数智化管理的三大核心要素，它们之间相互交织、协同作用，共同构建起了一个全新的管理生态系统。这一生态系统的形成，不仅突破了传统管理模式的诸多局限，还在管理效率、灵活性和智能化程度等方面展现出了巨大的优势和潜力。深入理解这
Python, Rust 开发教育/医疗/文化资源去中心化分配APP Geeker-2025 python rust
以下是为教育、医疗、文化资源设计的**去中心化分配APP**的完整技术方案，结合Python的灵活性和Rust的高性能与安全性，实现公平透明的资源分配：---###系统架构设计```mermaidgraphTDA[用户终端]-->B[区块链网络]A-->C[分配引擎]B-->D[智能合约]C-->E[资源数据库]D-->F[分配记录]subgraph技术栈C-.Rust.->G[核心分配算法]D-
C++网络编程Socket网络编程基础入门 weixin_47868976 网络 c++开发语言
Socket网络编程基础入门-从理论到实践1.Socket基本概念1.1什么是Socket？Socket（套接字）是网络编程的基础，它是应用层与传输层之间的抽象接口。简单来说，Socket就是网络通信的端点，就像电话的听筒一样，用于发送和接收数据。在你的FileHub项目中，Socket被封装在多个层次中：//从net/Socket.h可以看到Socket的封装classSocket:noncop
计算机网络基础知识+学习路线早起的小懒虫计算机网络网络
计算机网络是一种将多个计算机设备通过通信线路连接在一起，使其能够相互传输数据和共享资源的技术和设施。1.基础知识学习计算机网络需要了解计算机硬件、操作系统、编程语言等基础知识。计算机硬件：计算机硬件包括中央处理器（CPU）、存储器、输入输出设备等。CPU是计算机的核心，负责执行程序和控制计算机的各种操作。存储器主要有随机存储器（RAM）和只读存储器（ROM），用于存储数据和程序。输入输出设备包括键
JWT认证授权原理和简单实现风铃喵游 node
1.关于JWT:(1).JWT(jsonwebtoken)是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准(2).JWT的声明一般被用于在身份提供者和服务提供者之间传递被认证的用户身份信息，以便于从资源服务器获取资源。最为常见的场景就是用户登录认证(3).因为数字签名的存在，这些信息是可信的，JWT可以使用HMAC算法或者是RSA的公私密钥对进行签名2.主要的应用场景:(1).身份
论文调研_物联网漏洞检测综述 kitsch0x97 论文调研学习物联网
AReviewofIoTFirmwareVulnerabilitiesandAuditingTechniques研究背景：物联网设备在工业、消费类等各个领域得到了广泛应用，实现了更高的自动化和生产率。然而，这些连网设备的高度依赖也带来了一系列网络安全威胁，特别是IoT设备固件漏洞问题，往往在开发和部署过程中被忽视。针对这一问题，亟需制定全面的安全策略，包括对IoT设备固件环境(软件组件、存储、配置
【网络】Linux 内核优化实战 - net.core.busy_read
目录核心功能工作原理与优势配置方式1.临时配置（重启失效）2.永久配置（重启生效）与`net.core.busy_poll`的协同作用适用场景与注意事项适用场景：注意事项：总结net.core.busy_read是Linux内核中与网络性能优化相关的参数，主要用于控制socket层的忙轮询（BusyPolling）行为，与net.core.busy_poll配合使用，共同优化网络数据包的处理效率。
以太坊 Legacy 交易和 EIP-1559 交易 MetaverseMan 区块链
在以太坊网络中，不同类型的交易被设计用于支持各种功能和服务。以下是几种主要的交易类型，包括你提到的Legacy交易和EIP-1559交易：1.Legacy交易Legacy交易是指以太坊最初支持的传统交易格式。这类交易主要包括以下几个字段：nonce:发送者的交易计数，确保每笔交易唯一性。gasPrice:用户愿意为每个单位gas支付的价格（以wei为单位）。gasLimit:用户愿意为此交易支付的
抓大鹅教程电脑端秒通关…… 小黄编程快乐屋其他
大家好，我是小黄。最近抓大鹅小程序游戏很火，抓大鹅小游戏是由青岛蓝飞互娱科技股份有限公司开发并推出的一款休闲益智类三消游戏。在游戏中，玩家需要在特定的“购物篮子”背景下，找到三个相同的物品并将其消除。游戏的玩法简单有趣，因此风靡网络。玩法跟之前的羊了个羊类似。最近小黄也试着玩了一下，发现小黄实力有点差，不是在看广告就是在看广告的路上。越消除越觉得气人。所以，小黄给他上点科技，在进行科技之前我们需要
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户