Dgh19940

DPDK中的Cache优化

高负载下的网络数据包处理是一种I/O密集型工作负载。CPU，DMA，以及内存（Cache+DRMA）都会频繁访问。DPDK利用了一系列的Cache软件优化方法（cache预取，cache对齐，hugepage ，NUMA感知，DDIO）高效的减少访存开销以提升性能。本文将讲解这些方法的基本原理以及在DPDK中的应用。

1：Cache预取

Cache由于时间以及空间上的局部性能提高相当的性能，所谓的Cache预取，也就是预测数据并取入Cache，根据空间/时间局部性原理，参考当前的执行状态，软件提示等信息，在数据/指令被使用前取入Cache。在之后当数据/指令被使用时，就能快速从Cache中加载到CPU内部运算和执行。Cache预取又分为硬件预取与软件预取，这里将介绍早期的NetBurst构架的硬件预取以及DPDK使用的软件预取及指令。

硬件预取：

在早期Intel的NetBurst架构的处理器上各级cache都有相应的硬件预取单元，，以一级数据Cache的预取单元为例：

1):数据Cache预取单元：也叫基于流的预取单元（Streaming prefetcher）当程序以地址递增的方式访问数据，该单元会被激活，自动预取下一个Cache行的数据。

2）基于指令寄存器（Instruction Pointer，IP）的预取单元：该单元会检测指令寄存器的读取指令（Load），当该单元发现数据块的大小基本是固定的情况下，会自动预取下一块数据。

图片转自：http://linuxperformance.top/index.php/archives/109/

当在预取机制在内存中找到了块A，那么会预取连续的A+1,A+2,A+3,A+4。因为处理器消耗完A+1后会接着消耗A+2的，预取连续的块也叫做顺序预取。

软件预取：

预取指令使软件开发人员在性能关键区域，把即将用到的数据从内存中加载到Cache，使得当前数据处理完毕后，即将用到的数据已经在Cache中，大大减小了从内存直接读取的开销，减少CPU的等待时间，提高性能。

预取指令表：

和缓存预取有关的指令：
指令 Description
PREFETCHT0 预取数据到所有级别的缓存，包括L0。
PREFETCHT1 预取数据到除L0外所有级别的缓存。
PREFETCHT2 预取数据到除L0和L1外所有级别的缓存。
PREFETCHNTA 预取数据到非临时缓冲结构中，可以最小化对缓存的污染。和PREFETCHT0 功能类似，但是数据在使用完一次后，Cache认为数据是可以淘汰出去的
Intel® C++ Compiler的Intrinsic等效方法：
void _mm_prefetch(char *p, int i)

从地址P处预取尺寸为cache line大小的数据缓存，参数i指示预取方式（_MM_HINT_T0, _MM_HINT_T1, _MM_HINT_T2, _MM_HINT_NTA，分别对应不同的预取指令0,1，2，A）。

DPDK的应用：

首先先看看DPDK的性能测试结果，转载至：http://www.cnblogs.com/hugetong/p/7126790.html

测试结果：

包长(byte)	pps	Mbps	seconds	socket数	收包physics core数	队列数	发包数	收包数
500	230000	960		1	1	24	10000000	10000000
400	284000	950		1	1	24	10000000	10000000
300	367000	940		1	1	24	10000000	10000000
200	542000	952		1	1	24	10000000	10000000
100	1039000	997	9.62	1	1	24	10000000	10000000
64	1483000	996	6.74	1	1	24	10000000	9907134
64	1483000	996	67.4	1	1	24	100000000	99147516
64	1483000	996	67.4	1	1	1	100000000	99671467
64	1483000	996	67.4	1	2	24	100000000	99252877
64	1483000	996	67.4	1	4	24	100000000	99084322
64	1483000	996	67.4	2	8	24	100000000	99177716
64	1483000	996	67.4	2	24	24	100000000	99110338

其实验环境如下

发包方式：192.168.20.205
发包工具：pktgen
发包网卡：i350
收包设备：1922.168.20.185
CPU：Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz
收包方式：网卡ixgeb驱动，~~单队列，~~promisc计数
收包网卡： 82599EB

传输链路：千兆RJ45网线直连

DPDK的一个处理器核每秒可以处理约33M个报文，大概30纳秒处理一个报文，在处理器频率2.7GHz的情况下，处理一个数据报文需要80个时钟周期。

一个数据报文到达网口后，会经历如下过程：

1）写接受描述符到内存，填充数据缓冲区指针，网卡接收到报文后就根据该地址把报文内容填进去。

2）从内存中读取接收描述符（到接收到报文时，网卡会更新该结构）（内存读），从而确认是否收到报文。

3）从接收描述符确认收到报文时，从内存中读取控制结构体的指针，再从内存中读取控制结构体，把从接收描述符中读取的信息填充到该控制结构体（内存读）。

4）更新接收队列寄存器，表示软件接收到了新的报文。

5）从内存读取报文头部（内存读），决定转发端口。

6）从控制结构体把报文信息填入到发送队列发送描述符中，更新发送队列寄存器。

7）从内存中读取发送描述符（内存读），检查是否有包被硬件发送出去。

8）如果有的话，则从内存中读取相应控制结构体（内存读），释放数据缓冲区。

可以看出处理一个报文的过程中，需要6次读取内存（上文（内存读））。换句话说要保证在80个时钟周期处理完一个报文DPDK就必须保证要读取的数据Cache命中，否则一旦Cache不命中，性能会严重下降。

在l3fwd-vf/main.c中使用预取的代码段

  / *
                 *从RX队列读取数据包
                 * /
                for（i = 0; i  n_rx_queue; ++ i）{
                        portid = qconf-> rx_queue_list [i] .port_id;
                        queueid = qconf-> rx_queue_list [i] .queue_id;
                        nb_rx = rte_eth_rx_burst（portid，queueid，pkts_burst，MAX_PKT_BURST）;
                        / *预取第一个数据包* /
                        for（j = 0; j  lookup_struct）;
                        }
                        / *转发剩余的预取包* /
                        for（; j  lookup_struct）;
                        }

static void rte_prefetch0 （ const volatile void * p ）

将缓存行预取到所有缓存级别。

参数 p 预取地址

2：Cache一致性

当定义的数据结构或者分配了数据缓冲区之后，内存中就有了一个地址和其相对应，然后程序进行读写。在读的过程中，首先是内存加载到Cache，随后送到处理器内部的寄存器；在写操作的时候则是从寄存器送到Cache，最后由总线回写到内存。

这样会出现两个问题：

1）数据结构/数据缓冲区对应的Cache Line是否对齐？如果不是的话，即使数据区域小于Cache Line的话也会占用两个Cache Line；另外假如上一个CacheLine属于另一个数据结构且被另一个处理器核处理，数据如何同步呢？

2）假设数据结构/缓冲区的起始地址是CacheLine对齐的，但是有多个核同时对该内存进行读写，如何解决冲突？

针对第一个问题

CacheLine对齐，DPDK中对很多结构体的定义是这样的：

struct lcore_conf {
uint16_t nb_rx_queue;
struct lcore_rx_queue rx_queue_list[MAX_RX_QUEUE_PER_LCORE];
uint16_t tx_queue_id[RTE_MAX_ETHPORTS];
struct buffer tx_mbufs[RTE_MAX_ETHPORTS];
struct ipsec_ctx inbound;
struct ipsec_ctx outbound;
struct rt_ctx *rt4_ctx;
struct rt_ctx *rt6_ctx;

} __rte_cache_aligned;

其中_rte_cache_aligned的定义是这样的

struct rte_mempool_ops_table __rte_cache_aligned __rte_aligned（RTE_CACHE_LINE_SIZE）

强制对齐缓存行。

定义在文件rte_memory.h的第62行。


 #define RTE_CACHE_LINE_MIN_SIZE 64      
 #define __rte_cache_aligned __rte_aligned(RTE_CACHE_LINE_SIZE)
 #define __rte_cache_min_aligned __rte_aligned(RTE_CACHE_LINE_MIN_SIZE)

针对第二个问题

cache一致性问题:主要介绍总线窥探协议。即被X86，ARM，Power等架构广泛采用著名的MESI协议

MESI协议将cache line的状态分成modify、exclusive、shared、invalid，分别是修改、独占、共享和失效。

失效（Invalid）缓存段，要么已经不在缓存中，要么它的内容已经过时。为了达到缓存的目的，这种状态的段将会被忽略。一旦缓存段被标记为失效，那效果就等同于它从来没被加载到缓存中。

共享（Shared）缓存段，它是和主内存内容保持一致的一份拷贝，在这种状态下的缓存段只能被读取，不能被写入。多组缓存可以同时拥有针对同一内存地址的共享缓存段，这就是名称的由来。

独占（Exclusive）缓存段，和S状态一样，也是和主内存内容保持一致的一份拷贝。区别在于，如果一个处理器持有了某个E状态的缓存段，那其他处理器就不能同时持有它，所以叫“独占”。这意味着，如果其他处理器原本也持有同一缓存段，那么它会马上变成“失效”状态。

已修改（Modified）缓存段，属于脏段，它们已经被所属的处理器修改了。如果一个段处于已修改状态，那么它在其他处理器缓存中的拷贝马上会变成失效状态，这个规律和E状态一样。此外，已修改缓存段如果被丢弃或标记为失效，那么先要把它的内容回写到内存中——这和回写模式下常规的脏段处理方式一样。

对于两个Cache中存在备份时，只有部分状态是允许的。如下表所示横轴和纵轴分别表示两个Cache中的某个CacheLine的状态，且都映射到相同的内存块。如果一个CacheLine设置成M态或者E态，那么另一个只能设置为I态；如果一个CacheLine设置成S态，那么另一个可以为S或I态；如果一个设置为I态，另一个可以设置为任何状态。即：

MESI中两个Cache备份的状态矩阵
	M	E	S	I
M	false	false	false	true
E	false	false	false	true
S	false	false	true	true
I	true	true	true	true

MESI状态之间的迁移过程如下：

当前状态	事件	行为	下一个状态
I（Invalid）	Local Read	如果其他Cache没有这份数据，本Cache从该内存中取数据，Cache line状态变成E；如果其他Cache有这份数据，且状态为M，则将数据更新到内存，本Cache再从内存中取数据，两个Cache的Cache line状态都变成S；如果其他Cache有这份数据，且状态为S或者E，本Cache从内存中取数据，这些Cache的Cache line状态都变成S。	E/S
	Local Write	从内存中取数据，在Cache中修改，状态变成M；如果其他Cache有这份数据，切状态为M，则要先将数据更新到内存；如果其他Cache有这份数据，则其他Cache的Cache line状态变成1	M
	Remote Read	既然是invalid，别的核的操作与它无关	I
	Remote Write	既然是invalid，别的核的操作与它无关	I
E（Exclusive）	Local Read	从Cache中取数据，状态不变	E
	Local Write	修改Cache的数据，状态为M	M
	Remote Read	数据和其他核共用，状态变成了S	S
	Remote Write	数据被修改，本Cache line不能再使用，状态变成I	I
S（Shared）	Local Read	从Cache中取数据，状态不变	S
	Local Write	修改Cache中的数据，状态变成M，其他核共享的Cache line状态变成I	M
	Remote Read	状态不变	S
	Remote Write	数据被修改，本Cache line不能再使用，状态变成I	I
M（Modified）	Local Read	从Cache中取数据，状态不变	M
	Local Write	修改Cache中的数据，状态不变	M
	Remote Read	这行数据被写到内存中，使其他核能使用到最新的数据，状态变成S	S
	Remote Write	这行数据被写到内存中，使其他核能使用到最新的数据，由于其它核会修改这行数据，状态变成I	I

DPDK如何保证Cache一致性

DPDK解决方案很简单，首先避免多个核访问同一个内存地址或者数据结构。每个核尽量避免与其他核共享数据，从而减少因为错误的数据共享导致的Cache一致性开销。

举两个DPDK避免Cache一致性的例子：

例子1：

通过数据结构定义。对于某些数据结构给每个核都单独定义一份，如DPDK官方的l3fwd为例：

 struct lcore_conf {//保存lcore的配置信息
     uint16_t n_rx_queue;    //接收队列的总数量
     struct lcore_rx_queue rx_queue_list[MAX_RX_QUEUE_PER_LCORE];//物理端口和网卡队列编号组成的数组
     uint16_t tx_queue_id[RTE_MAX_ETHPORTS]; //发送队列的编号组成的数组
     struct mbuf_table tx_mbufs[RTE_MAX_ETHPORTS];//mbuf表
     lookup_struct_t * ipv4_lookup_struct; //实际上就是struct rte_lpm *
#if (APP_LOOKUP_METHOD == APP_LOOKUP_LPM)
     lookup6_struct_t * ipv6_lookup_struct;
#else
     lookup_struct_t * ipv6_lookup_struct;
#endif
 } __rte_cache_aligned;

struct lcore_conf lcore[RTE_MAX_LCORE]_rte_cache_aligned;

以上的数据结构 “struct lcore_conf”和上边一样总是CacheLine对齐，而定义数组“lcore[RTE_MAX_LCORE]”中RTE_MAX_LCORE为系统中最大核的数量。DPDK对每一个核编号，这样核n就只需要访问lcore[n],避免了多个核访问同一结构体。

例子2：

在多核的情况下，有可能多个核访问同一个网卡的接收/发送队列，这样也会引起Cache一致性的问题。

DPDK就会为每个核都准备一个单独的接收/发送队列。如图。

该技术称为RSS(Receive Side Scaling)，是一种能够在多处理器系统下使接收报文在多个CPU之间高效分发的网卡驱动技术。

3.TLB和大页

准确来讲TLB不是DPDK专用的技术，TLB属于对处理器架构的优化。

下面转载http://blog.csdn.net/divlee130/article/details/47104241

Hugepages 机制

大内存页指的是为包处理的缓冲区缓冲区分配更大的大内存池，利用大内存页的主要好处当然是通过利用大内存页提高内存使用效率。可以得到明显的性能提高，因为需要更少的页，更少的TLB( Translation Lookaside Buffers)，减少了虚拟页地址到物理页地址的转换时间。如果不使用大内存页机制的话，TLB的命中率会降低，反而会降低性能。大内存页最好在启动的时候进行分配，这样可以避免物理空间中有太多的碎片，提高发包的效率。普通的页大小为4KB，默认的大内存页的大小为2MB，也可以设置其他的大内存页大小，可以从CPU的标识中看出支持哪种大内存页，如果有 “pse”的标识，说明支持2M的大内存页。如果有“pdpe1gb”的标识，说明支持1G的大内存页，如果64位机建议使用1GB的大页。

如何使用大内存页

如果已经配置好了大内存页机制，就可以让DPDK利用大内存页的机制了。
可以输入如下的命令
mkdir /mnt/huge
mount -t hugetlbfs nodev /mnt/huge
在运行程序的时候，最好把分配给大页的所有空间都利用起来。如果DPDK的程序在运行的时候传递了-m 或者–socket-mem的参数，大内存页的分配在启动的时候会自动加载。如果传递给程序的内存页数量比程序要求的要少，也就是内存页不够用，程序将会中止。

TLB

其中TLB(Translation Lookaside Buffer)指的是旁路转换缓冲，或称为页表缓冲，是一个存放着页表缓存（虚拟地址到物理地址的转换表）的内存管理单元，用于改进虚拟地址到物理地址转换速度。
X86体系的系统内存里存放了两级页表，第一级页表称为页目录，第二级称为页表。由于“页表”存储在主存储器中，查询页表所付出的代价很大，由此产生了TLB。
TLB是内存里存放的页表的缓存，那么它里边存放的数据实际上和内存页表区的数据是一致的，在内存的页表区里，每一条记录虚拟页面和物理页框对应关系的记录称之为一个页表条目（Entry）,同样地，在TLB里边也缓存了同样大小的页表条目（Entry）。

1：TLB在X86体系的CPU里的实际应用最早是从Intel的486CPU开始的，在X86体系的CPU里边，一般都设有如下4组TLB:
第一组：缓存一般页表（4K字节页面）的指令页表缓存（Instruction-TLB）；
第二组：缓存一般页表（4K字节页面）的数据页表缓存（Data-TLB）；
第三组：缓存大尺寸页表（2M/4M字节页面）的指令页表缓存（Instruction-TLB）；
第四组：缓存大尺寸页表（2M/4M字节页面）的数据页表缓存（Instruction-TLB）；

2：TLB命中和TLB失败
如果TLB中正好存放着所需的页表，则称为TLB命中（TLB Hit）；
如果TLB中没有所需的页表，则称为TLB失败（TLB Miss）。
当CPU收到应用程序发来的虚拟地址后，
首先到TLB中查找相应的页表数据，如果TLB中正好存放着所需的页表，则称为TLB命中（TLB Hit）
接下来CPU再依次看TLB中页表所对应的物理内存地址中的数据是不是已经在一级、二级缓存里了，若没有则到内存中取相应地址所存放的数据。

4.英特尔数据直接I / O技术（DDIO技术）

Intel DDIO是一种平台技术，它可以提高I / O数据处理效率，以便从I / O设备传输数据和消耗数据。借助英特尔DDIO，英特尔^\以太网服务器适配器和控制器可直接与处理器高速缓存进行通信，而无需通过系统内存。在所有基于英特尔®至强™处理器E5的服务器和工作站平台上默认启用英特尔DDIO。这种技术使得外部网卡和CPU通过LLCCache直接交换数据，绕过了内存这个相对较慢的部件。增加了CPU处理报文的速度，减少了网络报文在服务器端的延迟。同时，因为网络报文直接存储在LLC Cache，在英特尔至强E5处理器把LLCCache容量提高到20MB。

左图是没有DDIO技术的网卡读数据处理流程

1）：处理器更新把报文和控制结构体。由于分配的缓冲区在内存中，所以会触发一次cache不命中，处理器把内存读取到Cache，更新控制结构体和报文信息。通知NIC读取报文。

2）：当NIC接收到启动传输操作的通知时，它首先读取控制结构并随后读取分组数据。由于之前处理器刚把该缓冲区从内存中读取到Cache并做了更新，很有可能Cache还没有把更新的内容写回内存。因此，当NIC发起一个对内存的读请求时，很有可能这个请求会发送到Cache系统中，Cache系统会把数据写回内存，然后内存控制器再把数据写到pCI总线。因此，一个读内存操作会产生多次内存读写。

右边是有DDIO技术的网卡读数据处理流程

1）：处理器更新报文和控制结构体。这个步骤和没有DDIO的技术类似，但是由于DDIO的使用，处理器会开始就把数据预取到Cache。

2）：NIC收到有报文需要传递到网络上的通知后，通过PCI总线把控制结构体好的报文到NIC内部。利用DDIO，I/O访问一个直接将Cache的内容送到PCI总线。减少Cache写回时等待的时间。

左图是没有DDIO技术的网卡写数据处理流程

1）：报文和控制结构体通过PCI总线送到指定内存中。如果该内存恰好缓存在Cache中，则需要等待Cache先把内容写回内存中，然后才能把报文和控制结构体写回到内存。

2）：运行在处理器上的驱动程序或者软件得到通知收到报文，去内存中读取，Cache不命中。

右边是有DDIO技术的网卡写数据处理流程

1）：报文和控制结构体通过PCI总线直接送到Cache中。

有两种情况（a）如果内存恰好缓存在Cache中，则直接在Cache中更新内容，覆盖原有内容

（b）如果该内存没有缓存在Cache中则在最后一级Cache中分配一块区域，并相应更新Cache表。

2）：运行在处理器上的驱动或者软件被通知到有报文到达，其生产一个内存读操作，由于该内容已经在Cache中，因此直接从Cache中读。

5.NUMA系统及其感知

NUMA是起源于AMD Opteron的微架构，同时被英特尔Nehalem架构采用。在这个架构中，处理器和本地内存之间拥有更小的延迟和更大的带宽，和SMP系统相比，NUMA系统访问本地内存的带宽更大，延迟更小，但是访问远程内存的成本较高。DPDK利用了以下策略在NUMA系统中实现。

1）Per-core memory。一个处理器上有多个（core），per-core memory是指每个核都有属于自己的内存，即对于经常访问的数据结构，每个核都有自己的备份。

2）本地设备本地处理。及用本地的处理器、本地的内存来处理本地设备上产生的数据。如果有一个PCI、设备在node0上，就用node0上的核来处理设备，处理该设备用到的数据结构和数据缓冲区都从node0上分配。

注：此篇文章部分引用自《深入浅出DPDK》中的观点。

你可能感兴趣的:(DPDK)

shell 笔记_s1=abc,s2=def,[-z‘‘‘]&；&；echo‘$s1‘ echo‘$s2‘的输出是什么 2024云技术运维 linux 面试
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Linux平台上DPDK入门指南（一） lingshengxiyou 网络 linux 服务器网络协议云计算
1.简介本文档包含DPDK软件安装和配置的相关说明。旨在帮助用户快速启动和运行软件。文档主要描述了在Linux环境下编译和运行DPDK应用程序。1.1.文档地图以下是一份建议顺序阅读的DPDK参考文档列表：发布说明:提供特性发行版本的信息，包括支持的功能，限制，修复的问题，已知的问题等等。此外，还以FAQ方式提供了常见问题及解答。入门指南（本文档）：介绍如何安装和配置DPDK，旨在帮助用户快速上手
DPDK基础入门（七）：网卡性能优化指针从不空 Linux高性能网络性能优化网络
DPDK的轮询模式运行在操作系统内核态的网卡驱动程序基本都是基于异步中断处理模式，而DPDK采用了轮询或者轮询混杂中断的模式来进行收包和发包。任何包进入到网卡，网卡硬件会进行必要的检查、计算、解析和过滤等，最终包会进入物理端口的某一个队列。物理端口上的每一个收包队列，都会有一个对应的由收包描述符组成的软件队列来进行硬件和软件的交互，以达到收包的目的。轮询模式DPDK的轮询驱动程序负责初始化好每一个
如何在DPDK中实现协议解析？编码小哥 dpdk 架构
在DPDK中实现协议解析涉及几个步骤，包括初始化环境、配置网卡、接收数据包、解析数据包并处理数据包。下面将详细介绍这些步骤以及如何在DPDK中实现基本的协议解析。初始化DPDK环境首先，你需要初始化DPDK环境，加载EAL(EthernetAddressLearning)库，并设置好内存池、环形缓冲区等。#include#include#includeintmain(intargc,char**a
OVS主线流程之ovs-vswitchd主体结构分析大空新一网络 OVS
OVS是openvirtualswitch的简称，是现在广泛使用的软件实现的虚拟网络交换机。各大云厂商普遍使用OVS来实现自身的虚拟网络，各厂商会根据自身需要加以修改使之符合自身需求，DPU中也使用OVS来实现流表的offload。OVS中的流表基于多级结构，与用户强相关的是opwnflow，下发的流表称为emcflow。OVS一般存在两种运行模式，内核模式和DPDK模式。内核模式下存在一个dat
DPDK22.11环境搭建羽思 DPDK 网络驱动开发
1.工具下载1.ubuntu安装工具：sudoapt-getinstallmesonsudoapt-getinstallninjasudoapt-getinstallpython3-pyelftools2.centosyuminstall-ypython3-pipnumactl-devellibibverbs-utilslibpcap-devel//安装libpcap依赖包wgethttp://m
Linux进程间通信方式之管道(pipe)_ 前端老侯运维 linux 面试
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Docker容器如何与主机同网段其它主机互通？ lingshengxiyou linux DPDK c++docker 容器 linux 服务器后台开发
一、前言1、使用场景对开发者而言，随着容器的普遍使用，开发者可以很方便的搭建项目的简易测试环境。有时候为了项目可以在任意机器一键运行，不用配置连接IP等信息。所以希望可以提前固定容器的IP地址，而且一个项目有时候涉及多个容器，可能还会部署在多台机器上。所以如果容器间可以固定IP跨机器通信的话，会有很大方便。（免费订阅,永久学习）学习地址:Dpdk/网络协议栈/vpp/OvS/DDos/NFV/虚拟
DPDK mlx5 驱动使用报错 choumin 小问题 DPDK DPDK mlx5
还是记录一个小点，希望对大家有所帮助。背景：最近需要用DPDK测试Mellanox的ConnectX-4Lx网卡。在DPDK中，该网卡对应的驱动是mlx5。使用的DPDK版本是20.11和22.03，结果都出现了类似的报错信息。问题：在testpmd中启动上述网卡出现报错情况，testpmd的命令如下：$./build/app/dpdk-testpmd-l0-3-a0000:06:00.0-a00
DPDK源码分析之DPDK技术简介 lingshengxiyou c++linux DPDK 服务器 linux c++dpdk 虚拟机
Cache和内存技术1.Cache一致性多核处理器同时访问同一段cacheline时，会出现写回冲突的情况，操作系统解决这个问题会消耗一部分性能，DPDK采用了两个技术来解决这个问题：对于共享的数据，每个核都定义自己的备份lcore[RTE_MAX_LCORE]，这样多核处理事务时只处理自己的部分，lcore[idx]利用单网卡有着多队列的能力，当多核处理同一个网卡的数据包时，进行分队列处理，例如
Linux：dperf---100Gbps开源压力测试工具技术探索者工具使用 linux 知识测试工具 dperf
简介dperf是一个基于DPDK开发，具有千万级HTTPCPS，几十亿并发，几百Gbps带宽的开源压力测试仪，dperf实现了一个精简的用户态TCP/IP协议栈、精简的Socket、精简的HTTP客户端与服务器，可以curl/ab/nginx进行对接。dperf是一款开源的高性能网络压测软件，可用于测试四层负载均衡等网关设备的的各项性能指标（新建、带宽、并发、PPS）。总之，dperf是一个100
高性能异步io机制：io_uring linux大本营 c++linux epoll io_uring 异步io
io_uring是linux内核5.10引入的异步io接口。相比起用户态的DPDK、SPDK，io_uring作为内核的一部分，通过mmap的方式实现用户和内核共享内存，并基于memorybarrier在这块内存上实现了两个无锁环形队列：submissionqueuering(sq)和completionqueuering(cq)。sq用于用户程序向内核提交IO任务，内核执行完成的任务会放入cq，
OSDI 2023: Userspace Bypass Accelerating Syscall-intensive Applications 结构化文摘操作系统用户态内核硬件兼容分层架构存储结构
我们使用以下6个分类标准对本文的研究选题进行分析：1.方法：**系统调用消除：**专注于完全消除I/O路径中的系统调用（例如DPDK、UserspaceBypass）。**系统调用优化：**在不完全消除的情况下，旨在降低系统调用的成本（例如io_uring、F-Stack）。**替代执行模型：**探索使用用户空间或微内核等不同执行环境来绕过系统调用（例如QEMU、Unikernels）。2.应用重
DPDK初始化 phone1126 linux
rte_eal_init│├──rte_cpu_is_supported：检查cpu是否支持│├──rte_atomic32_test_and_set：操作静态局部变量run_once确保函数只执行一次│├──pthread_self()获取主线程的线程ID,只是用于打印│├──eal_reset_internal_config：初始化内部全局配置变量structinternal_config│├
DPDK大页内存 ordersyhack 引导指南解决方案系统搭建 linux 运维服务器
2Mlscpu|greppse1Glscpu|greppse1gbgrep-iHUGETLB/boot/config-$(uname-r)cat/proc/meminfo|grep-ihugepagesdefault_hugepagesz--表示默认的大页内存大小。hugepagesz--一个大页内存大小。hugepages--大页内存总的页数。vi/etc/default/grub#defaul
DPDK系列之四十一数据收发整体流程源码分析之一整体流程 fpcc 网络开发 DPDK
一、说明在前面的分析中基本介绍了DPDK中的各种模块的技术架构，从这篇开始，就从头开始对整个代码的流程进行分析，然后在此基础上，初步掌握了DPDK的代码架构和功能分析后，再对基于DPDK的上层应用进行分析。这是一个从分到合，从基础到应用的过程。在这个过程中需要不断的回顾和补充原来的知识。二、数据包流程在前面详细分析过数据包的转运流程，其实做一种IO接口，一定是分成两部分，即数据的接收和发送。从宏观
【dpdk】NVIDIA Poll Mode Driver (PMD) in DPDK Henry Patch #DPDK 后端
DataPlaneDevelopmentKit(DPDK)AchievefastpacketprocessingandlowlatencywithNVIDIAPollModeDriver(PMD)inDPDK.DPDKisasetoflibrariesandoptimizednetworkinterfacecard(NIC)driversforfastpacketprocessinginauser
【dpdk】NVIDIA MLX5 Common Driver Henry Patch #DPDK 后端
From3.NVIDIAMLX5CompressDriver—DataPlaneDevelopmentKit23.11.0documentation(dpdk.org)5.NVIDIAMLX5CommonDriverNoteNVIDIAacquiredMellanoxTechnologiesin2020.TheDPDKdocumentationandcodemightstillincludeins
【dpdk】qat-getting-started-guide-with-dpdk-v2.0 Henry Patch #DPDK #SPDK 后端
文章目录参考文档1.QATdriverinstallation1.1.Installationusingkernel.orgdriver1.2.**Bind**ingtheavailableVFstothevfio-pcidriver1.2.1.ForanIntel(R)QuickAssistTechnologyDH895xCCdevice1.2.2.ForanIntel(R)QuickAssis
【星海草稿】DPDK 后期会继续更新活跃的煤矿打工人 chrome 前端
官网：https://www.dpdk.org/https://launchpad.net/kollaPCI设备[查看和列出PCI设备。]lspci[网卡驱动程序设置特定的参数]modprobexxxx[查看是否正常运行]ifconfig内存设备64位Linux通常使用48位来表示虚拟地址空间，43位表示物理地址。#uname-m，然后按回车。如果输出是x86_64，那么你的系统就是64位的。如果
网络协议笔记 - L2TP协议 sz66cm Linux数据处理网络协议网络服务器
网络协议笔记-L2TP协议背景协议格式协议字段解析总结背景基于dpdk,实现了一套L2TP协议接入接口;协议格式协议字段解析T:0代表数据报文,1代表控制报文;L:1代表存在Length字段,0代表不存在Length字段;S:1代表Ns与Nr字段存在(控制报文S必须为1);O:1代表OffsetSize字段存在,(可控制报文O必须为0);P:1表示需要优待的报文,控制报文P必须为0;总结协议的学习
DPDK 中断处理流程分享放大价值
本文整理下之前的学习笔记，基于DPDK17.11版本源码分析。主要分析一下中断处理流程。网卡支持的中断有多种类型，比如收发包，LSC(链路状态变化)，mailbox等，但是DPDK使用PMD来收发包，不用处理收发包中断。将网卡绑定到igb_uio时会注册uio，生成/dev/uiox字符设备。DPDK初始化时会open/dev/uiox设备，对应到kernel端会申请中断号，并注册中断处理函数。D
[Suricata]基于DPDK抓包 LzSkyline
项目需要用到Suricata的解包能力,但由于分光流量较大,软件自带的抓包方式并不能满足需求,于是发现了这个基于dpdk的Suricata.使用过程中遇到一些依赖和万兆网卡驱动的问题,已经解决并merge到master分支了,现在clone下来应该可以直接用安装DPDK#下载安装wgethttp://fast.dpdk.org/rel/dpdk-18.11.tar.xztarxfdpdk-18.1
dpdk20.11.9 编译arm版本以及在arm 应用中引用dpdk20.11.9 coolfishbone_joey arm开发
以往19版本的dpdk都是可以直接用make的方式进行编译,e.g,makeT=x86_64-native-linux-gccinstall为了和客户那边用的DPDK版本一致,这次要用dpdk20.11.9,并且要把之前跑在X86版本的服务器上的程序跑在ARM版本上.目前有两个问题:1.编译出arm版本的dpdk.2.把编译出来的dpdklib引用到arm版本的testArmApp中.------
抓包神技--DPDK qintian0225 学习业界资讯
DPDK，全称DataPlaneDevelopmentKit，是一个高性能的数据包处理工具集。估计有不少朋友使用过或者之前了解过，它通过绕过Linux内核协议栈，直接在用户空间进行数据包处理，大大提高了数据包处理的效率和吞吐量。DPDK主要解决了传统网络数据包处理中存在的问题。传统的数据包处理方式需要经过内核协议栈的处理，导致数据包处理速度慢、效率低下。而DPDK通过直接在用户空间进行数据包处理，
10道网络八股文，每道都很经典，让你在面试中逼格满满 linux大本营 linux 后台开发网络编程 tcp udp
10道网络八股文，每道都很经典，让你在面试中逼格满满|tcp与udp有区别？大量close专注后台服务器开发，包括C/C++，Linux，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK等学习地址：C/C++Linux服务器开发/后台架构师【零声教育】-学习视频教程-腾讯课堂
基于DPDK的Virtio-Crypto运算资源虚拟化 lingshengxiyou 服务器网络运维网络协议 linux
为什么要Virtio-Crypto?随着近年来互联网，特别是移动互联网的高速发展，用户对数据安全的要求也越来越高。越来越多的网络信息流都被做了加密处理，来防止诸如泄密，仿冒，和重播等类型的网络攻击。Google目前已实现全站HTTPS加密，并在其安全性报告中指出截止2018年7月，超过70%的Chrome数据都已实现加密。而密保工作如IPSec则需要大量的计算机资源来进行。一个最基本的AES块加密
DPDK扩展自己的库龙葵他
有时候我们想在DPDK里添加自己的库~假设我们要在lib文件夹下添加一个lib_test文件夹，并生成一个librte_test.a的库改配置文件在DPDK/config/common_base中增加lib_test的configconfig添加自己的文件在lib文件夹下，新建librte_test文件夹，在librte_test文件夹中新建librte_test.c、librte_test.h、
【DPDK 】dpdk测试发udp包道剑剑非道 udp 网络协议网络
send.c#include#include#include#include#include#defineENABLE_SEND1#defineENABLE_ARP1#defineNUM_MBUFS(4096-1)#defineBURST_SIZE32#ifENABLE_SENDstaticuint32_tgSrcIp;//staticuint32_tgDstIp;staticuint8_tgSr
VPP使用DPDK纳管主机网卡 Danileaf_Guo
正文共：888字24图，预估阅读时间：1分钟我们之前安装的VPP版本是20.09（安装一个VPP20.09），现在看官网版本已经更新到22.06.0了。我们先用命令yumupdatevpp-y看一下YUM仓库里面更新版本了没有。确认一下。确实，仓库里面最新版本还是20.09，那就还用这个版本吧。在DPDK官网，关于部署有相关文档，但是没有和VPP对应的20.09这个版本，所以我选择安装20.11这
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe