weixin_30411997

DPDK rte_malloc

参考文献：dpdk中的librte_malloc库

　　　　《深入浅出DPDK》　

一. librte_malloc 库　　

　　dpdk中的librte_malloc库提供了能够分配任意大小内存的API。

　　该库的目标是提供类似malloc的函数从hugepage中分配内存，以及帮助应用程序移植。通常情况下，这种类型的分配不应该在数据平面处理，因为其比基于内存池的分配更慢，并且在分配和释放时会使用锁。

1.1 Cookies

如果在配置文件中打开CONFIG_RTE_MALLOC_DEBUG，

分配的内存会包含覆盖保护区域，以识别缓冲区溢出问题。

1.2 对齐与NUMA Constraints

rte_malloc()函数包含一个align参数，用来要求内存区域对齐到该值的倍数（必须是2的倍数）。

在支持NUMA的系统中，调用rte_malloc()函数时，会在调用该函数的进程所在的socket上分配内存。

同时该库也提供了一组API，使用户可以直接在指定的NUMA socket上分配内存，

或者在另一个core所在的NUMA socket上分配内存。

1.3 用例

应用程序在初始化时使用类似malloc这样的函数时，可以使用该库。

要在运行时分配/释放内存数据，如果应用程序对速度有要求，

请用内存池库代替本库。

如果要使用一块需要知道物理地址的内存块，如硬件设备使用的内存块，

则应该使用memory zone。

1.4 数据结构

在malloc库的内部使用两种数据结构类型：

struct malloc_heap: 用来管理每个socket上的空闲空间

struct malloc_elem: 分配的基本元素，由库内部管理的空闲空间。

1.4.1 struct malloc_heap

该结构体用来管理每个socket上的空闲空间。

在库的内部，每个NUMA node上包含一个 heap结构体，

使我们可以根据线程运行所在的NUMA node，在对应的结点分配内存。

虽然不能保存一定会在指定的结点上分配内存，但比总在某个固定的的结点或随机结点分配要好。

heap的关键成员变量和成员函数描述如下：

mz_count: 保存本结点已经为heap内存分配的memory zone的数量。该值的唯一用途就是与numa_socket值组合为每个memory zone生成一个唯一的名字。

lock: 该变量用来做对heap访问的同步。考虑到heap中的空闲空间是由一个list管理的，所以我们需要一个锁来防止两个线程同时访问该list。

free_head: 该变量该malloc heap的free nodes list中的第一个元素。

注意: malloc_heap结构体不会管理已经分配的memzones，这么做是毫无意义的，因为它们不会被释放。

也不会管理使用中的内存块，因为除非它们被释放，否则是不会再次接触到这些内存块的。

在释放时，指向这些内存块的指针会作为free()函数的参数。

1.4.1.2 struct malloc_elem结构体

malloc_elem结构体被用作memzone中各种内存块的头部结构。

有三种不同的用法：

1、分配或释放内存块时的头部 - 普通情况

2、在内存块中作为padding头部

3、作为memzone结尾处的标记

下文描述了结构中最重要的部分以及用法。

注意：如果某种用法不属于上面描述的三种中的任何一种，则认为对应的变量是未定义的。

例如，只有当"state"和"pad"两个变量的值是有效值是，才认为其是一个padding header。

head：该指针是已经分配的内存块中指向heap结构的反向引用，即指向对应的heap。

普通内存块在释放时会使用该指针，将当前释放的内存块添加到heap的free list中

prev：该指针指向memzone中当前内存块紧前面的内存块的header element/block。

当释放一个内存块时，该指针用来引用前一个内存块，看其是否也需要释放。

如果需要，则两块内存组合成一块更大的内存块。

next_free：该指针用来将未分配的内存块链接到一起。

同样，该变量只在普通内存块中使用，在malloc()函数中找到一块符合需求的内存块来分配，

并且在调用free()函数将新释放的内存添加到free-list中。

state：该变量可以是以下三个值之一：“Free”， “Busy”或“Pad”。

前两个用业表示普通内存块的分配状态，

第三个用来表示在start-of-block padding的结尾处的元素结构体是一个dummy结构体。

（例如，由于强制对齐，内存块中数据的开始处不在内存块中。？？？）

在这种情况下，pad header用来定位实际分配的元素header。

对于end-of-memzone结构体，该值总是“busy”，

以确保在释放时没有元素为了整合成一个更大的内存块，而在memzone的结尾外面查找其它内存块。

pad：该变量保存内存块开始处的padding区域的长度。

如果是普通内存块header，该值会被加到header的结尾处的地址，以给出数据区域的正确地址。

例如，在调用malloc函数时传回的值。

在padding中的dummy header的内部，该值也会被保存，

and is subtracted from the address of the dummy header to yield the address of the actual block header.

size：表示数据内存块的大小，包含header自身。对于end-of-memzone结构，该值为0，虽然从不会检查该值。

对于被释放的普通内存块，该值用来代替“next”指针，用来计算下一个内存块所在的地址。

（因此如果下一个内存块也是free的，两个内存块可以整合成一个）。

1.4.2 内存分配

应用程序调用类似malloc的函数时，malloc函数首先会根据调用线程索引lcore_config结构，

以及根据该线程确定其所在的NUMA结点。

即用来索引malloc_head结构数组，之后以该数组为参数调用heap_alloc()函数，

同时作为参数的还有要分配的大小，类型和对齐。

heap_alloc()函数会扫描heap的free_list，并尝试找到一个合适大小的内存块来存储数据，同时强制对齐。

如果没有找到合适大小的内存块，例如，第一次在某结点上调用malloc函数时free-list是空的，

则会创建一个新的memzone并配置为heap元素，其会将一个dummy结构放置到memzone的结尾处，

作为一个标记，防止访问超出这块内存之外（由于该标记被置为“BUSY”，malloc库永远无法将这块内存分配出去）。

同时在memzone的开始处放置一个合适的element header。这个header标记了memzone中的所有空间，

bar the sentinel value at the end，end, as a single free heap element, and it is then added to the free_list for the heap.

新的memzone配置好之后，会重新对heap的free-list进行描述，这次描述会找到新添加的合适大小的元素，

将其作为memzone中保留内存的大小，至少是调用函数中指定的大小的数据内存块加上对齐，

至少是Intel DPDK运行时配置中指定的最小大小。

找到一个合适大小的空闲元素之后，会计算返回到用户的指针，包含提供给用户的空闲内存块结尾处的空间。

紧跟着这块内存的cache-line被填充一个struct malloc_elem头：

如果内存块中余下的空间比较小，如<=128字节，就会使用一个pad header，余下的空间就浪费了。

不过，如果余下的空间大于128字节，则这块空闲内存块就被分成两份，

一个新的，合适的malloc_elem头被放到返回的数据空间之前。

从已经存在的元素的结尾分配内存的好处是，在这种情况下，不需要调整free list——

free list中已经存在的元素已经调整过尺寸指针了，后面element的“prev”指针已经重新指向这个新创建的element了。

1.4.3 释放内存

要释放内存，需要将指向数据区域起始地址的指针传递给free函数。

函数会从指针中减去malloc_elem结构的大小以获取内存块的element header。

如果header的类型是“PAD”，则再从指针中减去pad的长度。

从该element指针中，可以获取到指向堆的来源和需要释放到哪里的指针，

以及指向前一个元素的，并且通过size变量，可以计算下一个元素的指针。

之后也会检查后面的和前面的元素，看其是否也需要被释放。

这意味着永远不会发生两个空闲内存块相邻的情况，这样的内存块总是会被整合成一个更大的内存块。

二. 源码分析

DPDK以两种方式对外提供内存管理方法，一个是rte_mempool，主要用于网卡数据包的收发；一个是rte_malloc，主要为应用程序提供内存使用接口。这里我们主要讲一下rte_malloc函数。

rte_malloc实现的大体流程如下图所示。

下面我们逐个函数分析。

1      /*
2      * Allocate memory on default heap.
3      */
4     void *
5     rte_malloc(const char *type, size_t size, unsigned align)
6     {
7              return rte_malloc_socket(type, size, align, SOCKET_ID_ANY);
8     }

这个函数没什么可说的，直接调用rte_malloc_socket，但注意传入的socketid参数为SOCKET_ID_ANY。

rte_malloc_socket

从这个函数的入口检查可以看出，如果传入的分配内存大小size为0或对其align不是2次方的倍数就返回NULL。

 1      void *
 2     rte_malloc_socket(const char *type, size_t size, unsigned align, int socket_arg)
 3     {
 4              struct rte_mem_config *mcfg = rte_eal_get_configuration()->mem_config;
 5              int socket, i;
 6              void *ret;
 7      
 8              /* return NULL if size is 0 or alignment is not power-of-2 */
 9              if (size == 0 || (align && !rte_is_power_of_2(align)))
10                        return NULL;
11      
12              if (!rte_eal_has_hugepages())
13                        socket_arg = SOCKET_ID_ANY;
14         /*如果传入的socket参数为SOCKET_ID_ANY ，则会先尝试在当前socket上分配内存*/
15              if (socket_arg == SOCKET_ID_ANY)
16                        socket = malloc_get_numa_socket(); /*获取当前socket_id*/
17              else
18                        socket = socket_arg;
19      
20              /* Check socket parameter */
21              if (socket >= RTE_MAX_NUMA_NODES)
22                        return NULL;
23         /*尝试在当前socket上分配内存，如果分配成功则返回*/
24              ret = malloc_heap_alloc(&mcfg->malloc_heaps[socket], type,
25                                          size, 0, align == 0 ? 1 : align, 0);
26              if (ret != NULL || socket_arg != SOCKET_ID_ANY)
27                        return ret;
28         /*尝试在其他socket上分配内存，直到分配成功或者所有socket都尝试失败*/
29              /* try other heaps */
30              for (i = 0; i < RTE_MAX_NUMA_NODES; i++) {
31                        /* we already tried this one */
32                        if (i == socket)
33                                 continue;
34      
35                        ret = malloc_heap_alloc(&mcfg->malloc_heaps[i], type,
36                                                    size, 0, align == 0 ? 1 : align, 0);
37                        if (ret != NULL)
38                                 return ret;
39              }
40      
41              return NULL;
42     }

malloc_heap_alloc

这个函数用来模拟从heap中(也就是struct malloc_heap)分配内存，其调用逻辑图如下：

 1      void *
 2     malloc_heap_alloc(struct malloc_heap *heap,
 3                        const char *type __attribute__((unused)), size_t size, unsigned flags,
 4                        size_t align, size_t bound)
 5     {
 6              struct malloc_elem *elem;
 7         /*将size调整为cache line对齐*/
 8              size = RTE_CACHE_LINE_ROUNDUP(size);
 9              align = RTE_CACHE_LINE_ROUNDUP(align);
10      
11              rte_spinlock_lock(&heap->lock);
12         /*找到合适的malloc_elem结构*/
13              elem = find_suitable_element(heap, size, flags, align, bound);
14              if (elem != NULL) {
15                        elem = malloc_elem_alloc(elem, size, align, bound);
16                        /* increase heap's count of allocated elements */
17                        heap->alloc_count++; /*计数加一*/
18              }
19              rte_spinlock_unlock(&heap->lock);
20      
21              return elem == NULL ? NULL : (void *)(&elem[1]);
22     }

注意最后的返回值，返回的是elem[1]的地址，而不是elem的地址。elem[1]是什么呢？其实就是elem+1。说的直观点，rte_malloc其实就是分配了一个内存块，也可以说是分配了一个malloc_elem，这个malloc_elem作为这个内存块的一部分(存放在开头)，相当于这个内存块的描述符，真正可以使用的内存是malloc_elem之后的内存区域。

　　如下图所示。

在补一张内存初始化中讲到的数据结构关系图。

下面看下find_suitable_element函数是如何找到合适的malloc_elem的。

l find_suitable_element

 1      static struct malloc_elem *
 2     find_suitable_element(struct malloc_heap *heap, size_t size,
 3                        unsigned flags, size_t align, size_t bound)
 4     {
 5              size_t idx;
 6              struct malloc_elem *elem, *alt_elem = NULL;
 7         /*根据申请内存的大小，在struct malloc_heap->free_head数组中找到合适的idx*/
 8              for (idx = malloc_elem_free_list_index(size);
 9                                 idx < RTE_HEAP_NUM_FREELISTS; idx++) {
10                        /*在heap->free_head[idx]链表中找到合适的malloc_elem*/
11                        for (elem = LIST_FIRST(&heap->free_head[idx]);
12                                          !!elem; elem = LIST_NEXT(elem, free_list)) {
13                                 if (malloc_elem_can_hold(elem, size, align, bound)) {
14                                          if (check_hugepage_sz(flags, elem->ms->hugepage_sz))
15                                                    return elem;
16                                          if (alt_elem == NULL)
17                                                    alt_elem = elem;
18                                 }
19                        }
20              }
21      
22              if ((alt_elem != NULL) && (flags & RTE_MEMZONE_SIZE_HINT_ONLY))
23                        return alt_elem;
24      
25              return NULL;
26     }

我们知道malloc_elem的组织结构是个二维的链表，如下图所示。所以第一步要找到合适的一维链表。也就是在struct malloc_heap->free_head数组中找到合适的idx。

我们在前面介绍过，struct malloc_heap->free_head数组的下标和数组中malloc_elem的大小有类似如下对应关系。所以malloc_elem_free_list_index就是返回能够满足申请大小size的最小的idx。

heap->free_head[0] - (0 , 2^8]

heap->free_head[1] - (2^8 , 2^10]

heap->free_head[2] - (2^10 ,2^12]

heap->free_head[3] - (2^12, 2^14]

heap->free_head[4] - (2^14, MAX_SIZE]

之后尝试heap->free_head[idx]上的malloc_elem分配内存，如果分配失败，再尝试更大一点的(idx++)。

下面malloc_elem_can_hold负责在heap->free_head[idx]找到一个合适的malloc_elem。而其内部只是调用了elem_start_pt。

l elem_start_pt

 1      static void *
 2     elem_start_pt(struct malloc_elem *elem, size_t size, unsigned align,
 3                        size_t bound)
 4     {
 5              const size_t bmask = ~(bound - 1);
 6              /*在debug模式下MALLOC_ELEM_TRAILER_LEN为cacheline大小，正常为0*/
 7              uintptr_t end_pt = (uintptr_t)elem +
 8                                 elem->size - MALLOC_ELEM_TRAILER_LEN;
 9              uintptr_t new_data_start = RTE_ALIGN_FLOOR((end_pt - size), align);
10              uintptr_t new_elem_start;
11      
12              /* check boundary */
13              if ((new_data_start & bmask) != ((end_pt - 1) & bmask)) {
14                        end_pt = RTE_ALIGN_FLOOR(end_pt, bound);
15                        new_data_start = RTE_ALIGN_FLOOR((end_pt - size), align);
16                        if (((end_pt - 1) & bmask) != (new_data_start & bmask))
17                                 return NULL;
18              }
19      
20              new_elem_start = new_data_start - MALLOC_ELEM_HEADER_LEN;
21      
22              /* if the new start point is before the exist start, it won't fit */
23              return (new_elem_start < (uintptr_t)elem) ? NULL : (void *)new_elem_start;
24     }

代码中的几个指针如下如所示，其本质就是在当前malloc_elem中尝试按照size分配一个新的malloc_elem，看下其起始地址是否越界。如果不越界就将当前malloc_elem返回（不是新的malloc_elem，这时还没有真的分配新malloc_elem）。

找到合适的malloc_elem后，就调用malloc_elem_alloc从此malloc_elem分配新的满足size大小的malloc_elem。

l malloc_elem_alloc

 1      struct malloc_elem *
 2     malloc_elem_alloc(struct malloc_elem *elem, size_t size, unsigned align,
 3                        size_t bound)
 4     {
 5              struct malloc_elem *new_elem = elem_start_pt(elem, size, align, bound);
 6              const size_t old_elem_size = (uintptr_t)new_elem - (uintptr_t)elem;
 7              /*trailer_size就是align-MALLOC_ELEM_TRAILER_LEN的大小，而MALLOC_ELEM_TRAILER_LEN在debug下为cacheline，否则为0*/
 8              const size_t trailer_size = elem->size - old_elem_size - size -
 9                        MALLOC_ELEM_OVERHEAD;
10         /*将老的elem从链表中删除*/
11              elem_free_list_remove(elem);
12      
13              if (trailer_size > MALLOC_ELEM_OVERHEAD + MIN_DATA_SIZE) {
14                        /* split it, too much free space after elem */
15                        struct malloc_elem *new_free_elem =
16                                          RTE_PTR_ADD(new_elem, size + MALLOC_ELEM_OVERHEAD);
17      
18                        split_elem(elem, new_free_elem);
19                        malloc_elem_free_list_insert(new_free_elem);
20              }
21      
22         /*如果old_elem_size太小，就将老的elem状态设置为ELEM_BUSY*/
23              if (old_elem_size < MALLOC_ELEM_OVERHEAD + MIN_DATA_SIZE) {
24                        /* don't split it, pad the element instead */
25                        elem->state = ELEM_BUSY;
26                        elem->pad = old_elem_size;
27      
28                        /* put a dummy header in padding, to point to real element header */
29                        if (elem->pad > 0){ /* pad will be at least 64-bytes, as everything
30                                             * is cache-line aligned */
31                                 new_elem->pad = elem->pad;
32                                 new_elem->state = ELEM_PAD;
33                                 new_elem->size = elem->size - elem->pad;/*elem->size -old_elem_size*/
34                                 set_header(new_elem);
35                        }
36      
37                        return new_elem;
38              }
39      
40              /* we are going to split the element in two. The original element
41               * remains free, and the new element is the one allocated.
42               * Re-insert original element, in case its new size makes it
43               * belong on a different list.
44               */
45              /*如果old_elem_size足够大则将原有的elem分隔成两个elem，分别设置elem，new_elem的size*/
46              split_elem(elem, new_elem);
47              new_elem->state = ELEM_BUSY;/*设置new_elem的状态*/
48              malloc_elem_free_list_insert(elem);/*根据原有的elem调整后的size再找到合适的idx，将其插入heap->free_head[idx]*/
49      
50              return new_elem;
51     }

elem分裂前后对比如下图所示：

分裂前

转载于:https://www.cnblogs.com/mysky007/p/11198185.html

你可能感兴趣的:(DPDK rte_malloc)

centos使用dpdk库大隐隐于野 #高性能编程 centos linux 运维
yum-yinstalldpdkdpdk-devel在C++中使用DPDK（DataPlaneDevelopmentKit）库通常涉及到以下几个步骤：安装DPDK、配置编译环境、编写C++代码并链接DPDK库。以下是如何在C++中引用和使用DPDK的详细步骤。1.安装DPDK首先，你需要在系统上安装DPDK。可以通过以下方式进行安装：从源代码编译：下载DPDK源代码：gitclonehttps:/
shell 笔记_s1=abc,s2=def,[-z‘‘‘]&；&；echo‘$s1‘ echo‘$s2‘的输出是什么 2024云技术运维 linux 面试
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Linux平台上DPDK入门指南（一） lingshengxiyou 网络 linux 服务器网络协议云计算
1.简介本文档包含DPDK软件安装和配置的相关说明。旨在帮助用户快速启动和运行软件。文档主要描述了在Linux环境下编译和运行DPDK应用程序。1.1.文档地图以下是一份建议顺序阅读的DPDK参考文档列表：发布说明:提供特性发行版本的信息，包括支持的功能，限制，修复的问题，已知的问题等等。此外，还以FAQ方式提供了常见问题及解答。入门指南（本文档）：介绍如何安装和配置DPDK，旨在帮助用户快速上手
DPDK基础入门（七）：网卡性能优化指针从不空 Linux高性能网络性能优化网络
DPDK的轮询模式运行在操作系统内核态的网卡驱动程序基本都是基于异步中断处理模式，而DPDK采用了轮询或者轮询混杂中断的模式来进行收包和发包。任何包进入到网卡，网卡硬件会进行必要的检查、计算、解析和过滤等，最终包会进入物理端口的某一个队列。物理端口上的每一个收包队列，都会有一个对应的由收包描述符组成的软件队列来进行硬件和软件的交互，以达到收包的目的。轮询模式DPDK的轮询驱动程序负责初始化好每一个
如何在DPDK中实现协议解析？编码小哥 dpdk 架构
在DPDK中实现协议解析涉及几个步骤，包括初始化环境、配置网卡、接收数据包、解析数据包并处理数据包。下面将详细介绍这些步骤以及如何在DPDK中实现基本的协议解析。初始化DPDK环境首先，你需要初始化DPDK环境，加载EAL(EthernetAddressLearning)库，并设置好内存池、环形缓冲区等。#include#include#includeintmain(intargc,char**a
OVS主线流程之ovs-vswitchd主体结构分析大空新一网络 OVS
OVS是openvirtualswitch的简称，是现在广泛使用的软件实现的虚拟网络交换机。各大云厂商普遍使用OVS来实现自身的虚拟网络，各厂商会根据自身需要加以修改使之符合自身需求，DPU中也使用OVS来实现流表的offload。OVS中的流表基于多级结构，与用户强相关的是opwnflow，下发的流表称为emcflow。OVS一般存在两种运行模式，内核模式和DPDK模式。内核模式下存在一个dat
DPDK22.11环境搭建羽思 DPDK 网络驱动开发
1.工具下载1.ubuntu安装工具：sudoapt-getinstallmesonsudoapt-getinstallninjasudoapt-getinstallpython3-pyelftools2.centosyuminstall-ypython3-pipnumactl-devellibibverbs-utilslibpcap-devel//安装libpcap依赖包wgethttp://m
Linux进程间通信方式之管道(pipe)_ 前端老侯运维 linux 面试
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Docker容器如何与主机同网段其它主机互通？ lingshengxiyou linux DPDK c++docker 容器 linux 服务器后台开发
一、前言1、使用场景对开发者而言，随着容器的普遍使用，开发者可以很方便的搭建项目的简易测试环境。有时候为了项目可以在任意机器一键运行，不用配置连接IP等信息。所以希望可以提前固定容器的IP地址，而且一个项目有时候涉及多个容器，可能还会部署在多台机器上。所以如果容器间可以固定IP跨机器通信的话，会有很大方便。（免费订阅,永久学习）学习地址:Dpdk/网络协议栈/vpp/OvS/DDos/NFV/虚拟
DPDK mlx5 驱动使用报错 choumin 小问题 DPDK DPDK mlx5
还是记录一个小点，希望对大家有所帮助。背景：最近需要用DPDK测试Mellanox的ConnectX-4Lx网卡。在DPDK中，该网卡对应的驱动是mlx5。使用的DPDK版本是20.11和22.03，结果都出现了类似的报错信息。问题：在testpmd中启动上述网卡出现报错情况，testpmd的命令如下：$./build/app/dpdk-testpmd-l0-3-a0000:06:00.0-a00
DPDK源码分析之DPDK技术简介 lingshengxiyou c++linux DPDK 服务器 linux c++dpdk 虚拟机
Cache和内存技术1.Cache一致性多核处理器同时访问同一段cacheline时，会出现写回冲突的情况，操作系统解决这个问题会消耗一部分性能，DPDK采用了两个技术来解决这个问题：对于共享的数据，每个核都定义自己的备份lcore[RTE_MAX_LCORE]，这样多核处理事务时只处理自己的部分，lcore[idx]利用单网卡有着多队列的能力，当多核处理同一个网卡的数据包时，进行分队列处理，例如
Linux：dperf---100Gbps开源压力测试工具技术探索者工具使用 linux 知识测试工具 dperf
简介dperf是一个基于DPDK开发，具有千万级HTTPCPS，几十亿并发，几百Gbps带宽的开源压力测试仪，dperf实现了一个精简的用户态TCP/IP协议栈、精简的Socket、精简的HTTP客户端与服务器，可以curl/ab/nginx进行对接。dperf是一款开源的高性能网络压测软件，可用于测试四层负载均衡等网关设备的的各项性能指标（新建、带宽、并发、PPS）。总之，dperf是一个100
高性能异步io机制：io_uring linux大本营 c++linux epoll io_uring 异步io
io_uring是linux内核5.10引入的异步io接口。相比起用户态的DPDK、SPDK，io_uring作为内核的一部分，通过mmap的方式实现用户和内核共享内存，并基于memorybarrier在这块内存上实现了两个无锁环形队列：submissionqueuering(sq)和completionqueuering(cq)。sq用于用户程序向内核提交IO任务，内核执行完成的任务会放入cq，
OSDI 2023: Userspace Bypass Accelerating Syscall-intensive Applications 结构化文摘操作系统用户态内核硬件兼容分层架构存储结构
我们使用以下6个分类标准对本文的研究选题进行分析：1.方法：**系统调用消除：**专注于完全消除I/O路径中的系统调用（例如DPDK、UserspaceBypass）。**系统调用优化：**在不完全消除的情况下，旨在降低系统调用的成本（例如io_uring、F-Stack）。**替代执行模型：**探索使用用户空间或微内核等不同执行环境来绕过系统调用（例如QEMU、Unikernels）。2.应用重
DPDK初始化 phone1126 linux
rte_eal_init│├──rte_cpu_is_supported：检查cpu是否支持│├──rte_atomic32_test_and_set：操作静态局部变量run_once确保函数只执行一次│├──pthread_self()获取主线程的线程ID,只是用于打印│├──eal_reset_internal_config：初始化内部全局配置变量structinternal_config│├
DPDK大页内存 ordersyhack 引导指南解决方案系统搭建 linux 运维服务器
2Mlscpu|greppse1Glscpu|greppse1gbgrep-iHUGETLB/boot/config-$(uname-r)cat/proc/meminfo|grep-ihugepagesdefault_hugepagesz--表示默认的大页内存大小。hugepagesz--一个大页内存大小。hugepages--大页内存总的页数。vi/etc/default/grub#defaul
DPDK系列之四十一数据收发整体流程源码分析之一整体流程 fpcc 网络开发 DPDK
一、说明在前面的分析中基本介绍了DPDK中的各种模块的技术架构，从这篇开始，就从头开始对整个代码的流程进行分析，然后在此基础上，初步掌握了DPDK的代码架构和功能分析后，再对基于DPDK的上层应用进行分析。这是一个从分到合，从基础到应用的过程。在这个过程中需要不断的回顾和补充原来的知识。二、数据包流程在前面详细分析过数据包的转运流程，其实做一种IO接口，一定是分成两部分，即数据的接收和发送。从宏观
【dpdk】NVIDIA Poll Mode Driver (PMD) in DPDK Henry Patch #DPDK 后端
DataPlaneDevelopmentKit(DPDK)AchievefastpacketprocessingandlowlatencywithNVIDIAPollModeDriver(PMD)inDPDK.DPDKisasetoflibrariesandoptimizednetworkinterfacecard(NIC)driversforfastpacketprocessinginauser
【dpdk】NVIDIA MLX5 Common Driver Henry Patch #DPDK 后端
From3.NVIDIAMLX5CompressDriver—DataPlaneDevelopmentKit23.11.0documentation(dpdk.org)5.NVIDIAMLX5CommonDriverNoteNVIDIAacquiredMellanoxTechnologiesin2020.TheDPDKdocumentationandcodemightstillincludeins
【dpdk】qat-getting-started-guide-with-dpdk-v2.0 Henry Patch #DPDK #SPDK 后端
文章目录参考文档1.QATdriverinstallation1.1.Installationusingkernel.orgdriver1.2.**Bind**ingtheavailableVFstothevfio-pcidriver1.2.1.ForanIntel(R)QuickAssistTechnologyDH895xCCdevice1.2.2.ForanIntel(R)QuickAssis
【星海草稿】DPDK 后期会继续更新活跃的煤矿打工人 chrome 前端
官网：https://www.dpdk.org/https://launchpad.net/kollaPCI设备[查看和列出PCI设备。]lspci[网卡驱动程序设置特定的参数]modprobexxxx[查看是否正常运行]ifconfig内存设备64位Linux通常使用48位来表示虚拟地址空间，43位表示物理地址。#uname-m，然后按回车。如果输出是x86_64，那么你的系统就是64位的。如果
网络协议笔记 - L2TP协议 sz66cm Linux数据处理网络协议网络服务器
网络协议笔记-L2TP协议背景协议格式协议字段解析总结背景基于dpdk,实现了一套L2TP协议接入接口;协议格式协议字段解析T:0代表数据报文,1代表控制报文;L:1代表存在Length字段,0代表不存在Length字段;S:1代表Ns与Nr字段存在(控制报文S必须为1);O:1代表OffsetSize字段存在,(可控制报文O必须为0);P:1表示需要优待的报文,控制报文P必须为0;总结协议的学习
DPDK 中断处理流程分享放大价值
本文整理下之前的学习笔记，基于DPDK17.11版本源码分析。主要分析一下中断处理流程。网卡支持的中断有多种类型，比如收发包，LSC(链路状态变化)，mailbox等，但是DPDK使用PMD来收发包，不用处理收发包中断。将网卡绑定到igb_uio时会注册uio，生成/dev/uiox字符设备。DPDK初始化时会open/dev/uiox设备，对应到kernel端会申请中断号，并注册中断处理函数。D
[Suricata]基于DPDK抓包 LzSkyline
项目需要用到Suricata的解包能力,但由于分光流量较大,软件自带的抓包方式并不能满足需求,于是发现了这个基于dpdk的Suricata.使用过程中遇到一些依赖和万兆网卡驱动的问题,已经解决并merge到master分支了,现在clone下来应该可以直接用安装DPDK#下载安装wgethttp://fast.dpdk.org/rel/dpdk-18.11.tar.xztarxfdpdk-18.1
dpdk20.11.9 编译arm版本以及在arm 应用中引用dpdk20.11.9 coolfishbone_joey arm开发
以往19版本的dpdk都是可以直接用make的方式进行编译,e.g,makeT=x86_64-native-linux-gccinstall为了和客户那边用的DPDK版本一致,这次要用dpdk20.11.9,并且要把之前跑在X86版本的服务器上的程序跑在ARM版本上.目前有两个问题:1.编译出arm版本的dpdk.2.把编译出来的dpdklib引用到arm版本的testArmApp中.------
抓包神技--DPDK qintian0225 学习业界资讯
DPDK，全称DataPlaneDevelopmentKit，是一个高性能的数据包处理工具集。估计有不少朋友使用过或者之前了解过，它通过绕过Linux内核协议栈，直接在用户空间进行数据包处理，大大提高了数据包处理的效率和吞吐量。DPDK主要解决了传统网络数据包处理中存在的问题。传统的数据包处理方式需要经过内核协议栈的处理，导致数据包处理速度慢、效率低下。而DPDK通过直接在用户空间进行数据包处理，
10道网络八股文，每道都很经典，让你在面试中逼格满满 linux大本营 linux 后台开发网络编程 tcp udp
10道网络八股文，每道都很经典，让你在面试中逼格满满|tcp与udp有区别？大量close专注后台服务器开发，包括C/C++，Linux，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK等学习地址：C/C++Linux服务器开发/后台架构师【零声教育】-学习视频教程-腾讯课堂
基于DPDK的Virtio-Crypto运算资源虚拟化 lingshengxiyou 服务器网络运维网络协议 linux
为什么要Virtio-Crypto?随着近年来互联网，特别是移动互联网的高速发展，用户对数据安全的要求也越来越高。越来越多的网络信息流都被做了加密处理，来防止诸如泄密，仿冒，和重播等类型的网络攻击。Google目前已实现全站HTTPS加密，并在其安全性报告中指出截止2018年7月，超过70%的Chrome数据都已实现加密。而密保工作如IPSec则需要大量的计算机资源来进行。一个最基本的AES块加密
DPDK扩展自己的库龙葵他
有时候我们想在DPDK里添加自己的库~假设我们要在lib文件夹下添加一个lib_test文件夹，并生成一个librte_test.a的库改配置文件在DPDK/config/common_base中增加lib_test的configconfig添加自己的文件在lib文件夹下，新建librte_test文件夹，在librte_test文件夹中新建librte_test.c、librte_test.h、
【DPDK 】dpdk测试发udp包道剑剑非道 udp 网络协议网络
send.c#include#include#include#include#include#defineENABLE_SEND1#defineENABLE_ARP1#defineNUM_MBUFS(4096-1)#defineBURST_SIZE32#ifENABLE_SENDstaticuint32_tgSrcIp;//staticuint32_tgDstIp;staticuint8_tgSr
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr