高晓伟_Steven

深入浅出DPDK学习笔记（4）——— 并行计算

多核性能和可扩展性
- 追求性能水平扩展
- 多核处理器
- 亲和性
- - Linux内核对亲和性的支持
  - 为什么应该使用亲和性
  - 线程独占
- DPDK的多线程
- - EAL中的lcore
  - lcore的亲和性
  - 对用户pthread的支持
  - 有效地管理计算资源
指令并发与数据并行
- 指令并发
- 单指令多数据
- - SIMD简介
  - 实战DPDK

处理器性能提升主要有两个途径,一个是提高IPC(每个时钟周期内可以执行的指令条数),另一个是提高处理器主频率。每一代微架构的调整可以伴随着对IPC的提高,从而提高处理器性能,只是幅度有限。而提高处理器主频率对于性能的提升作用是明显而直接的。但一味地提高频率很快会触及频率墙,因为处理器的功耗正比于主频的三次方。
所以,最终要取得性能提升的进一步突破,还是要回到提高IPC这个因素。经过处理器厂商的不懈努力,我们发现可以通过提高指令执行的并行度来提高IPC。而提高并行度主要有两种方法,一种是提高微架构的指令并行度,另一种是采用多核并发。这一章主要就分享这两种方法在DPDK中的实践,并在指令并行方法中上进一步引入数据并发的介绍。

多核性能和可扩展性

追求性能水平扩展

多核处理器是指在一个处理器中集成两个或者多个完整的内核(及计算引擎)。
Amdahl定律告诉我们,假设一个任务的工作量不变,多核并行计算理论时延加速上限取决于那些不能并行处理部分的比例。换句话说,多核并行计算下时延不能随着核数增加而趋于无限小。该定律明确告诉我们,利用多核处理器提升固定工作量性能的关键在于降低那些不得不串行部分占整个任务执行的比例。更多信息可以参考[Ref3-1]。
对于DPDK的主要应用领域——数据包处理,多数场景并不是完成一个固定工作量的任务,更主要关注单位时间内的吞吐量。Gustafson定律对于在固定工作时间下的推导给予我们更多的指导意义。它指出,多核并行计算的吞吐率随核数增加而线性扩展,可并行处理部分占整个任务比重越高,则增长的斜率越大。带着这个观点来读DPDK,很多实现的初衷就豁然开朗。资源局部化、避免跨核共享、减少临界区碰撞、加快临界区完成速率(后两者涉及多核同步控制,将在下一章中介绍)等,都不同程度地降低了不可并行部分和并发干扰部分的占比。

多核处理器

通过单核结构(见图3-1),我们先认识一下CPU物理核中主要的基本组件。为简化理解,将主要组件简化为:CPU寄存器集合、中断逻辑(Local APIC)、执行单元和Cache。一个完整的物理核需要拥有这样的整套资源,提供一个指令执行线程。

多处理器结构指的是多颗单独封装的CPU通过外部总线连接,构成的统一计算平台,如图3-2所示。每个CPU都需要独立的电路支持,有自己的Cache,而它们之间的通信通过主板上的总线。在此架构上,若一个多线程的程序运行在不同CPU的某个核上,跨CPU的线程间协作都要走总线,而共享的数据还会付出因Cache一致性产生的开销。从内存子系统的角度,多处理器结构进一步衍生出了非一致内存访问(NUMA),这一点在第2章就有介绍。在DPDK中,对于多处理器的NUMA结构,使用Socket Node来标示,跨NUMA的内存访问是性能调优时最需要避免的。

如图3-3所示,超线程(Hyper-Threading)在一个处理器中提供两个逻辑执行线程,逻辑线程共享流水线、执行单元和缓存。该技术的本质是复用单处理器中的超标量流水线的多路执行单元,降低多路执行单元中因指令依赖造成的执行单元闲置。对于每个逻辑线程,拥有完整独立的寄存器集合和本地中断逻辑,从软件的角度,与单线程物理核并没有差异。例如,8核心的处理器使用超线程技术之后,可以得到16个逻辑线程。采用超线程,在单核上可以同时进行多线程处理,使整体性能得到一定程度提升。但由于其毕竟是共享执行单元的,对IPC(每周期执行指令数)越高的应用,带来的帮助越有限。DPDK是一种I/O集中的负载,对于这类负载,IPC相对不是特别高,所以超线程技术会有一定程度的帮助。更多信息可以参考[Ref3-2]。

如果说超线程还是站在一个核内部以资源切分的方式构成多个执行线程,多核体系结构(见图3-4)则是在一个CPU封装里放入了多个对等的物理核,每个物理核可以独立构成一个执行线程,当然也可以进一步分割成多个执行线程(采用超线程技术)。多核之间的通信使用芯片内部总线来完成,共享更低一级缓存(LLC,三级缓存)和内存。随着CPU制造工艺的提升,每个CPU封装中放入的物理核数也在不断提高。

各种架构在总线占用、Cache、寄存器以及执行单元的区别大致可以归纳为表3-1。

亲和性

简单地说,CPU亲和性(Core affinity)就是一个特定的任务要在某个给定的CPU上尽量长时间地运行而不被迁移到其他处理器上的倾向性。这意味着线程可以不在处理器之间频繁迁移。这种状态正是我们所希望的,因为线程迁移的频率小就意味着产生的负载小。
Linux内核包含了一种机制,它让开发人员可以编程实现CPU亲和性。这意味着应用程序可以显式地指定线程在哪个(或哪些)处理器上运行。

Linux内核对亲和性的支持

在Linux内核中,所有的线程都有一个相关的数据结构,称为task_struct。这个结构非常重要,原因有很多;其中与亲和性相关度最高的是cpus_allowed位掩码。这个位掩码由n位组成,与系统中的n个逻辑处理器一一对应。具有4个物理CPU的系统可以有4位。如果这些CPU都启用了超线程,那么这个系统就有一个8位的位掩码。
如果针对某个线程设置了指定的位,那么这个线程就可以在相关的CPU上运行。因此,如果一个线程可以在任何CPU上运行,并且能够根据需要在处理器之间进行迁移,那么位掩码就全是1。实际上,在Linux中,这就是线程的默认状态。
Linux内核API提供了一些方法,让用户可以修改位掩码或查看当前的位掩码:

sched_set_affinity()(用来修改位掩码)
sched_get_affinity()(用来查看当前的位掩码)

注意,cpu_affinity会被传递给子线程,因此应该适当地调用sched_set_affinity。

为什么应该使用亲和性

将线程与CPU绑定,最直观的好处就是提高了CPU Cache的命中率,从而减少内存访问损耗,提高程序的速度。
在多核体系CPU上,提高外设以及程序工作效率最直观的办法就是让各个物理核各自负责专门的事情。每个物理核各自也会有缓存,缓存着执行线程使用的信息,而线程可能会被内核调度到其他物理核上,这样L1/L2的Cache命中率会降低,当绑定物理核后,程序就会一直在指定核上跑,不会由操作系统调度到其他核上,省却了来回反复调度的性能消耗,线程之间互不干扰地完成工作。
在NUMA架构下,这个操作对系统运行速度的提升有更大的意义,跨NUMA节点的任务切换,将导致大量三级Cache的丢失。从这个角度来看,NUMA使用CPU绑定时,每个核心可以更专注地处理一件事情,资源体系被充分使用,减少了同步的损耗。

线程独占

DPDK通过把线程绑定到逻辑核的方法来避免跨核任务中的切换开销,但对于绑定运行的当前逻辑核,仍然可能会有线程切换的发生,若希望进一步减少其他任务对于某个特定任务的影响,在亲和的基础上更进一步,可以采取把逻辑核从内核调度系统剥离的方法。
Linux内核提供了启动参数isolcpus。对于有4个CPU的服务器,在启动的时候加入启动参数isolcpus=2,3。那么系统启动后将不使用CPU3和CPU4。注意,这里说的不使用不是绝对地不使用,系统启动后仍然可以通过taskset命令指定哪些程序在这些核心中运行。步骤如下所示。

vim    /boot/grub2.cfg

在Linux kernel启动参数里面加入isolcpus参数,isolcpu=2,3。

cat    /proc/cmdline

等待系统重新启动之后查看启动参数

BOOT_IMAGE=/vmlinuz-3.10.0-514.el7.x86_64 root=/dev/mapper/cl-root ro crashkernel=auto rd.lvm.lv=cl/root rd.lvm.lv=cl/swap rhgb quiet isolcpus=2,3

DPDK的多线程

DPDK的线程基于pthread接口创建,属于抢占式线程模型,受内核调度支配。DPDK通过在多核设备上创建多个线程,每个线程绑定到单独的核上,减少线程调度的开销,以提高性能。DPDK的线程可以作为控制线程,也可以作为数据线程。
在DPDK的一些示例中,控制线程一般绑定到MASTER核上,接受用户配置,并传递配置参数给数据线程等;数据线程分布在不同核上处理数据包。

EAL中的lcore

DPDK 的 lcore 指的是 EAL 线程 , 本质是基于pthread(Linux/FreeBSD)封装实现。Lcore(EAL pthread)由remote_launch函数指定的任务创建并管理。在每个EAL pthread中,有一个TLS(Thread Local Storage)称为_lcore_id。当使用DPDK的EAL‘-c’参数指定coremask时,EAL pthread生成相应个数lcore并默认是1:1亲和到coremask对应的CPU逻辑核,_lcore_id和CPU ID是一致的。
下面简单介绍DPDK中lcore的初始化及执行任务的注册。

初始化

rte_eal_cpu_init ( ) 函数中 , 通过读取/sys/devices/system/cpu/cpuX/下的相关信息,确定当前系统有哪些CPU核,以及每个核属于哪个CPU Socket。
eal_parse_args()函数,解析-c参数,确认哪些CPU核是可以使用的,以及设置第一个核为MASTER。
为每一个 SLAVE 核创建线程 , 并调用eal_thread_set_affinity ( ) 绑定 CPU 。线程的执行体是eal_thread_loop()。eal_thread_loop()的主体是一个while死循环,调用不同模块注册到lcore_config[lcore_id].f的回调函数。

RTE_LCORE_FOREACH_SLAVE(i) {
        /*
        * create communication pipes between master thread
        * and children
        */if (pipe(lcore_config[i].pipe_master2slave) < 0)
        rte_panic("Cannot create pipe\n");
        if (pipe(lcore_config[i].pipe_slave2master) < 0)
                rte_panic("Cannot create pipe\n");
        lcore_config[i].state = WAIT;
        /* create a thread for each lcore */
        ret = pthread_create(&lcore_config[i].thread_id, NULL,
        eal_thread_loop, NULL);
        if (ret != 0)
                rte_panic("Cannot create thread\n");
}

rte_eal_mp_remote_launch(l2fwd_launch_one_lcore, NULL, CALL_MASTER);

DPDK 每个核上的线程最终会调用 eal_thread_loop ( ) —>l2fwd_launch_on_lcore(),调用到自己实现的处理函数。
最后,总结整个lcore启动过程和执行任务分发,可以归纳为如图3-5所示。

lcore的亲和性

默认情况下,lcore是与逻辑核一一亲和绑定的。带来性能提升的同时,也牺牲了一定的灵活性和能效。在现网中,往往有流量潮汐现象的发生,在网络流量空闲时,没有必要使用与流量繁忙时相同的核数。按需分配和灵活的扩展伸缩能力,代表了一种很有说服力的能效需求。于是,EAL pthread和逻辑核之间进而允许打破1:1的绑定关系,使得_lcore_id本身和CPU ID可以不严格一致。EAL定义了长选项“–lcores”来指定lcore的CPU亲和性。对一个特定的lcore ID或者lcore ID组,这个长选项允许为EAL pthread设置CPU集。
格式如下:

--lcores= ’ <lcore_set>[@cpu_set][,<lcore_set>[@cpu_set],...] ’

其中,‘lcore_set’和‘cpu_set’可以是一个数字、范围或者一个组。数字值是 “digit ( [0-9]+ ) ”; 范围是 "-”;group是“([,,…])”。如果不指定‘@cpu_set’的值,那么默认就使用‘lcore_set’的值。这个选项与corelist的选项‘-l’是兼容的。

例如, "--lcores='1,2@(5-7),(3-5)@(0,2),(0,6),7-8'" 表示
start 9 EAL thread;
lcore 0 runs on cpuset 0x41 (cpu 0,6);
lcore 1 runs on cpuset 0x2 (cpu 1);
lcore 2 runs on cpuset 0xe0 (cpu 5,6,7);
lcore 3,4,5 runs on cpuset 0x5 (cpu 0,2);
lcore 6 runs on cpuset 0x41 (cpu 0,6);
lcore 7 runs on cpuset 0x80 (cpu 7);
lcore 8 runs on cpuset 0x100 (cpu 8).

这个选项以及对应的一组API(rte_thread_set/get_affinity())为lcore提供了亲和的灵活性。lcore可以亲和到一个CPU或者一个CPU集合,使得在运行时调整具体某个CPU承载lcore成为可能。
而另一个方面,多个lcore也可能亲和到同一个核。这里要注意的是,同一个核上多个可抢占式的任务调度涉及非抢占式的库时,会有一定限制。这里以非抢占式无锁rte_ring为例:

单生产者/单消费者模式,不受影响,可正常使用。
多生产者 / 多消费者模式且 pthread 调度策略都是SCHED_OTHER时,可以使用,性能会有所影响。
多生产者/多消费者模式且pthread调度策略有SCHED_FIFO或者SCHED_RR时,建议不使用,会产生死锁。

对用户pthread的支持

除了使用DPDK提供的逻辑核之外,用户也可以将DPDK的执行上下文运行在任何用户自己创建的pthread中。在普通用户自定义的pthread 中 , lcore id 的值总是 LCORE_ID_ANY , 以此确定这个thread 是一个有效的普通用户所创建的 pthread 。用户创建的pthread可以支持绝大多数DPDK库,没有任何影响。但少数DPDK库可能无法完全支持用户自创建的pthread,如timer和Mempool。以Mempool为例,在用户自创建的pthread中,将不会启用每个核的缓存队列(Mempool cache),这个会对最佳性能造成一定影响。更多影响可以参见开发者手册的多线程章节。

有效地管理计算资源

我们知道,如果网络吞吐很大,超过一个核的处理能力,可以加入更多的核来均衡流量提高整体计算能力。但是,如果网络吞吐比较小,不能耗尽哪怕是一个核的计算能力,如何能够释放计算资源给其他任务呢?通过前面的介绍,我们了解到了DPDK的线程其实就是普通的zthread。使用cgroup能把CPU的配额灵活地配置在不同的线程上。
cgroup是control group的缩写,是Linux内核提供的一种可以限制、记录、隔离进程组所使用的物理资源(如:CPU、内存、I/O等)的机制。DPDK可以借助cgroup实现计算资源配额对于线程的灵活配置,可以有效改善I/O核的闲置利用率。

指令并发与数据并行

指令并发

现代多核处理器几乎都采用了超标量的体系结构来提高指令的并发度,并进一步地允许对无依赖关系的指令乱序执行。这种用空间换时间的方法,极大提高了IPC,使得一个时钟周期完成多条指令成为可能。
图3-6中Haswell微架构流水线是Haswell微架构的流水线参考,从中可以看到Scheduler下挂了8个Port,这表示每个core每个时钟周期最多可以派发8条微指令操作。具体到指令的类型,比如Fast LEA,它可以同时在Port 1和Port 5上派发。换句话说,该指令具有被多发的能力。可以简单地理解为,该指令先后操作两个没有依赖关系的数据时,两条指令有可能被处理器同时派发到执行单元执行,由此该指令实际执行的吞吐率就提升了一倍。

单指令多数据

在进入到什么是“单指令多数据”之前,先简单认识一下它的意义。“单指令多数据”给了我们这样一种可能,即使某条指令本身不再能被并(多)发,我们依旧可以从数据位宽的维度上提升并行度,从而得到整体性能提升。

SIMD简介

SIMD是Single-Instruction Multiple-Data(单指令多数据)的缩写,从字面的意思就能理解大致的含义。多数据指以特定宽度为一个数据单元,多单元数据独立操作。而单指令指对于这样的多单元数据集,一个指令操作作用到每个数据单元。可以把SIMD理解为向量化的操作方式。典型 SIMD 操作如图 3-7 所示 , 两组各 4 个数据单元(X1,X2,X3,X4和Y1,Y2,Y3,Y4)并行操作,相同操作作用在相应的数据单元对上(X1和Y1,X2和Y2,X3和Y3,X4和Y4),4对计算结果组成最后的4数据单元数。

SIMD指令操作的寄存器相对于通用寄存器(general-purpose register,RPRS)更宽,128bit的XMM寄存器或者256bit的YMM寄存器,有2倍甚至4倍于通用寄存器的宽度(在64bit架构上)。所以,用SIMD指令的一个直接好处是最大化地利用一级缓存访存的带宽,以表3-3所示Haswell微架构中第一级Cache参数为例,每时钟周期峰值带宽为64B(load)(注:每周期支持两个load微指令,每个微指令获取最多32B数据)+32B(store)。可见,该微架构单时钟周期可以访存的最大数据宽度为32B即256bit,只有YMM寄存器宽度的单指令load或者store,可以用尽最大带宽。

对于I/O密集的负载,如DPDK,最大化地利用访存带宽,减少处理器流水线后端因I/O访问造成的CPU失速,会对性能提升有显著的效果。所以,DPDK在多个基础库中都有利用SIMD做向量化的优化操作。然而,也并不是所有场景都适合使用SIMD,由于数据位较宽,对繁复的窄位宽数据操作副作用比较明显,有时数据格式调整的开销可能更大,所以选择使用SIMD时要仔细评估好负载的特征。

实战DPDK

DPDK中的memcpy就利用到了SSE/AVX的特点。比较典型的就是rte_memcpy内存拷贝函数。内存拷贝是一个非常简单的操作,算法上并无难度,关键在于很好地利用处理器的各种并行特性。当前Intel的处理器(例如Haswell、Sandy Bridge等)一个指令周期内可以执行两条 Load 指令和一条 Store 指令 , 并且支持 SIMD 指令(SSE/AVX)来在一条指令中处理多个数据,其Cache的带宽也对SIMD指令进行了很好的支持。因此,在rte_memcpy中,我们使用了平台所支持的最大宽度的 Load 和 Store 指令 ( Sandy Bridge 为128bit,Haswell为256bit)。此外,由于非对齐的存取操作往往需要花费更多的时钟周期,rte_memcpy优先保证Store指令存储的地址对齐,利用处理器每个时钟周期可以执行两条Load这个超标量特性来弥补一部分非对齐Load所带来的性能损失。

dpdk内存管理分析 blue_罗林 dpdk 服务器
dpdk内存管理分析文章目录dpdk内存管理分析1.1简述1.2`rte_config_init`分析1.3`eal_hugepage_info_init`的分析1.4`rte_eal_memzone_init`的分析1.5`rte_eal_memory_init`的分析1.6rte_eal_malloc_heap_init的分析1.1简述dpdk使用了hugepage和numa感知进行构建内存管
Dpdk环境的搭建 Flying Fish（HHH） dpdk 分布式计算机网络
1、下载源码：gitclonehttps://github.com/DPDK/dpdk2、编译命令CC=gccmeson-Dlibdir=lib--default-library=static-Dexamples=allx86_64-native-linuxapp-gcc-Dbuildtype=debugoptimizedninja-Cx86_64-native-linuxapp-gcc-j110
DPDK技术原理与架构 Linux服务器开发 C++后台开发 C++开发 DPDK DPDK DPDK原理网络协议 VPP 虚拟化
本文参考“《中国电信DPDK技术白皮书v1.0》”，DPDK技术框架可以划分为DPDK基本技术与DPDK优化技术两部分，前者指标准的DPDK数据平面开发包和I/O转发实现技术，后者是在DPDK应用过程中，为进一步提高各类用户应用程序的转发性能。中国电信DPDK技术白皮书v1.0DPDK基础—认识DPDK技术DPDK架构高清版DPDK编程指南（中文版）技术原理与架构由于采用软件转发和软件交换技术，单
DPDK（mtcp）vs RDMA/ROCE weixin_34396103 网络
0.缠论：http://52investing.com/1.简书.DPDK：http://www.jianshu.com/p/dcb6ccc83ea52.mTCP和DPDK构造百万千万并发TCP连接3.基于SoftRoCE了解RDMA4.RoCE与RDMA技术:http://support.huawei.com/huaweiconnect/enterprise/thread-329081.html
DPDK之（七）—— support for vhost-user学习笔记何进哥哥 DPDK vhost DPDK
转地址：http://www.lai18.com/content/1851237.htmlX86体系早期没有在硬件设计上对虚拟化提供支持，因此虚拟化完全通过软件实现。一个典型的做法是通过优先级压缩（RingCompression)和二进制代码翻译（BinaryTranslation)相结合，VMM在特权级ring0,Guest操作系统在非特权级ring1,Guest应用程序在ring3。由于Gue
虚拟机编译安装 dpdk--运行helloworld 菠萝01 服务器运维
DPDK技术介绍一，版本信息DPDK版本：dpdk-22.07操作系统：Ubuntu22.04.1LTS二、虚拟机ubuntu添加网卡1.2.显卡由enssx改为ethxsudonano/etc/default/grub找到GRUB_CMDLINE_LINUX=""改为GRUB_CMDLINE_LINUX="
gcc constructor 属性修饰的构造函数未被链接问题 longyu_wlz dpdk constructor dpdk whole-archive
dpdkpmd驱动的初始化过程dpdk支持多个pmd驱动，pmd驱动的种类随着时间的推移还在不断的扩展。为了避免添加新驱动对现有框架代码的修改，dpdk对不同驱动的初始化过程进行了抽象，添加一个新的驱动只需要添加一个驱动注册的构造函数即可。dpdk-16.04中通过PMD_REGISTER_DRIVER宏来注册驱动，这个宏的实现如下：#definePMD_REGISTER_DRIVER(d)\vo
Linux系统时间同步与时区设置全攻略：适用于CentOS与Ubuntu的实用方法_centos 同步时间 m0面试大全程序员 linux centos ubuntu
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
【Linux高级全栈开发】2.1.3 http服务器的实现 Javis211 C++后端学习计划服务器 linux http
【Linux高级全栈开发】2.1.3http服务器的实现高性能网络学习目录基础内容（两周完成）：2.1网络编程2.1.1多路复用select/poll/epoll2.1.2事件驱动reactor2.1.3http服务器的实现2.2网络原理百万并发PosixAPIQUIC2.3协程库NtyCo的实现2.4dpdk用户态协议栈的实现2.5高性能异步io机制项目内容（两周完成）：9.1KV存储项目9.2
【Linux高级全栈开发】2.1高性能网络-网络编程——2.1.1 网络IO与IO多路复用——select/poll/epoll Javis211 C++后端学习计划 linux 网络运维
【Linux高级全栈开发】2.1高性能网络-网络编程高性能网络学习目录基础内容（两周完成）：2.1网络编程2.1.1多路复用select/poll/epoll2.1.2事件驱动reactor2.1.3http服务器的实现2.2网络原理百万并发PosixAPIQUIC2.3协程库NtyCo的实现2.4dpdk用户态协议栈的实现2.5高性能异步io机制项目内容（两周完成）：9.1KV存储项目9.2RP
数据接收全流程图（物理网卡 → 应用层）是这耀眼的瞬间网络
以下是DPDK+VPP在Linux系统中从网卡收包到应用层的完整数据流程图及分步解析，结合了内核旁路和用户态协议栈的协同工作：数据接收全流程图（物理网卡→应用层）plaintext复制下载+------------------------------------------------------------------------------------+|Linux系统|+----------
DPDK概述尘世中迷途小码农 DPDK 网络
DPDK是什么DPDK（DataPlaneDevelopmentKit），是一种用户空间数据平面开发工具包，它的主要目标是为开发人员提供一个创建高性能数据平面应用程序的平台。DPDK开发者能够用C语言、汇编与新型Intel架构的linux内核进行交互，使得数据平面应用程序在高度优化的环境中运行。背景随着芯片技术与高速网络接口技术的一日千里式发展，报文吞吐需要处理10Gbps端口处理能力，世面上大量
2024年运维最新【Linux】基础IO —— 缓冲区深度剖析_linux io 缓冲区大小(2)，2024年最新张口就来 JavaScript高级程序员运维 linux 服务器
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
2024年linux——环境基础开发工具使用_gcc test file(4)，2024年最新程序设计+Linux运维+Web+数据库+框架+分布式 2401_83740189 程序员运维 linux 前端
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
DPVS_dpvs: DPVS架构图介绍 DPVS是基于DPDK的高性能第4层负载均衡器 weixin_39878247 DPVS
DPVSIntroductionDPVSisahighperformanceLayer-4loadbalancerbasedonDPDK.It'sderivedfromLinuxLVSandit'smodificationalibaba/LVS.thenameDPVScomesfrom"DPDK-LVS".Differenttechniquesareappliedforhighperformanc
SR-IOV虚拟出来的网卡如何被VPP(DPDK)接管小湿哥 VPP Network vpp SR-IOV vt-d 虚拟化
目录引言SR-IOV简介网卡支持配置步骤1.修改BiosenableSR-IOV2.修改启动参数3.设置vf网卡mac地址，权限4.切换网卡驱动5.启动VPP小结引言在只有一张网卡的情况下，这个网卡不能既被VPP(DPDK)接管，同时被操作系统所使用。这个时候一般只能通过创建虚拟机，在虚拟机中运行VPP(DPDK)接管virtio的虚拟网卡。最近才发现了SR-IOV技术，可以在PCI层面虚拟网卡，
初识dpdk-原理、编译努力的CV战士 c语言 dpdk dpi
目录1.什么是dpdk2.dpdk的优势2.1.传统协议栈交互模型2.2.dpdk交互模型3.dpdk基本原理4.编译dpdk4.1.源码4.2.环境准备4.3.编译4.4.打包生成动态库5.dpdk性能优化5.1.轮询驱动5.2.大页内存5.3.CPU核亲缘性和独占5.4.cache对齐5.5.NUMA5.6.内存池管理1.什么是dpdkDPDK（DataPlaneDevelopmentKit）
编译dpdk19.08.2中example时一系列报错解决 monGyrate linux服务器相关 dpdk C语言 DPDK 数据平面开发套件 ubuntu
dpdk19.08编译过程全解dpdk介绍问题描述编译过程执行Step1报错一解决方式报错二解决方式继续执行Step248的时候报错49没有修改成功输入60退出使用过程执行make报错一解决方式继续make报错二解决方式继续make执行生成文件helloworld报错三解决方式执行make完成参考链接dpdk介绍数据平面开发套件(DPDK[1],DataPlaneDevelopmentKit)
LINUX 平台最快子网路由转发，内核使能选项配置 liulilittle IP Extension linux 运维服务器
阅读本文之间，可线性参考以下文献。Linux命令行配置为单臂旁路由。_linux单臂路由-CSDN博客Linux软路由命令行配置（参考）_linux软路由-CSDN博客VGW在Windows平台上局域网就绪的旁路由器程序_windows旁路由-CSDN博客本文介绍LINUX通用平台最快子网路由转发方案，不需要任何第三方程式，不需要三方限制硬件采用的DPDK平台做出来的转发，单纯采用内核直接转发。配
Linux系统下DPDK源码编译，testpmd的使用以及编译过程中遇到的问题，以及高版本DPDK meson+ninja编译步骤温柔如酒 DPDK linux 运维网络
一.dpdk-20.081.首先，下载以及编译依赖库安装：ubuntu：apt-getinstalllibnuma-devcentos:yuminstalllibnuma-devel以及yuminstallnumactl-devel官网下载DPDK源码，DPDK官网：dpdk.org以dpdk-20.08为例，下载完成后，cd到源码所在路径1.指定DPDK安装路径，设置所需的环境变量并转到源目录e
centos使用dpdk库大隐隐于野 #高性能编程 centos linux 运维
yum-yinstalldpdkdpdk-devel在C++中使用DPDK（DataPlaneDevelopmentKit）库通常涉及到以下几个步骤：安装DPDK、配置编译环境、编写C++代码并链接DPDK库。以下是如何在C++中引用和使用DPDK的详细步骤。1.安装DPDK首先，你需要在系统上安装DPDK。可以通过以下方式进行安装：从源代码编译：下载DPDK源代码：gitclonehttps:/
shell 笔记_s1=abc,s2=def,[-z‘‘‘]&；&；echo‘$s1‘ echo‘$s2‘的输出是什么 2024云技术运维 linux 面试
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Linux平台上DPDK入门指南（一） lingshengxiyou 网络 linux 服务器网络协议云计算
1.简介本文档包含DPDK软件安装和配置的相关说明。旨在帮助用户快速启动和运行软件。文档主要描述了在Linux环境下编译和运行DPDK应用程序。1.1.文档地图以下是一份建议顺序阅读的DPDK参考文档列表：发布说明:提供特性发行版本的信息，包括支持的功能，限制，修复的问题，已知的问题等等。此外，还以FAQ方式提供了常见问题及解答。入门指南（本文档）：介绍如何安装和配置DPDK，旨在帮助用户快速上手
DPDK基础入门（七）：网卡性能优化指针从不空 Linux高性能网络性能优化网络
DPDK的轮询模式运行在操作系统内核态的网卡驱动程序基本都是基于异步中断处理模式，而DPDK采用了轮询或者轮询混杂中断的模式来进行收包和发包。任何包进入到网卡，网卡硬件会进行必要的检查、计算、解析和过滤等，最终包会进入物理端口的某一个队列。物理端口上的每一个收包队列，都会有一个对应的由收包描述符组成的软件队列来进行硬件和软件的交互，以达到收包的目的。轮询模式DPDK的轮询驱动程序负责初始化好每一个
如何在DPDK中实现协议解析？编码小哥 dpdk 架构
在DPDK中实现协议解析涉及几个步骤，包括初始化环境、配置网卡、接收数据包、解析数据包并处理数据包。下面将详细介绍这些步骤以及如何在DPDK中实现基本的协议解析。初始化DPDK环境首先，你需要初始化DPDK环境，加载EAL(EthernetAddressLearning)库，并设置好内存池、环形缓冲区等。#include#include#includeintmain(intargc,char**a
OVS主线流程之ovs-vswitchd主体结构分析大空新一网络 OVS
OVS是openvirtualswitch的简称，是现在广泛使用的软件实现的虚拟网络交换机。各大云厂商普遍使用OVS来实现自身的虚拟网络，各厂商会根据自身需要加以修改使之符合自身需求，DPU中也使用OVS来实现流表的offload。OVS中的流表基于多级结构，与用户强相关的是opwnflow，下发的流表称为emcflow。OVS一般存在两种运行模式，内核模式和DPDK模式。内核模式下存在一个dat
DPDK22.11环境搭建羽思 DPDK 网络驱动开发
1.工具下载1.ubuntu安装工具：sudoapt-getinstallmesonsudoapt-getinstallninjasudoapt-getinstallpython3-pyelftools2.centosyuminstall-ypython3-pipnumactl-devellibibverbs-utilslibpcap-devel//安装libpcap依赖包wgethttp://m
Linux进程间通信方式之管道(pipe)_ 前端老侯运维 linux 面试
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Docker容器如何与主机同网段其它主机互通？ lingshengxiyou linux DPDK c++docker 容器 linux 服务器后台开发
一、前言1、使用场景对开发者而言，随着容器的普遍使用，开发者可以很方便的搭建项目的简易测试环境。有时候为了项目可以在任意机器一键运行，不用配置连接IP等信息。所以希望可以提前固定容器的IP地址，而且一个项目有时候涉及多个容器，可能还会部署在多台机器上。所以如果容器间可以固定IP跨机器通信的话，会有很大方便。（免费订阅,永久学习）学习地址:Dpdk/网络协议栈/vpp/OvS/DDos/NFV/虚拟
DPDK mlx5 驱动使用报错 choumin 小问题 DPDK DPDK mlx5
还是记录一个小点，希望对大家有所帮助。背景：最近需要用DPDK测试Mellanox的ConnectX-4Lx网卡。在DPDK中，该网卡对应的驱动是mlx5。使用的DPDK版本是20.11和22.03，结果都出现了类似的报错信息。问题：在testpmd中启动上述网卡出现报错情况，testpmd的命令如下：$./build/app/dpdk-testpmd-l0-3-a0000:06:00.0-a00
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

深入浅出DPDK学习笔记（4）——— 并行计算

深入浅出DPDK学习笔记（4）——— 并行计算

多核性能和可扩展性

追求性能水平扩展

多核处理器

亲和性

Linux内核对亲和性的支持

为什么应该使用亲和性

线程独占

DPDK的多线程

EAL中的lcore

lcore的亲和性

对用户pthread的支持

有效地管理计算资源

指令并发与数据并行

指令并发

单指令多数据

SIMD简介

实战DPDK

你可能感兴趣的:(dpdk,dpdk)