yum -y install dpdk dpdk-devel
在 C++ 中使用 DPDK(Data Plane Development Kit)库通常涉及到以下几个步骤:安装 DPDK、配置编译环境、编写 C++ 代码并链接 DPDK 库。以下是如何在 C++ 中引用和使用 DPDK 的详细步骤。
首先,你需要在系统上安装 DPDK。可以通过以下方式进行安装:
下载 DPDK 源代码:git clone https://github.com/DPDK/dpdk.git
cd dpdk
编译 DPDK:
make config T=x86_64-native-linuxapp-gcc
通过包管理器安装(如果你的 Linux 发行版提供了 DPDK 包):
sudo apt-get install dpdk
DPDK 需要一些环境变量来运行。你需要设置 RTE_SDK
export RTE_SDK=/path/to/dpdk
export RTE_TARGET=x86_64-native-linuxapp-gcc
编写一个简单的 C++ 程序来使用 DPDK。以下是一个基本的示例代码:
extern "C" {
int main(int argc, char **argv) {
int ret = rte_eal_init(argc, argv);
if (ret < 0) {
std::cerr << "Failed to initialize EAL" << std::endl;
return -1;
std::cout << "DPDK EAL initialized successfully" << std::endl;
// 其他 DPDK 代码...
return 0;
为了编译这个 C++ 程序,你需要链接 DPDK 库。可以使用以下 g++
g++ -o my_dpdk_app my_dpdk_app.cpp -I$RTE_SDK/$RTE_TARGET/include -L$RTE_SDK/$RTE_TARGET/lib -Wl,--no-as-needed -lrte_eal -lrte_mempool -lrte_ring -pthread
:指定 DPDK 头文件的路径。-L
:指定 DPDK 库文件的路径。-Wl,--no-as-needed
:链接所需的 DPDK 库,如 librte_eal
等。根据你的应用需求,可能需要链接其他 DPDK 库。确保你有权限绑定网卡到 DPDK 驱动,然后运行你的程序:
sudo ./my_dpdk_app
或 vfio-pci
)。通过这些步骤,你可以在 C++ 中成功引用和使用 DPDK 库。根据你的具体应用需求,可能需要进一步学习 DPDK 的 API 和功能模块。
在 CentOS 上通过 yum
安装的 DPDK 通常会将文件放置在系统的标准位置,而不是像手动编译那样放在一个自定义的目录。因此,你不需要像手动安装那样设置 RTE_SDK
。当使用系统安装的 DPDK 时,你可以直接在编译时引用这些标准路径。例如,编译一个使用 DPDK 的程序时,你可以这样做:
g++ -o my_dpdk_app my_dpdk_app.cpp -I/usr/include/dpdk -L/usr/lib64 -Wl,--no-as-needed -lrte_eal -lrte_mempool -lrte_ring -pthread
如果不确定文件的具体位置,可以使用以下命令来查找 DPDK 的安装路径:
rpm -ql dpdk
这将列出 DPDK 包安装的所有文件及其路径。
确保你的网络设备已绑定到 DPDK 驱动(如 vfio-pci
或 igb_uio
),并且你有足够的权限运行 DPDK 应用程序(通常需要 root 权限)。
驱动绑定:你可能需要使用 dpdk-devbind
工具来绑定网卡驱动。这个工具通常安装在 /usr/share/dpdk/tools/
环境变量:虽然不需要设置 RTE_SDK
通过这些步骤和信息,你应该能够使用通过 yum
安装的 DPDK 在 CentOS 上进行开发和运行应用程序。
// FastMemcpy.c - [email protected], 2015
// feature:
// 50% speed up in avg. vs standard memcpy (tested in vc2012/gcc4.9)
#if (defined(_WIN32) || defined(WIN32))
#ifdef _MSC_VER
#pragma comment(lib, "winmm.lib")
#elif defined(__unix)
#error it can only be compiled under windows or unix
#include "FastMemcpy.h"
unsigned int gettime()
#if (defined(_WIN32) || defined(WIN32))
return timeGetTime();
static struct timezone tz={ 0,0 };
struct timeval time;
return (time.tv_sec * 1000 + time.tv_usec / 1000);
void sleepms(unsigned int millisec)
#if defined(_WIN32) || defined(WIN32)
usleep(millisec * 1000);
void benchmark(int dstalign, int srcalign, size_t size, int times)
char *DATA1 = (char*)malloc(size + 64);
char *DATA2 = (char*)malloc(size + 64);
size_t LINEAR1 = ((size_t)DATA1);
size_t LINEAR2 = ((size_t)DATA2);
char *ALIGN1 = (char*)(((64 - (LINEAR1 & 63)) & 63) + LINEAR1);
char *ALIGN2 = (char*)(((64 - (LINEAR2 & 63)) & 63) + LINEAR2);
char *dst = (dstalign)? ALIGN1 : (ALIGN1 + 1);
char *src = (srcalign)? ALIGN2 : (ALIGN2 + 3);
unsigned int t1, t2;
int k;
t1 = gettime();
for (k = times; k > 0; k--) {
memcpy(dst, src, size);
t1 = gettime() - t1;
t2 = gettime();
for (k = times; k > 0; k--) {
rte_memcpy(dst, src, size);
t2 = gettime() - t2;
printf("result(dst %s, src %s): rte_memcpy=%dms memcpy=%d ms\n",
dstalign? "aligned" : "unalign",
srcalign? "aligned" : "unalign", (int)t2, (int)t1);
void bench(int copysize, int times)
printf("benchmark(size=%d bytes, times=%d):\n", copysize, times);
benchmark(1, 1, copysize, times);
benchmark(1, 0, copysize, times);
benchmark(0, 1, copysize, times);
benchmark(0, 0, copysize, times);
void random_bench(int maxsize, int times)
static char A[11 * 1024 * 1024 + 2];
static char B[11 * 1024 * 1024 + 2];
static int random_offsets[0x10000];
static int random_sizes[0x8000];
unsigned int i, p1, p2;
unsigned int t1, t2;
for (i = 0; i < 0x10000; i++) { // generate random offsets
random_offsets[i] = rand() % (10 * 1024 * 1024 + 1);
for (i = 0; i < 0x8000; i++) { // generate random sizes
random_sizes[i] = 1 + rand() % maxsize;
t1 = gettime();
for (p1 = 0, p2 = 0, i = 0; i < times; i++) {
int offset1 = random_offsets[(p1++) & 0xffff];
int offset2 = random_offsets[(p1++) & 0xffff];
int size = random_sizes[(p2++) & 0x7fff];
memcpy(A + offset1, B + offset2, size);
t1 = gettime() - t1;
t2 = gettime();
for (p1 = 0, p2 = 0, i = 0; i < times; i++) {
int offset1 = random_offsets[(p1++) & 0xffff];
int offset2 = random_offsets[(p1++) & 0xffff];
int size = random_sizes[(p2++) & 0x7fff];
rte_memcpy(A + offset1, B + offset2, size);
t2 = gettime() - t2;
printf("benchmark random access:\n");
printf("rte_memcpy=%dms memcpy=%dms\n\n", (int)t2, (int)t1);
#ifdef _MSC_VER
#pragma comment(lib, "winmm.lib")
int main(void)
bench(32, 0x1000000);
bench(64, 0x1000000);
bench(512, 0x800000);
bench(1024, 0x400000);
bench(4096, 0x80000);
bench(8192, 0x40000);
bench(1024 * 1024 * 1, 0x800);
bench(1024 * 1024 * 4, 0x200);
bench(1024 * 1024 * 8, 0x100);
random_bench(2048, 8000000);
return 0;
gcc -O3 -mavx -o FastMemcpy FastMemcpy.c -I/usr/include/dpdk -L/usr/lib64 -Wl,--no-as-needed -lrte_eal -lrte_mempool -lrte_ring -pthread