NGINX原理 之 CPU绑定(CPU亲和性)

  • 作者:邹祁峰
  • 邮箱:[email protected]
  • 博客:http://blog.csdn.net/qifengzou
  • 日期:2014.06.12 18:44
  • 转载请注明来自"祁峰"的CSDN博客

1 引言

    非统一内存访问(NUMA)是一种用于多处理器的电脑记忆体设计,内存访问时间取决于处理器的内存位置。 在NUMA下,处理器访问它自己的本地存储器的速度比非本地存储器(存储器的地方到另一个处理器之间共享的处理器或存储器)快一些。

    针对NUMA架构系统的特点,可以通过将进程/线程绑定指定CPU(一个或多个)的方式,提高CPU CACHE的命中率,减少进程/线程迁移CPU造成的内存访问的时间消耗,从而提高程序的运行效率。[注:关于CPU亲和性的概念,可参考《管理处理器的亲和性》]


2 源码剖析

2.1 NGINX源码

    NGINX进程绑定CPU的代码非常简单,其中的核心接口为sche_setaffinity(),如下所示:

NGINX原理 之 CPU绑定(CPU亲和性)_第1张图片

代码1 绑定CPU

2.2 源码分析

    经分析可知:

    1) 1进程可绑定到1个或多个CPU核

    -> 如果cpu_affinity的值对应的二进制值为以下值时,那么进程将绑定到第7和第63个CPU。(从0开始,下同)

10000000 00000000

00000000 00000000

00000000 00000000

00000000 10000000

    -> 如果cpu_affinity的值对应的二进制值为以下值时,那么进程将绑定到第2、第3和第7个CPU。

00000000 00000000

00000000 00000000

00000000 00000000

00000000 10001100

    其他情况可以依此类推。

    2) 该函数可设置CPU核范围:第0~63个.因为参数cpu_affinity的类型为uint64_t,其占用64位.

2.3 测试实例

    根据NGINX源码的实现,可以编写如下测试代码:

NGINX原理 之 CPU绑定(CPU亲和性)_第2张图片

图1 测试代码

1) 测试之前:CPU0和CPU1的消耗都很低

NGINX原理 之 CPU绑定(CPU亲和性)_第3张图片

图2 测试之前

2) 绑定CPU0:CPU0的使用接近100%,而CPU1基本不变

NGINX原理 之 CPU绑定(CPU亲和性)_第4张图片

图3 绑定CPU0

2) 绑定CPU1:CPU1的使用接近100%,而CPU0基本不变

NGINX原理 之 CPU绑定(CPU亲和性)_第5张图片

图4 绑定CPU1

2.4 其他接口

    除了sched_setaffinity() 可以设置“进程/线程”的CPU亲和性外,还可以使用pthread_setaffinity_np()设置“线程”的CPU亲和性。参考代码如下

NGINX原理 之 CPU绑定(CPU亲和性)_第6张图片

图5 线程绑定CPU

    以上代码对应的Makefile如下:

NGINX原理 之 CPU绑定(CPU亲和性)_第7张图片

图6 Makefile

你可能感兴趣的:(设计思路,开发记录,源码剖析)