简单理解memcached的内存分配

在写完《使用Memcached实现抽奖活动》这篇文章后,发现自己虽然很早就使用过 Memcached,但已经很久没有关注它的进展了,所以就全面看了下它的官方 Wiki,打算写几篇文章去理解它,今天就简单聊聊它的内存分配。

Memcached 所有的操作都是在内存中进行的,这也是它高性能和延迟低的原因之一,如果使用 malloc() 机制动态的分配内存,会产生很多的内存碎片,所以 Memcached 是自己管理内存的,在启动的时候就开启了一大块内存,然后根据规则进行分配使用,这种机制也称为 Slab allocation。

在启动的时候可以通过 -m 参数分配内存,这些内存都用于存储 item,Memcached 自身还需要一些内存(比如 Hash 表,网络连接),所以实际上 Memcached 使用的所有内存是超过 -m 参数分配的内存。

现在简单理解下 Slab allocation,在 Memcached 中,内存首先被分配给一个个 pages,每个 page 默认大小都是 1MB,假设 -m 启动参数是 64 M(后面都以 64 M 说明),那么系统就存在 64 个 page。

每个 page 被指定为 slab-class,slab-class 相当于每个 page 的属性,未被指定 slab-class 的 page 就是未分配的内存。

slab-class 决定了每个 page 存储 item 的大小,称之为 chunk,chunnk 就是用来存储 item 的,在同一个 page 中,所有的 chunk 大小是一致的。

不同的 slab-class 其 chunk 大小是不一致的,基本上是递增关系,默认是 1.25 比例的增长方式。

为了理解 page,slab-class,chunk 的关系,可以运行下列命令:

$ memcached -vv

slab class   1: chunk size        96 perslab   10922
slab class   2: chunk size       120 perslab    8738
slab class   3: chunk size       152 perslab    6898
slab class   4: chunk size       192 perslab    5461
slab class   5: chunk size       240 perslab    4369
slab class   6: chunk size       304 perslab    3449
slab class   7: chunk size       384 perslab    2730
slab class   8: chunk size       480 perslab    2184
slab class   9: chunk size       600 perslab    1747
...

slab class 1 其 chunk 大小是 96 字节,那么对应的 page 最多可以存储 10922 个 chunk。slab class 2 根据 slab class 1 * 1.25 的公示,chunk 大小是 120 个字节,对应的 page 最多可以存储 8738 个 chunk,依次类推。

需要注意的是:

  • 假设 -m 是 64 M,不代表 64 个 page 全部被分配了,因为如果存储的 item 很少,很多 page 是未分配的。
  • 不同的 page,其 slab-class 可能是一样的,比如所有的 item 都小于 80 字节,一旦第一个 page 存储满了,那么 Memcached 启用第二个 page 的时候,其仍然被指定为 slab-class 2。
  • 如果有个 item 是 1M,那么这个 slab-class 只能存储 1 个 chunk。

每个 slab-class 都是独立的,有独立的 LRU 算法(后面介绍),统计数据也是独立的。

如果想了解下 slab-class 的使用情况,可以输入以下命令:

$ stats slabs

STAT 1:chunk_size 96
STAT 1:chunks_per_page 10922
STAT 1:total_pages 1
STAT 1:total_chunks 10922
STAT 1:used_chunks 109
STAT 1:free_chunks 10813
STAT 1:get_hits 36
STAT 1:cmd_set 109
STAT 2:chunk_size 120
STAT 2:chunks_per_page 17476
STAT 2:total_pages 2
STAT 2:total_chunks 17476

可以看出目前 Memcached 分配了 3 个 page,对应 slab-class1 和 slab-class2。第一个 page 用了 109 个 chunk,gets 请求有 36 个,很可惜没有 gets_miss 的统计数据,无法统计 slab-class 的命中率。

如果想了解 item 的详细使用情况,可以输入下列命令:

$ stats items

STAT items:1:number 108
STAT items:1:number_hot 20
STAT items:1:number_warm 0
STAT items:1:number_cold 88
STAT items:1:age_hot 251
STAT items:1:age_warm 0
STAT items:1:age 67139
STAT items:1:evicted 0
STAT items:1:evicted_nonzero 0

其中涉及了很多 LRU 的统计数据,以及命中率数据,这个后续会讲。

那么 chunk size 如果等于 96 个字节(slab-class1),代表可以存储 96 个字节的 item?并不是,每个 item 包含固定数据结构大小、item 的 key,item 对应的 data,如果要了解每个 item 数据结构的大小,可以下载 Memcached 源文件,然后进入根目录,输入如下命令:

$ ./sizes 
Settings        248
Item (no cas)   48
Item (cas)      56

如果 Memcached 要支持 CAS 操作(如果不了解 CAS,参考《使用Memcached实现抽奖活动》),每个 item 的数据结构是 56 字节,也就是对于 slab-class1 来说,实际可以存储的 item 是 40 个字节,slab-class2 可以存储的 item 是 64 个字节。

如果存储的 item(包含数据结构)是 80 字节,那么存储在 slab-class1,但浪费了 16 个字节,如果存储的 item 是 140 个字节,只能存储在 slab-class2 中,浪费的字节更多,这就是它的内存分配规则。

如果对你存储的 item 大小比较了解(比如大部分处于 60-140个字节之间),为了节省内存,可以调整 slab-class 的递增因子,启动的时候输入下列命令:

$ memcached -f 1.1

你可能感兴趣的:(简单理解memcached的内存分配)