Redis内存碎片问题

在使用Redis时,经常遇到删除了数据,数据量已经不是很大,使用top命令查看的时候,Redis还是占用了很多内存?

这是因为,当数据删除后,Redis释放的内存空间会有内存分配器管理,并不会立即返回给操作系统,所以,操作系统依然会记录着大量内存分批给Redis。

这里有一个潜在的风险点,Redis释放的内存空间可能并不是连续的,那么,这些不连续的内存空间很有可能处于一种闲置的状态,导致,虽然有空闲空间,但是Redis却无法用来保存数据,会减少Redis能够实际保存的数据量。

接下来就学习一下Redis的内存空间存储效率问题。

内存虽破是如何形成的?

其实,内存碎片的形成有内因和外因两个层面,内因是操作系统的内存分配机制,外因是Redis的负载特征。

内因:内存分配器的分配策略

内存分配器的分配策略决定了操作系统无法做到“按需分配”,这是因为,内存分配器一般是按照固定大小来分配内存,而不是完全按照应用程序申请的内存空间大小给程序分配。

Redis可以使用 libc、jemalloc、tcmalloc 多种内存分配器来分配内存,默认使用 jemalloc。接下来,我就以 jemalloc 为例,来具体解释一下。

jemalloc 的分配策略之一,是按照一系列固定的大小划分内存空间,例如 8 字节、16 字节、32 字节、48 字节,…, 2KB、4KB、8KB 等。当程序申请的内存最接近某个固定值时,jemalloc 会给它分配相应大小的空间。这样的分配方式本身是为了减少分配次数。例如,Redis 申请一个 20 字节的空间保存数据,jemalloc 就会分配 32 字节,此时,如果应用还要写入 10 字节的数据,Redis 就不用再向操作系统申请空间了,因为刚才分配的 32 字节已经够用了,这就避免了一次分配操作。

如果Redis每次向分配器申请的内存空间大小不一样,这种分配方式就会有形成碎片的风险,这正好来源于Redis的外因。

外因:键值对大小不一样和删改操作。

Redis通常作为共用的缓存系统或键值数据库对外提供服务,所以,不同业务应用的数据都可能保存在Redis中,就会带来不同大小的键值对,这样一来,Redis申请内存空间分配时,本身就会有大小不一的空间需求,这是第一个外因。

第二个外因是,这些键值对会被修改和删除,这会导致空间的扩容和释放。具体来说,一方面,如果修改后的键值对变大或变小了,就需要占用额外的空间或者释放不用的空间。另一方面,删除的键值对就不再需要内存空间了,此时,就会把空间释放出来,形成空闲空间。

如何判断是否有内存碎片?

Redis 是内存数据库,内存利用率的高低直接关系到 Redis 运行效率的高低。为了让用户能监控到实时的内存使用情况,Redis 自身提供了 INFO 命令,可以用来查询内存使用的详细信息,命令如下:

INFO memory
# Memory
used_memory:1073741736
used_memory_human:1024.00M
used_memory_rss:1997159792
used_memory_rss_human:1.86G
…
mem_fragmentation_ratio:1.86

这里有一个 mem_fragmentation_ratio 的指标,它表示的就是 Redis 当前的内存碎片率。就是上面的命令中的两个指标 used_memory_rss 和 used_memory 相除的结果。

经验阈值:

  • mem_fragmentation_ratio 大于 1 但小于 1.5。这种情况是合理的。这是因为,刚才我介绍的那些因素是难以避免的。毕竟,内因的内存分配器是一定要使用的,分配策略都是通用的,不会轻易修改;而外因由 Redis 负载决定,也无法限制。所以,存在内存碎片也是正常的。
  • mem_fragmentation_ratio 大于 1.5 。这表明内存碎片率已经超过了 50%。一般情况下,这个时候,我们就需要采取一些措施来降低内存碎片率了。

如何清理内存碎片?

简单粗暴的方式就是重启Redis,这样并不优雅,如果数据没有持久化,数据就会丢失,如果持久化了,恢复阶段无法提供服务。

4.0-RC3 版本以后,Redis 自身提供了一种内存碎片自动清理的方法,我们先来看这个方法的基本机制。

内存碎片清理,简单来说,就是“搬家让位,合并空间”。当有数据把一块连续的内存空间分割成好几块不连续的空间时,操作系统就会把数据拷贝到别处。此时,数据拷贝需要能把这些数据原来占用的空间都空出来,把原本不连续的内存空间变成连续的空间。否则,如果数据拷贝后,并没有形成连续的内存空间,这就不能算是清理了。

需要注意,碎片清理是有代价的,操作系统需要把多份数据拷贝到新位置,把原有空间释放出来,这会带来时间开销。因为 Redis 是单线程,在数据拷贝时,Redis 只能等着,这就导致 Redis 无法及时处理请求,性能就会降低。而且,有的时候,数据拷贝还需要注意顺序,就像刚刚说的清理内存碎片的例子,操作系统需要先拷贝 D,并释放 D 的空间后,才能拷贝 B。这种对顺序性的要求,会进一步增加 Redis 的等待时间,导致性能降低。

缓解这个问题就需要我们合理配置自动内存碎片清理功能的参数,来控制碎片清理的开始和结束时机,以及占用的 CPU 比例,从而减少碎片清理对 Redis 本身请求处理的性能影响。

config set activedefrag yes   #开启自动内存碎片清理
active-defrag-ignore-bytes 100mb   #表示内存碎片的字节数达到 100MB 时,开始清理;
active-defrag-threshold-lower 10     #表示内存碎片空间占操作系统分配给 Redis 的总空间比例达到 10% 时,开始清理
active-defrag-cycle-min 25  # 表示自动清理过程所用 CPU 时间的比例不低于 25%,保证清理能正常开展
active-defrag-cycle-max 75  # 表示自动清理过程所用 CPU 时间的比例不高于 75%,一旦超过,就停止清理,从而避免在清理时,大量的内存拷贝阻塞 Redis,导致响应延迟升高。

自动内存碎片清理机制在控制碎片清理启停的时机上,既考虑了碎片的空间占比、对 Redis 内存使用效率的影响,还考虑了清理机制本身的 CPU 时间占比、对 Redis 性能的影响。我们可以根据实际应用中数据量和性能要求灵活配置几个参数。

学习来源:极客时间 《Redis 核心技术与实战》 学习笔记 Day13

你可能感兴趣的:(学习笔记,redis,缓存,数据库)