redis怎么进行内存管理?

一、内存消耗

当mem_fragmentation_ratio>1时,说明used_memory_rss-used_memory多出的部分内存并没有用于数据存储,而是被内存碎片所消耗,如果两者相差很大,说明碎片率严重。 

当mem_fragmentation_ratio<1时,这种情况一般出现在操作系统把Redis内存交换(Swap)到硬盘导致,出现这种情况时要格外关注,由于硬盘速度远远慢于内存,Redis性能会变得很差,甚至僵死。Redis进程内消耗主要包括:自身内存+对象内存+缓冲内存+内存碎片,其中Redis空进程自身内存消耗非常少,通常used_memory_rss在3MB左右,used_memory在800KB左右,一个空的Redis进程消耗内存可以忽略不计。

◆ 缓冲内存主要包括:客户端缓冲、复制积压缓冲区、AOF缓冲区。客户端缓冲指的是所有接入到Redis服务器TCP连接的输入输出缓冲。输入缓冲无法控制,最大空间为1G,如果超过将断开连接。

◆ 复制积压缓冲区:Redis在2.8版本之后提供了一个可重用的固定大小缓冲区用于实现部分复制功能,根据repl-backlog-size参数控制,默认1MB。对于复制积压缓冲区整个主节点只有一个,所有的从节点共享此缓冲区,因此可以设置较大的缓冲区空间,如100MB,这部分内存投入是有价值的,可以有效避免全量复制AOF缓冲区:这部分空间用于在Redis重写期间保存最近的写入命令,AOF缓冲区空间消耗用户无法控制,消耗的内存取决于AOF重写时间和写入命令量,这部分空间占用通常很小。

Redis默认的内存分配器采用jemalloc,可选的分配器还有:glibc、tcmalloc。内存分配器为了更好地管理和重复利用内存,分配内存策略一般采用固定范围的内存块进行分配。内存碎片问题虽然是所有内存服务的通病,但是jemalloc针对碎片化问题专门做了优化,一般不会存在过度碎片化的问题,正常的碎片率(mem_fragmentation_ratio)在1.03左右。

一般以下场景容易出现高内存碎片问题:

●  频繁做更新操作,例如频繁对已存在的键执行append、setrange等更新操作。大量过期键删除,键对象过期删除后,释放的空间无法得到充分利用,导致碎片率上升。

出现高内存碎片问题时常见的解决方式如下:

●  数据对齐:在条件允许的情况下尽量做数据对齐,比如数据尽量采用数字类型或者固定长度字符串等,但是这要视具体的业务而定,有些场景无法做到。

●  安全重启:重启节点可以做到内存碎片重新整理,因此可以利用高可用架构,如Sentinel或Cluster,将碎片率过高的主节点转换为从节点,进行安全重启子进程内存消耗主要指执行AOF/RDB重写时Redis创建的子进程内存消耗。Redis执行fork操作产生的子进程内存占用量对外表现为与父进程相同,理论上需要一倍的物理内存来完成重写操作。

内存大页机制(Transport Huge Pages,THP),是linux2.6.38后支持的功能,该功能支持2MB的大爷内存分配,默认开启。在redis.conf中增加了一个新的配置项“disable-thp”来控制THP是否开启。

disable-thp yes  

子进程内存消耗总结如下:

1、Redis产生的子进程并不需要消耗1倍的父进程内存,实际消耗根据期间写入命令量决定,但是依然要预留出一些内存防止溢出。

2、需要设置sysctl vm.overcommit_memory=1允许内核可以分配所有的物理内存,防止Redis进程执行fork时因系统剩余内存不足而失败。

3、排查当前系统是否支持并开启THP,如果开启建议关闭,防止copy-onwrite期间内存过度消耗。

在日志信息中可以查看到关于THP的日志内容,如下:

// 开启THP:

C * AOF rewrite: 519 MB of memory used by copy-on-write

// 关闭THP:

C * AOF rewrite: 29 MB of memory used by copy-on-write

Redis使用maxmemory参数限制最大可用内存。限制内存的目的主要有:

1、用于缓存场景,当超出内存上限maxmemory时使用LRU等删除策略释放空间。

2、防止所用内存超过服务器物理内存。

需要注意,maxmemory限制的是Redis实际使用的内存量,也就是used_memory统计项对应的内存。由于内存碎片率的存在,实际消耗的内存可能会比maxmemory设置的更大,实际使用时要小心这部分内存溢出。

二、内存管理

Redis的内存回收机制主要体现在以下两个方面:

1、删除到达过期时间的键对象。

2、内存使用达到maxmemory上限时触发内存溢出控制策略。

删除过期键对象:

Redis所有的键都可以设置过期属性,内部保存在过期字典中。由于进程内保存大量的键,维护每个键精准的过期删除机制会导致消耗大量的CPU,对于单线程的Redis来说成本过高,因此Redis采用惰性删除和定时任务删除机制实现过期键的内存回收。

● 惰性删除:惰性删除用于当客户端读取带有超时属性的键时,如果已经超过键设置的过期时间,会执行删除操作并返回空,这种策略是出于节省CPU成本考虑,不需要单独维护TTL链表来处理过期键的删除。但是单独用这种方式存在内存泄露的问题,当过期键一直没有访问将无法得到及时删除,从而导致内存不能及时释放。正因为如此,Redis还提供另一种定时任务删除机制作为惰性删除的补充。

● 定时任务删除:Redis内部维护一个定时任务,默认每秒运行10次(通过配置hz控制)。定时任务中删除过期键逻辑采用了自适应算法,根据键的过期比例、使用快慢两种速率模式回收键,流程如图所示。

当Redis所用内存达到maxmemory上限时会触发相应的溢出控制策略。具体策略受maxmemory-policy参数控制,Redis支持6种策略,如下所示:

1)noeviction:默认策略,不会删除任何数据,拒绝所有写入操作并返回客户端错误信息(error)OOM command not allowed when used memory,此时Redis只响应读操作。

2)volatile-lru:根据LRU算法删除设置了超时属性(expire)的键,直到腾出足够空间为止。如果没有可删除的键对象,回退到noeviction策略。

3)allkeys-lru:根据LRU算法删除键,不管数据有没有设置超时属性,直到腾出足够空间为止。

4)allkeys-random:随机删除所有键,直到腾出足够空间为止。

5)volatile-random:随机删除过期键,直到腾出足够空间为止。

6)volatile-ttl:根据键值对象的ttl属性,删除最近将要过期数据。如果没有,回退到noeviction策略。

/* Try to expire a few timed out keys. The algorithm used is adaptive and

* will use few CPU cycles if there are few expiring keys, otherwise

* it will get more aggressive to avoid that too much memory is used by

* keys that can be removed from the keyspace.

*

* 函数尝试删除数据库中已经过期的键。

* 当带有过期时间的键比较少时,函数运行得比较保守,

* 如果带有过期时间的键比较多,那么函数会以更积极的方式来删除过期键,

* 从而可能地释放被过期键占用的内存。

*

* No more than REDIS_DBCRON_DBS_PER_CALL databases are tested at every

* iteration.

*

* 每次循环中被测试的数据库数目不会超过 REDIS_DBCRON_DBS_PER_CALL 。

*

* This kind of call is used when Redis detects that timelimit_exit is

* true, so there is more work to do, and we do it more incrementally from

* the beforeSleep() function of the event loop.

* 如果 timelimit_exit 为真,那么说明还有更多删除工作要做,(在我看来

timelimit_exit如果为真的话那表示上一次删除过期键时是因为删除时间过长超时了才退出的,

所以这次将删除方法更加积极)

* 那么在 beforeSleep() 函数调用时,程序会再次执行这个函数。

*

* Expire cycle type:

*

* 过期循环的类型:

*

* If type is ACTIVE_EXPIRE_CYCLE_FAST the function will try to run a

* "fast" expire cycle that takes no longer than  EXPIRE_FAST_CYCLE_DURATION

* microseconds, and is not repeated again before the same amount of time.

*

* 如果循环的类型为 ACTIVE_EXPIRE_CYCLE_FAST ,

* 那么函数会以“快速过期”模式执行,

* 执行的时间不会长过 EXPIRE_FAST_CYCLE_DURATION 毫秒,

* 并且在 EXPIRE_FAST_CYCLE_DURATION 毫秒之内不会再重新执行。

*

* If type is ACTIVE_EXPIRE_CYCLE_SLOW, that normal expire cycle is

* executed, where the time limit is a percentage of the REDIS_HZ period

* as specified by the REDIS_EXPIRELOOKUPS_TIME_PERC define.

*

* 如果循环的类型为 ACTIVE_EXPIRE_CYCLE_SLOW ,

* 那么函数会以“正常过期”模式执行,

* 函数的执行时限为 REDIS_HS 常量的一个百分比,

* 这个百分比由 REDIS_EXPIRELOOKUPS_TIME_PERC 定义。

*/

void activeExpireCycle(int type) {

/* This function has some global state in order to continue the work

* incrementally across calls. */

// 共享变量,用来累积函数连续执行时的数据

static unsigned int current_db = 0; /* Last DB tested. 正在测试的数据库*/

static int timelimit_exit = 0; /* Time limit hit in previous call

上一次执行是否时间超时的提示 */

static long long last_fast_cycle = 0; /* When last fast cycle ran. 上次

快速模式执行的时间*/

unsigned int j, iteration = 0;

// 默认每次处理的数据库数量

unsigned int dbs_per_call = REDIS_DBCRON_DBS_PER_CALL; //默认

REDIS_DBCRON_DBS_PER_CALL=16

// 函数开始的时间

long long start = ustime(), timelimit;

// 快速模式

if (type == ACTIVE_EXPIRE_CYCLE_FAST) {

/* Don't start a fast cycle if the previous cycle did not exited

* for time limt. Also don't repeat a fast cycle for the same

period

* as the fast cycle total duration itself. */

// 如果上次函数没有触发 timelimit_exit ,那么不执行处理

if (!timelimit_exit) return;

// 如果距离上次执行未够一定时间,那么不执行处理

if (start < last_fast_cycle + ACTIVE_EXPIRE_CYCLE_FAST_DURATION*2)

return;

// 运行到这里,说明执行快速处理,记录当前时间

last_fast_cycle = start;

}

/* We usually should test REDIS_DBCRON_DBS_PER_CALL per iteration, with

* two exceptions:

*

* 一般情况下,每次迭代(也就是每次调用这个函数)函数只处理

REDIS_DBCRON_DBS_PER_CALL 个数据库,

* 除非:

*

* 1) Don't test more DBs than we have.

* 当前数据库的数量小于 REDIS_DBCRON_DBS_PER_CALL

* 2) If last time we hit the time limit, we want to scan all DBs

* in this iteration, as there is work to do in some DB and we don't

want

* expired keys to use memory for too much time.

* 如果上次处理遇到了时间上限,那么这次需要对所有数据库进行扫描,

* 这可以避免过多的过期键占用空间

*/

if (dbs_per_call > server.dbnum || timelimit_exit)//以服务器的数据库数量为

dbs_per_call = server.dbnum;

/* We can use at max ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC percentage of

CPU time

* per iteration. Since this function gets called with a frequency of

* server.hz times per second, the following is the max amount of

* microseconds we can spend in this function. */

// 函数处理的微秒时间上限

// ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC 默认为 25 ,也即是 25 % 的 CPU 时间

timelimit = 1000000*ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC/server.hz/100;

timelimit_exit = 0;

if (timelimit <= 0) timelimit = 1;

// 如果是运行在快速模式之下

// 那么最多只能运行 FAST_DURATION 微秒

// 默认值为 1000 (微秒)

if (type == ACTIVE_EXPIRE_CYCLE_FAST)

timelimit = ACTIVE_EXPIRE_CYCLE_FAST_DURATION; /* in microseconds.

*/

// 遍历数据库

for (j = 0; j < dbs_per_call; j++) {

int expired;

// 指向要处理的数据库

redisDb *db = server.db+(current_db % server.dbnum);

/* Increment the DB now so we are sure if we run out of time

* in the current DB we'll restart from the next. This allows to

* distribute the time evenly across DBs. */

// 为 currrnt_DB 计数器加一,如果进入 do 循环之后因为超时而跳出

// 那么下次会直接从下个 currrnt_DB 开始处理。这样使得分配在每个数据库上处理

时间比较平均

current_db++;

/* Continue to expire if at the end of the cycle more than 25%

* of the keys were expired. */

//如果每次循环清理的过期键是过期键的25%以上,那么就继续清理

do {

unsigned long num, slots;

long long now, ttl_sum;

int ttl_samples;

/* If there is nothing to expire try next DB ASAP. */

// 获取数据库中带过期时间的键的数量

// 如果该数量为 0 ,直接跳过这个数据库

if ((num = dictSize(db->expires)) == 0) {

db->avg_ttl = 0;

break;

}

// 获取数据库中键值对的数量

slots = dictSlots(db->expires);

// 当前时间

now = mstime();

/* When there are less than 1% filled slots getting random

* keys is expensive, so stop here waiting for better times...

* The dictionary will be resized asap. */

// 这个数据库的使用率低于 1% ,扫描起来太费力了(大部分都会 MISS)

// 跳过,等待字典收缩程序运行

if (num && slots > DICT_HT_INITIAL_SIZE &&

(num*100/slots < 1)) break;

/* The main collection cycle. Sample random keys among keys

* with an expire set, checking for expired ones.

*

* 样本计数器

*/

// 已处理过期键计数器

expired = 0;

// 键的总 TTL 计数器

ttl_sum = 0;

// 总共处理的键计数器

ttl_samples = 0;

// 每次最多只能检查 LOOKUPS_PER_LOOP 个键,默认是20

if (num > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP)

num = ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP;

// 开始遍历数据库

while (num--) {

dictEntry *de;

long long ttl;

// 从 expires 中随机取出一个带过期时间的键

if ((de = dictGetRandomKey(db->expires)) == NULL) break;

// 计算 TTL

ttl = dictGetSignedIntegerVal(de)-now;

// 如果键已经过期,那么删除它,并将 expired 计数器增一

if (activeExpireCycleTryExpire(db,de,now)) expired++;

if (ttl < 0) ttl = 0;

// 累积键的 TTL

ttl_sum += ttl;

// 累积处理键的个数

ttl_samples++;

}

/* Update the average TTL stats for this database. */

// 为这个数据库更新平均 TTL 统计数据

if (ttl_samples) {

// 计算当前平均值

long long avg_ttl = ttl_sum/ttl_samples;

// 如果这是第一次设置数据库平均 TTL ,那么进行初始化

if (db->avg_ttl == 0) db->avg_ttl = avg_ttl;

/* Smooth the value averaging with the previous one. */

// 否则取数据库的上次平均 TTL 和今次平均 TTL 的平均值

db->avg_ttl = (db->avg_ttl+avg_ttl)/2;

}

/* We can't block forever here even if there are many keys to

* expire. So after a given amount of milliseconds return to

the

* caller waiting for the other active expire cycle. */

// 如果过期键太多的话,我们不能用太长时间处理,所以这个函数执行一定时间之

后就要返回,等待下一次循环

// 更新遍历次数

iteration++;

// 每遍历 16 次执行一次

if ((iteration & 0xf) == 0 && /* check once every 16

iterations. */

(ustime()-start) > timelimit)

{

// 如果遍历次数正好是 16 的倍数

// 并且遍历的时间超过了 timelimit,超时了

// 那么将timelimit_exit赋值为1,下一个if返回吧

timelimit_exit = 1;

}

// 已经超时了,返回

if (timelimit_exit) return;

/* We don't repeat the cycle if there are less than 25% of keys

* found expired in the current DB. */

// 如果删除的过期键少于当前数据库中过期键数量的 25 %,那么不再遍历。当然

如果超过了25%,那说明过期键还很多,继续清理

} while (expired > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP/4);

}

}

你可能感兴趣的:(redis怎么进行内存管理?)