[问题已处理]-[redis]-redis报错overcommit_memory is set to 0

[问题已处理]-[redis]-redis报错overcommit_memory is set to 0_第1张图片

 

 

今天项目突然报错了。看了一下日志发现redis 报oom。看了下系统内存使用率 好像并没有什么问题。

 

重启redis 报错

 

 

先使用sync 再清除缓存buffer,继续重启redis 依旧报错。

 

于是通过搜索,也有人跟我遇到同样的问题,基本可以确定是由它引起的。

 

内核参数overcommit_memory 

 

它是 内存分配策略

 

可选值:0、1、2。

0, 表示内核将检查是否有足够的可用内存供应用进程使用;如果有足够的可用内存,内存申请允许;否则,内存申请失败,并把错误返回给应用进程。

1, 表示内核允许分配所有的物理内存,而不管当前的内存状态如何。

2, 表示内核允许分配超过所有物理内存和交换空间总和的内存

 

0启发式策略。合理的overcommit会被接受,不合理的overcommit会被拒绝。 1. 任何overcommit都会被接受。 2. 当系统分配的内存超过swap+N%*物理RAM(N%由vm.overcommit_ratio决定)时,会拒绝commit。 overcommit的策略通过vm.overcommit_memory设置。 overcommit的百分比由vm.overcommit_ratio设置。

 

什么是Overcommit和OOM

 

    Linux对大部分申请内存的请求都回复"yes",以便能跑更多更大的程序。因为申请内存后,并不会马上使用内存。这种技术叫做Overcommit。当linux发现内存不足时,会发生OOM killer(OOM=out-of-memory)。它会选择杀死一些进程(用户态进程,不是内核线程),以便释放内存。

 

    当oom-killer发生时,linux会选择杀死哪些进程?选择进程的函数是oom_badness函数(在mm/oom_kill.c中),该函数会计算每个进程的点数(0~1000)。点数越高,这个进程越有可能被杀死。每个进程的点数跟oom_score_adj有关,而且oom_score_adj可以被设置(-1000最低,1000最高)。

 

注意:redisdump数据的时候,会fork出一个子进程,理论上child进程所占用的内存和parent是一样的,比如parent占用的内存为8G,这个时候也要同样分配8G的内存给child,如果内存无法负担,往往会造成redis服务器的down机或者IO负载过高,效率下降。所以这里比较优化的内存分配策略应该设置为 1(表示内核允许分配所有的物理内存,而不管当前的内存状态如何)。(这点我貌似也没有备份)

 

解决方法:

 

     很简单,按提示的操作(将vm.overcommit_memory 设为1)即可:

 

     有三种方式修改内核参数,但要有root权限:

 

   (1)编辑/etc/sysctl.conf ,改vm.overcommit_memory=1,然后sysctl -p 使配置文件生效

 

  (2)sysctl vm.overcommit_memory=1

 

  (3)echo 1 > /proc/sys/vm/overcommit_memory

 

我这里采用了第1个办法处理  的确可以解决问题。

但是看了下/proc/sys/vm/overcommit_memory的默认值是0,redis 最大内存8000000000bytes

我64G内存的服务器,当初出问题的时候free –g看了下内存可用和free都比较多,照理用0也应该没问题。不清楚是不是因为不合理的overcommit会被拒绝

你可能感兴趣的:(redis)