redis莫名数据被清问题排查记录

新版系统刚发布,前端反馈redis中的值经常被清空,第一反应怀疑谁的代码里面执行了flushall或者flushdb操作

通过redis的monitor追踪一波,

redis-cli -a "xxx" monitor 如果redis没配置密码可以不用加-a参数,实际操作中我加了个 >> /data/log/trace_redis.log,把所有操作写到文件里面,注意时间长了log会很大

跑下来redis确实会被清掉,但没人/程序执行过flush操作,这里停顿5分钟思考下人生

这里幸亏之前转过一个zabbix监控,有监控redis的使用内存,结果发现redis的内存使用情况:
redis莫名数据被清问题排查记录_第1张图片
redis会短时间飙到10G,然后马上掉下来,这时候基本可以判定应该跟内存有关,达到某个阈值之后数据被清了。

去翻redis官网有详细记录:https://redis.io/topics/lru-cache
文档查下来确实是因为reids有内存限制,我们这里是10G,并且有超内存之后的清除策略默认是全清。。。

翻开 /etc/redis.conf (实际路径可能不同)
redis莫名数据被清问题排查记录_第2张图片

就这里了,maxmemory设置redis最大使用内存,maxmemory-policy决定超过之后怎么清

Redis提供6种数据淘汰策略:
    1. volatile-lru:从已设置过期时间的内存数据集中挑选最近最少使用的数据 淘汰;
    2. volatile-ttl: 从已设置过期时间的内存数据集中挑选即将过期的数据 淘汰;
    3.  volatile-random:从已设置过期时间的内存数据集中任意挑选数据 淘汰;
    4.   allkeys-lru:从内存数据集中挑选最近最少使用的数据 淘汰;
    5.   allkeys-random:从数据集中任意挑选数据 淘汰;
    6.    no-enviction(驱逐):禁止驱逐数据。(默认淘汰策略。当redis内存数据达到maxmemory,在该策略下,直接返回OOM错误);
        关于maxmemory设置,通过在redis.conf中maxmemory参数设置,或者通过命令CONFIG SET动态修改
       关于数据淘汰策略的设置,通过在redis.conf中的maxmemory-policy参数设置,或者通过命令CONFIG SET动态修改

当然这是redis上的策略,实际追踪发现有个程序一直往redis里面push数据导致的上面的现象,问题解决

你可能感兴趣的:(redis莫名数据被清问题排查记录)