12.2、flushall·flushdb误操作

flushall/flushdb误操作

Redis的flushall/flushdb命令可以做数据清除,对于Redis的开发和运维人员有一定帮助,然而一旦误操作,它的破坏性也是很明显的。怎么才能快速恢复数据,让损失达到最小呢?本节我们将结合之前学习的Redis相关知识进行分析,最后给出一个合理的方案。

注意:为了方便说明,下文中除了AOF文件中的flushall/flushdb以外,其他所有的flushall/flushdb都用flush代替。

假设进行flush操作的Redis是一对主从结构的主节点,其中键值对的个数是100万,每秒写入量是1000。

  1. 缓存与存储

    被误操作flush后,根据当前Redis是缓存还是存储使用策略有所不同:

    • 缓存:对于业务数据的正确性可能造成损失还小一点,因为缓存中的数据可以从数据源重新进行构建,但是在第11章介绍了缓存雪崩和缓存穿透的相关知识,当前场景也有类似的地方,如果业务方并发量很大,可能会对后端数据源造成一定的负载压力,这个问题也是不容忽视。

    • 存储:对业务方可能会造成巨大的影响,也许flush操作后的数据时重要配置,也可能是一些基础数据,也可能是业务上的重要一环,如果没有提前做业务降级操作,那么最终反馈到用户的应用可能就是报错或者空白页面等,其后果不堪设想。及时做了相应的降级或者容错处理,对于用户体验也有一定的影响。

    所以Redis无论作为缓存还是作为存储,如何能在flush操作后快速恢复数据才是至关重要的。持久化文件肯定是恢复数据的媒介,下面两个小姐将对AOF和RDB文件进行分析。

  2. 借助AOF机制恢复

    Redis执行了flush操作后,AOF持久化文件会受到什么影响呢?如下所示:

    • appendonly no:对AOF持久化没有任何影响,因为根本不存在AOF文件。

    • appendonly yes:只不过是在AOF文件中追加了一条记录,例如下面就是AOF文件中的flush操作记录:

    *1
    $8
    flushall
    

    虽然Redis中的数据被清除掉了,但是AOF文件还保存着flush操作之前完整的数据,这对恢复数据是很有帮助的。注意问题如下:

    1)如果发生了AOF重写,Redis遍历所有数据库重新生成AOF文件,并会覆盖之前的AOF文件。所以如果AOf重写发生了,也就意味着之前的数据就丢掉了,那么利用AOF文件来回复的办法就失效了。所以当误操作后,需要考虑如下两件事。

    • 调大AOF重写参数auto-aof-rewrite-percentage和auto-aof-rewrite-min-size,让Redis不能产生AOF自动重写。

    • 拒绝手动bgrewriteaof。

    2)如果要用AOF文件进行数据恢复,那么那么必须要将AOF文件中的flushall相关操作去掉,为了更加安全,可以在去掉之后使用redis-check-aof这个工具去检验和修复一下AOF文件,确保AOF文件格式正确,保证数据恢复正常。

  3. RDB有什么变化

    Redis执行了flushall操作后,RDB持久化文件会受到什么影响呢?

    1)如果没有开启RDB的自动策略,也就是配置文件中没有类似如下配置:

    save 900 1
    save 300 10
    save 60 10000
    

    那么除非手动执行过save、bgsave或者发生了主从的全量复制,否则 RDB文件也会保存flush操作之前的数据,可以作为恢复数据的数据源。注意问题如下:

    • 防止手动执行save、bgsave,如果此时执行save、bgsave,新的RDB文件就不会包含flush操作之前的数据,被老的RDB文件进行覆盖。

    • RDB文件中的数据可能没有AOF实时性高、也就是说,RDB文件很可能很久以前主从全量复制生成的,或者之前用save、bgsave备份的。

    2)如果开启了RDB的自动策略,由于flush涉及键值数量较多,RDB文件会被清除,意味着使用RDB回复基本无望。

    综上所述,如果AOF已经开启了,那么用AOF来恢复是比较合理的方式,但是如果AOF关闭了,那么RDB虽然数据不是很实时,但是也能恢复部分数据,完全取决于RDB是什么时候备份的。当然RDB并不是一无是处,它的恢复速度要比AOF快很多,但是总体来说对于flush操作之后不是最好的数据恢复源。

  4. 从节点有什么变化

    下面使用AOF作为数据源进行恢复演练。

    1)防止AOF重写。快速修改Redis主从的auto-aof-rewrite-percentage和auto-aof-rewrite-min-size变为一个很大的值,从而防止了AOF重写的发生,例如:

    config set auto-aof-rewrite-percnetage 1000
    config set auto-aof-rewrite-min-size 100000000000
    

    2)去掉主从AOF文件中的flush相关内容:

    *1
    $8
    flushall
    

    3)重启Redis主节点服务器,恢复数据。

    本节通过flush误操作的数据恢复,重新梳理了持久化、复制的相关知识,这里建议运维人员提前准备shell脚本或者其他自动化的方式处理,因为故障不等人,对于flush这样的危险操作,应该通过有效的方式进行规避。

你可能感兴趣的:(12.2、flushall·flushdb误操作)