Redis持久化详解(二)

这里写自定义目录标题

  • 一、Redis持久化
    • 1、RDB快照(snapshop)
      • 1.1、定义
      • 1.2、生成方式
      • 1.3、bgsave的写时复制(COW)机制
    • 2、AOF方式(append-only file)
      • 2.1、定义
      • 2.2、执行命令
      • 2.3、AOF重写
      • 2.4、如何开始AOF
      • 2.5、文件刷新策略
      • 2.6、数据恢复方式
      • 2.7、如何启动载入
    • 3、持久化RDB和AOF比较
    • 4、Redis 4.0 混合持久化
    • 5、Redis数据备份策略

一、Redis持久化

1、RDB快照(snapshop)

1.1、定义

对内存中数据库状态进行快照
RDB 方式:将 Redis 在内存中的数据库状态保存到磁盘里面,RDB 文件是一个经过压缩的二进制文件,通过该文件可以还原生成 RDB 文件时的数据库状态 ( 默认下,持久化到dump.rdb 文件,并且在 redis 重启后,自动读取其中文件,据悉,通常情况下一千万的字符串类型键,1GB 的快照文件,同步到内存中的 时间是 20-30 秒)

1.2、生成方式

1)执行命令手动生成
	手动执行命令生成RDB快照,进入redis客户端执行命令save或bgsave可以生成dump.rdb文件,
	每次命令执行都会将所有redis内存快照到一个新的rdb文件里,并覆盖原有rdb快照文件,SAVE命
	令会阻塞 Redis 服务器进程,直到 RDB 文件创建完毕为止,在服务器进程阻塞期间,服务器不能
	处理任何命令请求,BGSAVE 命令会派生出一个子进程,然后由子进程负责创建RDB 文件,服务器进
	程(父进程)继续处理命令请求,创建 RDB 文件结束之前,客户端发送的 BGSAVE 和 SAVE 命令
	会被服务器拒绝
2)通过配置自动生成
	可以设置服务器配置的 save 选项,让服务器每隔一段时间自动执行一次BGSAVE 命令,
	可以通过 save 选项设置多个保存条件,但只要其中任意一个条件被满足,服务器就会执行 BGSAVE 命令
例如:
	save 900 1		//服务器在 900 秒之内,对数据库进行了至少 1 次修改
	save 300 10		//服务器在 300 秒之内,对数据库进行了至少 10 次修改
	save 60 10000	//服务器在 60 秒之内,对数据库进行了至少 10000 次修改

1.3、bgsave的写时复制(COW)机制

Redis 借助操作系统提供的写时复制技术(Copy-On-Write, COW),在生成快照的同时,依然可以正常处理写命令。简单来说,bgsave 子进程是由主线程 fork 生成的,可以共享主线程的所有内存数据。bgsave 子进程运行后,开始读取主线程的内存数据,并把它们写入 RDB 文件。此时,如果主线程对这些数据也都是读操作,那么,主线程和 bgsave 子进程相互不影响。但是,如果主线程要修改一块数据,那么,这块数据就会被复制一份,生成该数据的副本。然后,bgsave 子进程会把这个副本数据写入 RDB 文件,而在这个过程中,主线程仍然可以直接修改原来的数据。

save与bgsave的对比

命令 save bgsave
IO类型 同步 异步
是否阻塞redis其它命令 不是
复杂度 O(n) O(n)
优点 不会消耗额外内存 不阻塞客户端命令
缺点 阻塞客户端命令 需要fork子进程,消耗内存

配置自动生成rdb文件后台使用的是bgsave方式。

2、AOF方式(append-only file)

2.1、定义

将修改的每一条指令记录进文件appendonly.aof中(先写入os cache,每隔一段时间
fsync到磁盘)

2.2、执行命令

列如:执行 “set zhz 0219”,aof文件里会记录如下数据

*3
$3
set
$3
zhz
$4
0219

这是一种resp协议格式数据,星号后面的数字代表命令有多少个参数,$号后面的数字代表这个参数有几个字符
注意,如果执行带过期时间的set命令,aof文件里记录的是并不是执行的原始命令,而是记录key过期的时间戳
例如:执行“set zhz 0219 ex 1000”,对应aof文件里记录如下

 *3
$3
set
$3
zhz
$4
0219
*3
$9
PEXPIREAT
$3
zhz
$13
1604249786301

2.3、AOF重写

AOF文件里可能有太多没用指令,所以AOF会定期根据内存的最新数据生成aof文件
例如,执行了如下几条命令:

127.0.0.1:6379> incr readcount
(integer) 1
127.0.0.1:6379> incr readcount
(integer) 2
127.0.0.1:6379> incr readcount
(integer) 3
127.0.0.1:6379> incr readcount
(integer) 4
127.0.0.1:6379> incr readcount
(integer) 5

重写后AOF文件里变成

*3
$3
SET
$2
readcount
$1
5

如下两个配置可以控制AOF自动重写频率

# auto‐aof‐rewrite‐min‐size 64mb //aof文件至少要达到64M才会自动重写,文件太小恢复速度本来就很快,重写的意义不大
# auto‐aof‐rewrite‐percentage 100 //aof文件自上一次重写后文件大小增长了100%则再次触发重写

当然AOF还可以手动重写,进入redis客户端执行命令bgrewriteaof重写AOF
注意,AOF重写redis会fork出一个子进程去做(与bgsave命令类似),不会对redis正常命令处理有太多影响

2.4、如何开始AOF

修改配置文件打开AOF功能:

appendonly yes   //这样表示打开,已去掉#

2.5、文件刷新策略

AOF 文件刷新的方式,有三种:

AOF:把每条命令都写入文件,类似 mysql 的binlog 日志
AOF 方式:是通过保存 Redis 服务器所执行的写命令来记录数据库状态的文件。

2.6、数据恢复方式

AOF 数据恢复方式:

appendfsync always - 每提交一个修改命令都调用 fsync 刷新到 AOF 文件,非常非常
慢,但也非常安全
appendfsync everysec - 每秒钟都调用 fsync 刷新到 AOF 文件,很快,但可能会丢失
一秒以内的数据
appendfsync no - 依靠 OS 进行刷新,redis 不主动刷新 AOF,这样最快,但安全性就
差

默认并推荐每秒刷新,这样在速度和安全上都做到了兼顾

2.7、如何启动载入

服务器在启动时,通过载入和执行 AOF 文件中保存的命令来还原服务器关闭之前的数据库状态,具体过程:

载入 AOF 文件
创建模拟客户端
从 AOF 文件中读取一条命令
使用模拟客户端执行命令
循环读取并执行命令,直到全部完成
如果同时启用了RDB 和 AOF 方式,AOF 优先,启动时只加载 AOF 文件恢复数据

3、持久化RDB和AOF比较

命令 RDB AOF
启动优先级
体积
恢复速度
数据安全性 容易丢数据 根据策略决定

产环境可以都启用,redis启动时如果既有rdb文件又有aof文件则优先选择aof文件恢复数据,因为aof一般来说数据更全一点。

4、Redis 4.0 混合持久化

通过如下配置可以开启混合持久化(必须先开启aof):

# aof‐use‐rdb‐preamble yes

如果开启了混合持久化,AOF在重写时,不再是单纯将内存数据转换为RESP命令写入AOF文件,而是将重写这一刻之前的内存做RDB快照处理,并且将RDB快照内容和增量的AOF修改内存数据的命令存在一起,都写入新的AOF文件,新的文件一开始不叫appendonly.aof,等到重写完新的AOF文件才会进行改名,覆盖原有的AOF文件,完成新旧两个AOF文件的替换。于是在 Redis 重启的时候,可以先加载 RDB 的内容,然后再重放增量 AOF 日志就可以完全替代之前的AOF 全量文件重放,因此重启效率大幅得到提升。
混合持久化AOF文件结构如下:Redis持久化详解(二)_第1张图片

5、Redis数据备份策略

  1. 写crontab定时调度脚本,每小时都copy一份rdb或aof的备份到一个目录中去,仅仅保留最近48小时的备份
  2. 每天都保留一份当日的数据备份到一个目录中去,可以保留最近1个月的备份
  3. 每次copy备份的时候,都把太旧的备份给删了
  4. 每天晚上将当前机器上的备份复制一份到其他机器上,以防机器损坏

你可能感兴趣的:(架构师-分布式框架,java)