① save命令会阻塞 Redis 服务器进程,直到 RDB 文件创建完毕为止,在 Redis 服务器阻塞期间,服务器不能处理任何命令请求
② bgsave 命令——>派生子进程——>子进程来创建 RDB 文件并阻塞服务器——>父进程(主进程)则继续处理请求
① 在自动触发 RDB 持久化时,Redis 会选择 bgsave 来进行持久化
② save m n ##自动触发通常是在配置文件中此命令触发 bgsave
m:多少 s 内; n:发生多少次
#通过配置设置触发
save m n
#自动触发最常见的情况是在配置文件中通过save m n,指定当m秒内发生n次变化时,会触发bgsave。
vim /usr/local/redis/conf/redis.conf
#-----443行--以下三个save条件满足任意一个时,都会引起bgsave的调用
# save 3600 1 300 100 60 10000
save 900 1 :当时间到900秒时,如果redis数据发生了至少1次变化,则执行bgsave
save 300 10 :当时间到300秒时, 如果redis数据发生了至少10次变化,则执行bgsave
save 60 10000 :当时间到60秒时,如果redis数据发生了至少10000次变化, 则执行bgsave
#-----242行--是否开启RDB文件压缩
rdbcompression yes
① 在主从复制场景下,如果从节点执行全量复制操作,则主节点会执行bgsave命令,并将rdb文件发送给从节点
② 执行shutdown命令时,自动执行rdb持久化
是将 Redis 执行的每次写、删除命令记录到单独的日志文件中,查询操作不会记录
当 Redis 重启时优先执行 AOF 文件中的命令来恢复数据。
vim /usr/local/redis/conf/redis.conf
#————1380行————修改,开启AOF
appendonly yes
#————1407行————指定AOE文件名称
appendfilename "appendonly.aof"
#————1505行————是否忽略最后一条可能存在问题的指令
aof-load-truncated yes
systemctl restart redis-server.service
由于需要记录 Redis 的每条写命令,因此 A0F 不需要触发,AOF 的执行流程如下
① 命令追加(append)
将Redis的写命令追加到缓冲区aof_buf; (为了尽量不因为持久化而影响redis性能)
② 文件写入(write)和文件同步(sync)
根据不同的同步策略将 aof_buf 中的内容同步到硬盘,所以 Redis 系统同时提供了 fsync、fdatasync 等同步函数,可以强制操作系统立刻将缓冲区中的数据写入到硬盘里,从而确保数据的安全性。
③ 文件重写(rewrite)
定期重写AOF文件,达到压缩的目的
Redis先将写命令追加到缓冲区,而不是直接写入文件,主要是为了避免每次有写命令都直接写入硬盘,导致硬盘IO成为Redis负载的瓶颈。
命令追加的格式是Redis命令请求的协议格式,它是一种纯文本格式,具有兼容性好、可读性强、容易处理、操作简单避免二次开销等优点。在A0F文件中,除了用于指定数据库的select命令 (如 select 0为选中0号数据库)是由Redis添加的,其他都是客户端发送来的写命令。
Redis 提供了多种AOF缓存区的同步文件策略,策略涉及到操作系统的write函数和fsync函数,说明如下:
为了提高文件写入效率,在现代操作系统中,当用户调用write函数将数据写入文件时,操作系统通常会将数据暂存到一个内存缓冲区里,当缓冲区被填满或超过了指定时限后,才真正将缓冲区的数据写入到硬盘里。这样的操作虽然提高了效率,但也带来了安全问题:如果计算机停机,内存缓冲区中的数据会丢失;因此系统同时提供了fsync、fdatasync等同步函数,可以强制操作系统立刻将缓冲区中的数据写入到硬盘里,从而确保数据的安全性。
AOF缓存区的同步文件策略存在三种同步方式,它们分别是:
vim /usr/local/redis/conf/redis.conf
#---1439---
appendfsync always
#解释: 命令写入aof_ buf后立即调用系统fsync操作同步到AOF文件,fsync完成后线程返回。
# 这种情况下,每次有写命令都要同步到AOF文件,硬盘IO成为性能瓶颈,Redis只能支持大约几百TPS写入,
# 严重降低了Redis的性能;即便是使用固态硬盘(SSD),每秒大约也只能处理几万个命令,而且会大大降低SSD的寿命。
appendfsync no
#解释: 命令写入aof_ buf后调用系统write操作,不对AOF文件做fsync同步;
# 同步由操作系统负责,通常同步周期为30秒。这种情况下,文件同步的时间不可控,
# 且缓冲区中堆积的数据会很多,数据安全性无法保证。
appendfsync everysec
#解释: 命令写入aof_ buf后调用系统write操作,write完成后线程返回;
# fsync同步文件操作由专门的线程每秒调用一次。
# everysec是前述两种策略的折中,是性能和数据安全性的平衡,
# 因此是Redis的默认配置,也是我们推荐的配置。
随着时间流逝,Redis服务器执行的写命令越来越多,AOF文件也会越来越大:过大的AOF文件不仅会影响服务器的正常运行,也会导致数据恢复需要的时间过长。
文件重写是指定期重写AOF文件,减小AOF文件的体积。需要注意的是,AOF重写是把Redis进程内的数据转化为写命令,同步到新的AOF文件;不会对旧的AOF文件进行任何读取、写入操作!
关于文件重写需要注意的另一点是:对于AOF持久化来说,文件重写虽然是强烈推荐的,但并不是必须的;即使没有文件重写,数据也可以被持久化并在Redis启动的时候导入;因此在一些实现中,会关闭自动的文件重写,然后通过定时任务在每天的某一时刻定时执行。
文件重写能压缩AOF文件的原因
通过上述内容可以看出,由于重写后AOF执行的命令减少了,文件重写既可以减少文件占用的空间,也可以加快恢复速度。
文件重写的触发
文件重写的触发,分为手动触发和自动触发。
vim /usr/local/redis/conf/redis.conf
#----1480----
auto-aof-rewrite-percentage 100
#当前AOF文件大小(即aof_current_size)是上次日志重写时AOF文件大小(aof_base_size)两倍时,发生BGREWRITEAOF操作
auto-aof-rewrite-min-size 64mb
#当前A0F文件执行BGREWRITEAOF命令的最小值,避免刚开始启动Reids时由于文件尺寸较小导致频繁的BGREWR ITEAOF
关于文件重写的流程,有两点需要特别注意:
具体流程如下:
Redis父进程首先判断当前是否存在正在执行 bgsave / bgrewriteaof 的子进程,如果存在则 bgrewriteaof 命令直接返回,如果存在 bgsave 命令则等 bgsave 执行完成后再执行
父进程执行fork操作创建子进程,这个过程中父进程是阻塞的。
① 父进程fork后,bgrewriteaof 命令返回 “Background append only file rewrite started” 信息并不再阻塞父进程,并可以响应其他命令。Redis的所有写命令依然写入AOF缓冲区,并根据appendfsync策略同步到硬盘,保证原有AOF机制的正确。
② 由于fork操作使用写时复制技术,子进程只能共享fork操作时的内存数据。由于父进程依然在响应命令,因此Redis使用AOF重写缓冲区(aof_rewrite_buf)保存这部分数据,防止新AOF文件生成期间丢失这部分数据。也就是说,bgrewriteaof 执行期间,Redis的写 命令同时追加到 aof_ buf 和 aof_ rewirte_ buf 两个缓冲区。
子进程根据内存快照,按照命令合并规则写入到新的AOF文件。
① 子进程写完新的AOF文件后,向父进程发信号,父进程更新统计信息,具体可以通过 info persistence 查看。
② 父进程把AOF重写缓冲区的数据写入到新的AOF文件,这样就保证了新AOF文件所保存的数据库状态和服务器当前状态一致。
③ 使用新的AOF文件替换老文件,完成AOF重写。
当AOF开启时,Redis启 动时会优先载入AOF文件来恢复数据;只有当AOF关闭时,才会载入RDB文件恢复数据。
当AOF开启,但AOF文 件不存在时,即使RDB文件存在也不会加载。
Redis载入AOF文件时,会对AOF文件进行校验,如果文件损坏,则日志中会打印错误,Redis启动失败。但如果是AOF文件结尾不完整(机器突然宕机等容易导致文件尾部不完整),且 aof-load- truncated 参数开启,则日志中会输出警告,Redis忽略掉AOF文件的尾部,启动成功。
aof-load-truncated 参数默认是开启的。
优点:RDB文件紧凑,体积小,网络传输快,适合全量复制;恢复速度比AOF快很多。当然,与AOF相比, RDB最 重要的优点之一是对性能的影响相对较小。
缺点:RDB文件的致命缺点在于其数据快照的持久化方式决定了必然做不到实时持久化,而在数据越来越重要的今天,数据的大量丢失很多时候是无法接受的,因此AOF持久化成为主流。此外,RDB文件需要满足特定格式,兼容性差(如老版本的Redis不兼容新版本的RDB文件)。 对于RDB持久化,一方面是bgsave在进行fork操作时Redis主进程会阻塞,另一方面,子进程向硬盘写数据也会带来IO压力。
与RDB持久化相对应,AOF的优点在于支持秒级持久化、兼容性好,缺点是文件大、恢复速度慢、对性能影响大。
对于AOF持久化,向硬盘写数据的频率大大提高(everysec策略下为秒级),IO压力更大,甚至可能造成AOF追加阻塞问题。
AOF文件的重写与RDB的bgsave类似,会有fork时的阻塞和子进程的I0压力问题。相对来说,由于AOF向硬盘中写数据的频率更高,因此对Redis主进程性能的影响会更大。
192.168.145.60:7001> info memory
mem_fragmentation_ratio:内存碎片率。mem_fragmentation_ratio = used_memory_rss / used_memory
used_memory_rss:是Redis向操作系统申请的内存。
used_memory:是Redis中的数据占用的内存。
used_memory_peak:redis内存使用的峰值。
Redis内部有自己的内存管理器,为了提高内存使用的效率,来对内存的申请和释放进行管理。
Redis中的值删除的时候,并没有把内存直接释放,交还给操作系统,而是交给了Redis内部有内存管理器。
Redis中申请内存的时候,也是先看自己的内存管理器中是否有足够的内存可用。
Redis的这种机制,提高了内存的使用率,但是会使Redis中有部分自己没在用,却不释放的内存,导致了内存碎片的发生。
跟踪内存碎片率对理解Redis实例的资源性能是非常重要的:
config set activedefrag yes #自动碎片清理,内存就会自动清理了。
memory purge #手动碎片清理
redis实例的内存使用率超过可用最大内存,操作系统将开始进行内存与swap空间交换。
内存数据淘汰策略,保证合理分配redis有限的内存资源。
当达到设置的最大阀值时,需选择一种key的回收策略,默认情况下回收策略是禁止删除。
配置文件中修改 maxmemory-policy 属性值:
vim /usr/local/redis/conf/redis.conf
--1149--
maxmemory-policy noenviction
volatile-lru:使用LRU算法从已设置过期时间的数据集合中淘汰数据(移除最近最少使用的key,针对设置了TTL的key)
volatile-ttl:从已设置过期时间的数据集合中挑选即将过期的数据淘汰(移除最近过期的key)
volatile-random:从已设置过期时间的数据集合中随机挑选数据淘汰(在设置了TTL的key里随机移除)
allkeys-lru:使用LRU算法从所有数据集合中淘汰数据(移除最少使用的key,针对所有的key)
allkeys-random:从数据集合中任意选择数据淘汰(随机移除key)
noenviction:禁止淘汰数据(不删除直到写满时报错)
缓存雪崩
1.1 问题描述
缓存同一时间大面积的过期失效,所以,后面的请求都会落到数据库上,造成数据库短时间内承受大量请求而崩掉。
1.2 解决方案
①缓存数据的过期时间设置随机,防止同一时间大量数据过期现象发生。
②一般并发量不是特别多的时候,使用最多的解决方案是加锁排队。
③给每一个缓存数据增加相应的缓存标记,记录缓存的是否失效,如果缓存标记失效,则更新数据缓存。
缓存击穿
2.1 问题描述
①缓存中没有但数据库中有的数据(一般是缓存时间到期),这时由于并发用户特别多,同时读缓存没读到数据,又同时去数据库去取数据,引起数据库压力瞬间增大,造成过大压力。
②和缓存雪崩不同的是,缓存击穿指并发查同一条数据,缓存雪崩是不同数据都过期了,很多数据都查不到从而查数据库。
2.2 解决方案
①设置热点数据永远不过期。
②加互斥锁,互斥锁。
缓存穿透
3.1 问题描述
①缓存和数据库中都没有的数据,导致所有的请求都落到数据库上,造成数据库短时间内承受大量请求而崩掉。
3.2 解决方案
①接口层增加校验,如用户鉴权校验,id做基础校验,id<=0的直接拦截;
②从缓存取不到的数据,在数据库中也没有取到,这时也可以将 key-value 对写为 key-null,缓存有效时间可以设置短点,如30秒(设置太长会导致正常情况也没法使用)。这样可以防止攻击用户反复用同一个id暴力攻击。
③采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的 bitmap 中,一个一定不存在的数据会被这个 bitmap 拦截掉,从而避免了对底层存储系统的查询压力。
缓存和数据库双写一致性问题
4.1 读取数据
①先从Redis中读取,如果Redis中没有,再从MvSQL中读取,并将读取到的数据写入到Redis缓存中。这样,下次读取该数据时就可以从Redis中直接获取,避免了直接访问MySQL数据库,提高了读取速度
4.2 更新数据
①先更新MySQL数据库,再更新Redis缓存。这样,即使Redis缓存出现了异常,MySQL中的数据仍然是正确的,避免了数据不一致的问题。如果Redis更新失败,可以选择记录日志并进行重试,直到更新成功为止
4.3 删除数据
①同样需要先删除Redis缓存,再删除MvSQL数据库。这样可以保证删除操作的原子性,避免了可能的数据不一致。
4.4 关键数据
①对于一些关键数据,可以使用MVSQL的触发器(Trigger) 来实现同步更新Redis缓存。当MySQL中的数据发生变化时,触发器可以自动将变化同步到Redis中,避免了手动操作的疏漏。
4.5 定期同步数据
①定期同步MySQL和Redis中的数据,以确保数据的一致性。可以使用定时任务或者其他方式定期同步两个数据源中的数据,从而保持致。
总的来说就是先更新数据库,然后再删除缓存 + 缓存做过期时间,数据过期后再有读请求可从数据库直接更新缓存。
容灾的概念
就是在自然灾害、设备故障、人为操作破坏等的灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。
RDB 和 AOF 的区别
redis优化
(1)设置 config set activedefrag yes 开启内存碎片自动清理, 或者定时执行 memory purge 清理内存碎片;
(2)设置 maxmemory 指定redis占用最大内存大小, 设置 maxmemory-samples 指定内存数据淘汰策略的样本数量;
(3)设置 内存数据淘汰策略 maxmemory-policy 实现保证内存使用率不超过最大内存大小;
(4)设置 key 的过期时间,精简 键名和键值,及控制键值的大小;
(5)尽可能使用 Hash 数据类型存储数据,因为 Hash 类型的一个键包含多个字段,该类型的数据占用空间较小;
(6)合理设置 maxclients 最大客户端连接数,tcp-backlog tcp监控端口的最大连接排队数, timeout 连接超时时间;
(7)设置 AOF 持久化 和 主从复制 备份数据,采用 哨兵 或者 集群 模式实现高可用;
(8)设置 config set requirepass 开启密码验证。
`