redis有哪些数据类型?
String,List,Set,Zset,Hash
什么是redis持久化?
持久化就是把内存的数据写到磁盘中,防止服务宕机了,导致内存数据丢失。
Redis的持久化机制是什么?
redis提供了两种持久化机制 RDB 和 AOF机制。
RDB:
redis默认的持久化方式,按照一定的时间将内存的数据以快照的形式保存到硬盘中,对应产出的数据文件为dump.rdb。通过配置文件中的save参数来定义快照的周期。
优点:
只有一个文件dump.rdb,方便持久化。
容灾性好,一个文件可以保存到安全的磁盘。
性能最大化,fork子进程来完成写操作,让主进程继续处理命令,所以是IO最大化,使用单独进程来进行持久化,主进程不会进行任何IO操作,保证了redis的高性能。
相对于数据集大时,比AOF的启动效率更高。
缺点:
数据安全性低,RDB是间隔一段时间进行持久化,如果持久化之间redis发生故障,会发生数据丢失。
AOF持久化方式:是指所有命令行记录以redis命令请求协议的格式完成持久化存储,保存为AOF文件。
AOF
AOF持久化,则是将redis的执行每次写命令记录到单独的日志文件中,当重启redis会重新将持久化的日志中文件恢复数据。
当两种方式同时开启时,数据恢复redis会优先选择AOF恢复。
优点:
数据安全,aof持久化可以配置appendfsync 属性,有always。每进行一次命令操作就记录到aof文件中一次。
通过append模式写文件,即使中途服务器宕机,可以通过redis-check-aof 工具解决数据一致性问题。
AOF机制的rewrite模式,AOF文件没被rewrite之前,可以删除其中的某些命令。
缺点:
AOF文件比RDB文件大,且恢复速度慢。
数据集大的时候,比rdb启动效率低。
两个持久性方式的区别:
redis中数据如何保证都是热点数据?
redis内存数据集大熊啊上升到一定大小的时候,就会实行数据淘汰策略。
redis内存淘汰策略
全局的见空间选择性移除
设置过期时间的键空间选择性移除:
哨兵模式主要是用于实现redis集群的高可用。
核心:
redis cluster 是一种服务端Sharding技术,3.0版本开始正式提供。redis cluster并没有使用一致性hash,而是采用slot的概念,一种分成16384个槽。将请求发送到任意节点,接收到请求的节点会将查询请求发送到正确的节点上执行。
方案说明:
分布式寻址算法
对于缓存来说,一般都是用来支撑读高并发的,因此架构做成主从架构,一主多从,主负责写,并且将数据复制到其他的slave节点,从节点负责读。所有的读请求全部走从节点。轻松实现水平扩容,支撑读高并发。
redis replication -> 主从架构 -> 读写分离 -> 水平扩容支撑读高并发、
redis主从复制的核心原理
当启动一个从节点的时候,他会发送一个PSYNC
命令给 主节点。
如果这是 从节点 初次连接到主节点,那么会触发一次 full resynchronization
全量复制。此时 master 会启动一个后台线程,开始生成一份 RDB
快照文件。
同时还会将从客户端 client 新收到的所有写命令缓存在内存中。RDB
文件生成完毕后, master 会将这个 RDB
发送给 slave,slave 会先写入本地磁盘,然后再从本地磁盘加载到内存中,
接着master会将内存中缓存的写命令发送到slave,slave也会同步这些数据。
过程原理
因为redis不能保证数据的强一致性,所以会存在丢失写操作。
可以在同一个服务器部署多个Redis的实例,并把他们当作不同的服务器来使用,在某些时候,无论如何一个服务器是不够的, 所以,如果你想使用多个CPU,你可以考虑一下分片(shard)。
redis为单进程单线程模式,采用队列模式将并发访问编程串行访问,且多客服端对redis的连接并不存在竞争关系,Redis中可以使用SETNX命令实现分布式锁。
使用SETNX完成同步锁的流程:
使用SETNX命令获取锁,若返回0(key已存在,锁已存在)则获取失败,反之获取成功
为了防止获取锁后程序出现异常,导致其他线程/进程调用SETNX命令总是返回0而进入死锁状态,需要为该key设置一个“合理”的过期时间
释放锁,使用DEL命令将锁数据删除
Redis 官方站提出了一种权威的基于 Redis 实现分布式锁的方式名叫 Redlock,此种方式比原先的单节点的方法更安全。它可以保证以下特性:
缓存雪崩是指缓存同一时间大面积的失效,后面的请求都会落到数据库上,造成数据库短时间内承受大量请求而崩掉。
解决方案:
缓存穿透是指缓存和数据库中都没有的数据,导致所有的请求都落到数据库上,造成数据库短时间内承受大量请求而崩掉。
解决方案:
布隆过滤器
引入了k(k>1)个相互独立的哈希函数,保证在给定的空间、误判率下,完成元素判重的过程。
他的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。
Bloom-Filter算法的核心思想就是利用多个不同的Hash函数来解决“冲突”。
Hash存在一个冲突(碰撞)的问题,用同一个Hash得到的两个URL的值有可能相同。为了减少冲突,我们可以多引入几个Hash,如果通过其中的一个Hash值我们得出某元素不在集合中,那么该元素肯定不在集合中。只有在所有的Hash函数告诉我们该元素在集合中时,才能确定该元素存在于集合中。这便是Bloom-Filter的基本思想。
Bloom-Filter一般用于在大数据量的集合中判定某元素是否存在。
缓存击穿是指缓存中没有但数据库中存在的数据。这时由于并发用户特别多,同时都缓存没读到数据,又同时去数据库去取数据,引起数据库压力瞬间增大,造成过大压力。
解决方案:
缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统。这样就可以避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题。
缓存中的一个Key(比如一个促销商品),在某个时间点过期的时候,恰好在这个时间点对这个Key有大量的并发请求过来,这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。