在踏入Redis专题时,我们首先是先要了解Redis是什么,用来做什么的,怎么去用,有什么优缺点等,我们可以先来看探索的简单路线图:
其路线主要是:先知道Redis是什么,有什么用,然后逐层的去剖析在使用过程中出现的问题,例如数据的持久化方案:RDB和AOF机制的特点,各自的优缺点,以及高可用方案,主从节点架构、哨兵机制以及后期的Redis集群架构,同时,我们也需要关注在大并发场景下,相关操作是否需要加分布式锁(Redisson),会出现的缓存击穿、缓存穿透、缓存雪崩以及数据库与缓存双写不一致问题,以及热点数据重建问题等,整个过程由浅而深,由简到难,这里做了简单的总结,详细可见具体专栏笔记
参考答案:Redis我基于C开发的高性能非关系型的键值对数据库,其可以存储键和五种不同类型值之间的映射,键的类型只能为字符串,值可支持五种数据类型,分别为:字符串、列表、集合、散列表、有序集合,与传统数据库不同的是,Redis数据是存储在内存中的,所以其读写数据的速度很快,每秒可以处理超过10万次的读写操作,另外,redis还可用作分布式锁、支持事务、持久化、LUA脚本、多种集群方案等
参考答案:
1、优点:
a、读写性能优异:Redis能读的速度为110000次/s,写的速度为81000次/s
b、支持数据持久化:支持AOF和RDB两种持久化方式
c、支持事务:Redis的所有操作都是原子性的,同时Redis还支持对几个操作合并后的原子性执行
d、支持再次复制:主机会自动将数据同步到从机,可以进行读写分离
2、缺点:
a、数据容量受到物理内存的限制,不能用作海量数据的高性能读写
b、Redis不具备自动容错和恢复功能,主机如果宕机后都会导致前端部分读写请求失败,需要等待机器重启或手动切换前端IP才能恢复,而且部分数据如果未来得及同步从节点,切换IP后还会引入数据不一致问题,降低了系统的可用性
c、Redis虽然支持在线扩容,但是集群容量达到上限时,在线扩容会变得很复杂,如果要避免这种问题,运维人员在系统上线时必须确保有足够的空间,对资源会造成很大的浪费
参考答案:这个主要是从高性能和高并发来分析这个问题,高性能主要是体现在,如果用户是第一次访问数据,会从数据库中获取,第一次会比较慢,读取数据后,加入缓存中,在下一次访问数据时,就可到缓存中读取数据,那速度就很快,而且缓存能够承受的请求压力远远大于直接访问数据库的,所以这里就体现出来高并发上的优势。
缓存分为本地缓存和分布式缓存,而map和guava实现的是本地缓存,最主要的特点就是轻量和快速,生命周期随着JVM的销毁而结束,并且在多例的情况下,每个实例都需要各自保存一份缓存,缓存就不具备数据一致性
但是,使用Redis或memcached称为分布式缓存,在多实例情况下,各实例共用一份缓存数据,其缓存数据能保证数据的一致性,但是缺点就是,如果要保证其高可用,整个程序架构上较为复杂
参考答案:Redis的操作都是基于内存的,非常快速,数据存在内存中,类似于HashMap、其查找和操作的时间复杂度都是O(1),而且结构简单,读数据操作也很简单,其次还采用单线程,避免了不必要的上下文切换和竞争关系,也不存在多线程切换消耗的CPU性能,且不用考虑各种锁的开销,除此外,其使用多路复用IO,非阻塞IO
参考答案:Redis主要有五种数据类型,分别是:String、hash、list、set、zset
参考答案:
1、计数器,可以对String进行自增自减运算,普通的热点数据缓存、短信验证码,配置信息等
2、List是一个双向列表,可以通过Lpush和Rpop写入和读取信息、还可以存储相对固定的数据,例如:市区表、字段表等数据
3、Set可以实现数据的交集、并集等,可以实现关注模型,例如可以计算出两个人共同关注的人
4、hash结构一般是用key为ID或者唯一标识,value就是对于的详情数据了,例如:商品详情、个人信息、新闻详情等
5、ZSet,是set的增强版本,增加了一个score参数,自动会根据score的值进行排序。比较适合类似于top 10等不根据插入的时间来排序的数据
参考答案:Redis持久化主要是指,将Redis中的内存数据写入到磁盘中,防止Redis服务宕机后数据丢失
参考答案:Redis中的持久化机制有两种,分别是:RDB和AOF
RDB优点:
1、其只有一个文件dump.rdb,方便持久化
2,、性能最大化,会由主线程fork子进程来完成持久化操作,主线程还会继续处理命令
3、相对数据量大时,比AOF的启动效率更高
RDB缺点:
1、数据安全性低,RDB是间隔一段时间才会进行持久化,如果在这个期间服务宕机了,那这个期间的数据就会丢失
AOF持久化,是将Redis每次执行的命令记录到单独的日志文件中,当重启Redis会重新将持久化的日志拿出来恢复数据,当两种方式同时开启时,数据恢复Redis会优先选择AOF恢复数据
AOF缺点:
1、AOF文件比RDB文件小,且恢复速度慢
2、数据集大的时候,比RDB启动效率低
AOF优点:
1、数据相对安全,AOF持久化可以配置appendfsync属性,有aways,每进行一次命令时,操作命令就会被记录到文件中
2、通过 append 模式写文件,即使中途服务器宕机,可以通过 redis-checkaof 工具解决数据一致性问题
3、AOF 机制的 rewrite 模式。AOF 文件没被 rewrite 之前(文件过大时会对命令 进行合并重写),可以删除其中的某些命令(比如误操作的 flushall))
参考答案:如何选择也需要结合具体业务场景来定,如果是能够接受分钟内的数据丢失,可以使用RDB持久化机制,如果只使用AOF机制,在恢复数据时,相比RDB效率较慢,所以通常会结合两种持久化机制一起混合使用。
参考答案:
如果Redis被当做缓存使用,使用一致性哈希实现动态扩容缩容。
如果Redis被当做一个持久化存储使用,必须使用固定的keys-to-nodes映射关系,节点的数量一旦确定不能变化。否则的话(即Redis节点需要动态变化的情况),必须使用可以在运行时进行数据再平衡的一套系统,而当前只有Redis集群可以做到这样。
参考答案:其策略主要有三种,分别如下:
1、定时过期:每个设置过期时间的key都需要创建一个定时器,到过期时间就会立即清除。该策略可以立即清除过期的数据,对内存很友好,但是会占用大量的CPU资源去处理过期的数据,从而影响缓存的响应时间和吞吐量。
2、惰性过期:只有当访问一个key时,才会判断该key是否已过期,过期则清除。该策略可以最大化地节省CPU资源,却对内存非常不友好。极端情况可能出现大量的过期key没有再次被访问,从而不会被清除,占用大量内存。
3、定期过期:每隔一定的时间,会扫描一定数量的数据库的expires字典中一定数量的key,并清除其中已过期的key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时,可以在不同情况下使得CPU和内存资源达到最优的平衡效果
参考答案:使用命令:Expire和Persist
参考答案:
1、 定时去清理过期的缓存;
2、 当有用户请求过来时,再判断这个请求所用到的缓存是否过期,过期的话就去底层系统得到新数据并更新缓存
参考答案:Redis内存数据集大小上升到一定大小后,就会实行数据淘汰策略
参考答案:Redis的,内存淘汰机制是指Redis用于缓存的内存不足时,专门处理需要新写入且需要申请额外空间数据,主要策略有:
1、全局的键空间选择性移除
a、noeviction:当内存不足以容纳新写入数据时,新写入操作会报错。
b、allkeys-lru:当内存不足以容纳新写入数据时,在键空间中,移除最近最少使用的key。(这个是最常用的)
c、allkeys-random:当内存不足以容纳新写入数据时,在键空间中,随机移除某个key。
2、设置过期时间的键空间选择性移除
a、volatile-lru:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,移除最近最少使用的key。
b、volatile-random:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,随机移除某个key。
c、volatile-ttl:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,有更早过期时间的key优先移除。
Redis的内存淘汰策略的选取并不会影响过期的key的处理。内存淘汰策略用于处理内存不足时的需要申请额外空间的数据;过期策略用于处理过期的缓存数据。
参考答案:内存
参考答案:如果达到设置的上限,Redis的写命令会返回错误信息(但是读命令还可以正常返回。)或者你可以配置内存淘汰机制,当Redis达到内存上限时会冲刷掉旧的内容。
参考答案:Redis基于Reactor模式开发了网络事件处理器,这个处理器被称为文件事件处理器(file event handler)。它的组成结构为4部分:多个套接字、IO多路复用程序、文件事件分派器、事件处理器。因为文件事件分派器队列的消费是单线程的,所以Redis才叫单线程模型。
文件事件处理器使用 I/O 多路复用(multiplexing)程序来同时监听多个套接字, 并根据套接字目前执行的任务来为套接字关联不同的事件处理器。
当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)等操作时, 与操作相对应的文件事件就会产生, 这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件。
虽然文件事件处理器以单线程方式运行, 但通过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通信模型, 又可以很好地与 redis 服务器中其他同样以单线程方式运行的模块进行对接, 这保持了Redis 内部单线程设计的简单性。
参考答案:Redis 事务的本质是通过MULTI、EXEC、WATCH等一组命令的集合。事务支持一次执行多个命令,一个事务中所有命令都会被序列化。在事务执行过程,会按照顺序串行化执行队列中的命令,其他客户端提交的命令请求不会插入到事务执行命令序列中。
总的来说:redis事务就是一次性、顺序性、排他性的执行一个队列中的一系列命令。
参考答案:
1、 事务开始 MULTI
2.、命令入队
3.、事务执行 EXEC
参考答案:
哨兵模式如下图:
主要有以下功能:
集群监控:负责监控 redis master 和 slave 进程是否正常工作。
消息通知:如果某个 redis 实例有故障,那么哨兵负责发送消息作为报警通知给管理员。
故障转移:如果 master node 挂掉了,会自动转移到 slave node 上。
配置中心:如果故障转移发生了,通知 client 客户端新的 master 地址
集群模式如下:
Redis Cluster是一种服务端Sharding技术,3.0版本开始正式提供。Redis Cluster并没有使用一致性hash,而是采用slot(槽)的概念,一共分成16384个槽。将请求发送到任意节点,接收到请求的节点会将查询请求发送到正确的节点
上执行,具体说明如下:
1.、通过哈希的方式,将数据分片,每个节点均分存储一定哈希槽(哈希值)区间的数据,默认分配了16384 个槽位
2、 每份数据分片会存储在多个互为主从的多节点上
3、 数据写入先写主节点,再同步到从节点(支持配置为阻塞同步)
4、 同一分片多个节点间的数据不保持一致性
5、 读取数据时,当客户端操作的key没有分配在该节点上时,redis会返回转向指令,指向正确的节点
6、 扩容时时需要需要把旧节点的数据迁移一部分到新节点
参考答案:单机的 redis,能够承载的 QPS 大概就在上万到几万不等。对于缓存来说,一般都是用来支撑读高并发的。因此架构做成主从(master-slave)架构,一主多从,主负责写,并且将数据复制到其它的 slave 节点,从节点负责读。所有的读请求全部走从节点。这样也可以很轻松实现水平扩容,支撑读高并发
参考答案:如下图示:
redis 采用异步方式复制数据到 slave 节点,不过 redis2.8 开始,slave node会周期性地确认自己每次复制的数据量;
一个 master node 是可以配置多个 slave node 的;
slave node 也可以连接其他的 slave node;
slave node 做复制的时候,不会 block master node 的正常工作;
slave node 在做复制的时候,也不会 block 对自己的查询操作,它会用旧的数据集来提供服务;但是复制完成的时候,需要删除旧数据集,加载新数据集,这个时候就会暂停对外服务了;
slave node 主要用来进行横向扩容,做读写分离,扩容的 slave node 可以提高读的吞吐量。
为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有N-1个复制品
参考答案:redis cluster,10 台机器,5 台机器部署了 redis 主实例,另外 5 台机器部署了 redis 的从实例,每个主实例挂了一个从实例,5 个节点对外提供读写服务,每个节点的读写高峰qps可能可以达到每秒 5 万,5 台机器最多是 25 万读写请求/s。
机器是什么配置?32G 内存+ 8 核 CPU + 1T 磁盘,但是分配给 redis 进程的是10g内存,一般线上生产环境,redis 的内存尽量不要超过 10g,超过 10g 可能会有问题。
5 台机器对外提供读写,一共有 50g 内存。
因为每个主实例都挂了一个从实例,所以是高可用的,任何一个主实例宕机,都会自动故障迁移,redis 从实例会自动变成主实例继续提供读写服务。你往内存里写的是什么数据?每条数据的大小是多少?商品数据,每条数据是10kb。100 条数据是 1mb,10 万条数据是 1g。常驻内存的是 200 万条商品数据,占用内存是 20g,仅仅不到总内存的 50%。目前高峰期每秒就是 3500左右的请求量。其实大型的公司,会有基础架构的 team 负责缓存集群的运维
参考答案:Redis集群没有使用一致性hash,而是引入了哈希槽的概念,Redis集群有16384个哈希槽,每个key通过CRC16校验后对16384取模来决定放置哪个槽,集群的每个节点负责一部分hash槽
参考答案:Redis并不能保证数据的强一致性,这意味这在实际中集群在特定的条件下可能会丢失写操作
参考答案:异步复制
参考答案:16384个
参考答案:Redis集群目前无法做数据库选择,默认在0数据库
参考答案:可以在同一个服务器部署多个Redis的实例,并把他们当作不同的服务器来使用,在某些时候,无论如何一个服务器是不够的, 所以,如果你想使用多个CPU,你可以考虑一下分片(shard)
参考答案:Redis为单进程单线程模式,采用队列模式将并发访问变成串行访问,且多客户端对Redis的连接并不存在竞争关系Redis中可以使用SETNX命令实现分布式锁。
当且仅当 key 不存在,将 key 的值设为 value。 若给定的 key 已经存在,则SETNX 不做任何动作
SETNX 是『SET if Not eXists』(如果不存在,则 SET)的简写。
返回值:设置成功,返回 1 。设置失败,返回 0 。
参考答案:所谓 Redis 的并发竞争 Key 的问题也就是多个系统同时对一个 key 进行操作,但是最后执行的顺序和我们期望的顺序不同,这样也就导致了结果的不同!推荐一种方案:分布式锁(zookeeper 和 redis 都可以实现分布式锁)。(如果不存在 Redis 的并发竞争 Key 问题,不要使用分布式锁,这样会影响性能)基于zookeeper临时有序节点可以实现的分布式锁。大致思想为:每个客户端对某个方法加锁时,在zookeeper上的与该方法对应的指定节点的目录下,生成一个唯一的瞬时有序节点。 判断是否获取锁的方式很简单,只需要判断有序节点中序号最小的一个。 当释放锁的时候,只需将这个瞬时节点删除即可。同时,其可以避免服务宕机导致的锁无法释放,而产生的死锁问题。完成业务流程后,删除对应的子节点释放锁。在实践中,当然是从以可靠性为主。所以首推Zookeeper
参考答案:既然Redis是如此的轻量(单实例只使用1M内存),为防止以后的扩容,最好的办法就是一开始就启动较多实例。即便你只有一台服务器,你也可以一开始就让Redis以分布式的方式运行,使用分区,在同一台服务器上启动多个实例。一开始就多设置几个Redis实例,例如32或者64个实例,对大多数用户来说这操作起来可能比较麻烦,但是从长久来看做这点牺牲是值得的。这样的话,当你的数据不断增长,需要更多的Redis服务器时,你需要做的就是仅仅将Redis实例从一台服务迁移到另外一台服务器而已(而不用考虑重新分区的问题)。一旦你添加了另一台服务器,你需要将你一半的Redis实例从第一台机器迁移到第二台机器。
参考答案:Redis 官方站提出了一种权威的基于 Redis 实现分布式锁的方式名叫Redlock,此种方式比原先的单节点的方法更安全。它可以保证以下特性:
1.、安全特性:互斥访问,即永远只有一个 client 能拿到锁
2、 避免死锁:最终 client 都可能拿到锁,不会出现死锁的情况,即使原本锁住某资源的 client crash 了或者出现了网络分区
3.、容错性:只要大部分 Redis 节点存活就可以正常提供服务
参考答案:缓存雪崩指的是缓存层支撑不住或宕掉后,导致前后端服务逐渐崩盘到整个服务崩盘的一个过程,解决方案主要有保证缓存层服务高可用性,比如使用Redis Sentinel或Redis Cluster。依赖隔离组件为后端限流熔断并降级。比如使用Sentinel或Hystrix限流降级组件
缓存击穿是指,由于大批量缓存在同一时间失效可能导致大量请求同时穿透缓存直达数据库,可能会造成数据库瞬间压力过大甚至挂掉,对于这种情况我们在批量增加缓存时最好将这一批数据的缓存过期时间设置为一个时间段内的不同
时间
缓存穿透是指查询一个根本不存在的数据, 缓存层和存储层都不会命中, 通常出于容错的考虑, 如果从存储
层查不到数据则不写入缓存层,解决方案可以设置空缓存
缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统。这样就可以避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题!用户直接查询事先被预热的缓存数据!
解决方案
1.、直接写个缓存刷新页面,上线时手工操作一下;
2、数据量不大,可以在项目启动的时候自动进行加载;
3、 定时刷新缓存
当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,仍然需要保证服务还是可用的,即使是有损服务。系统可以根据一些关键数据进行自动降级,也可以配置开关实现人工降级。缓存降级的最终目的是保证核心服务可用,即使是有损的。而且有些服务是无法降级的(如加入购物车、结算)。在进行降级之前要对系统进行梳理,看看系统是不是可以丢卒保帅;从而梳理出哪些必须誓死保护,哪些可降级;比如可以参考日志级别设置预案:
1、 一般:比如有些服务偶尔因为网络抖动或者服务正在上线而超时,可以自动降级;
2.、警告:有些服务在一段时间内成功率有波动(如在95~100%之间),可以自动降级或人工降级,并发送告警;
3、 错误:比如可用率低于90%,或者数据库连接池被打爆了,或者访问量突然猛增到系统能承受的最大阀值,此时可以根据情况自动降级或者人工
降级;
4、 严重错误:比如因为特殊原因数据错误了,此时需要紧急人工降级
热点数据,缓存才有价值,对于冷数据而言,大部分数据可能还没有再次访问到就已经被挤出内存,不仅占用内存,而且价值不大。频繁修改的数据,看情况考虑使用缓存对于热点数据,比如我们的某IM产品,生日祝福模块,当天的寿星列表,缓存以后可能读取数十万次。再举个例子,某导航产品,我们将导航信息,缓存以后可能读取数百万次。数据更新前至少读取两次,缓存才有意义。这个是最基本的策略,如果缓存还没有起作用就失效了,那就没有太大价值了。那存不存在,修改频率很高,但是又不得不考虑缓存的场景呢?有!比如,这个读取接口对数据库的压力很大,但是又是热点数据,这个时候就需要考虑通过缓存手段,减少数据库的压力,比如我们的某助手产品的,点赞数,收藏数,分享数等是非常典型的热点数据,但是又不断变化,此时就需要将数据同步保存到Redis缓存,减少数据库压力
缓存中的一个Key(比如一个促销商品),在某个时间点过期的时候,恰好在这个时间点对这个Key有大量的并发请求过来,这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。
解决方案:
对缓存查询加锁,如果KEY不存在,就加锁,然后查DB入缓存,然后解锁;其
他进程如果发现有锁就等待,然后等解锁后返回数据或者进入DB查询
参考答案:Redisson、Jedis、lettuce等等,官方推荐使用Redisson
参考答案:Redisson是一个高级的分布式协调Redis客服端,能帮助用户在分布式环境中轻
松实现一些Java的对象
参考答案:Jedis是Redis的Java实现的客户端,其API提供了比较全面的Redis命令的支持;Redisson实现了分布式和可扩展的Java数据结构,和Jedis相比,功能较为简单,不支持字符串操作,不支持排序、事务、管道、分区等Redis特性。Redisson的宗旨是促进使用者对Redis的关注分离,从而让使用者能够将精力更集中地放在处理业务逻辑上
参考答案:
(1) memcached所有的值均是简单的字符串,redis作为其替代者,支持更为丰富的数据类型
(2) redis的速度比memcached快很多
(3) redis可以持久化其数据
参考答案:1、加分布式锁机制
2、延时双删机制
参考答案:
1、Master最好不要做任何持久化工作,包括内存快照和AOF日志文件,特别是不要启用内存快照做持久化。
2、如果数据比较关键,某个Slave开启AOF备份数据,策略为每秒同步一次。
3、 为了主从复制的速度和连接的稳定性,Slave和Master最好在同一个局域网内。
4、 尽量避免在压力较大的主库上增加从库
5、 Master调用BGREWRITEAOF重写AOF文件,AOF在重写的时候会占大量的CPU和内存资源,导致服务load过高,出现短暂服务暂停现象。
6、为了Master的稳定性,主从复制不要用图状结构,用单向链表结构更稳定,即主从关系为:Master<–Slave1<–Slave2<–Slave3…,这样的结构也方便解决单点故障问题,实现Slave对Master的替换,也即,如果Master挂了,可以立马启用Slave1做Master,其他不变
参考答案:因为目前Linux版本已经相当稳定,而且用户量很大,无需开发windows版本,
反而会带来兼容性等问题。
参考答案:512M
参考答案:Redis2.6开始redis-cli支持一种新的被称之为pipe mode的新模式用于执行大量
数据插入工作。
参考答案:使用keys指令可以扫出指定模式的key列表。
对方接着追问:如果这个redis正在给线上的业务提供服务,那使用keys指令会有什么问题?
这个时候你要回答redis关键的一个特性:redis的单线程的。keys指令会导致线程阻塞一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。这个时候可以使用scan指令,scan指令可以无阻塞的提取出指定模式的key列表,但是
会有一定的重复概率,在客户端做一次去重就可以了,但是整体所花费的时间会比直接用keys指令长
参考答案:使用list类型保存数据信息,rpush生产消息,lpop消费消息,当lpop没有消息时,可以sleep一段时间,然后再检查有没有信息,如果不想sleep的话,可以使用blpop, 在没有信息的时候,会一直阻塞,直到信息的到来。redis可以通过pub/sub主题订阅模式实现一个生产者,多个消费者,当然也存在一定的缺点,当消费者下线时,生产的消息会丢失
参考答案:使用sortedset,使用时间戳做score, 消息内容作为key,调用zadd来生产消息,消费者使用zrangbyscore获取n秒之前的数据做轮询处理
参考答案:
1、 一个客户端运行了新的命令,添加了新的数据。
2、 Redis检查内存使用情况,如果大于maxmemory的限制, 则根据设定好的策略进行回收。
3.、一个新的命令被执行,等等。
4.、所以我们不断地穿越内存限制的边界,通过不断达到边界然后不断地回收回到边界以下。
如果一个命令的结果导致大量内存被使用(例如很大的集合的交集保存到一个新的键),不用多久内存限制就会被这个内存使用量超越
参考答案:LRU算法