从面试的角度学习Redis

为什么要使用Redis?

Redis是目前开发中非常好用的中间件,他有丰富的缓存结构,具有高性能高可用高扩展的特性;

Redis这么好用,有哪几种数据类型,他们的数据结构分别是什么?

string:简单动态字符串;【满足大部分需求】;
hash:压缩列表+哈希表
set:哈希表+整数数组
list:压缩数组+双向链表
sortedSet:压缩列表+跳表
压缩列表:
是一种内存用到极致的数据结构,高效利用内存,利用CPU缓存机制。
跳表
其实就是链表的形式存储数据,然后会从每个节点,抽取一部分节点作为索引。
查询的时候,经过一层层索引的方式,最终找到想要的数据,他的时间复制度是O(logn)。

Redis吞吐量这么高,说说他的线程模型?

Redis实现的线程模型主要是IO多路复用技术。他是通过单线程的方式,维护每个客户端的连接和获取事件,当客户端发送事件的时候,该线程就会将对应的事件发送到事件处理器中(事件队列),然后通过处理事件后,通过回调的方式,返回给对应的处理事件的结果。
这种方式的好处是避免了线程切换带来的开销,也避免了数据竞争的情况。

Redis的持久化是怎么回事,你能说说吗?

Redis的持久化,就是为了容灾,避免因为重启以后,数据会大面积的丢失。Redis提供给了我们两套持久化的机制。AOFRDB。如果系统中同时有AOF日志和RDB日志,会优先用AOF日志进行恢复。

AOF

AOF(append only file)。是一种增量的持久化方式,会记录Redis对数据的操作指令,因此数据量会比较全,适合作为热备份的数据。一般会有三种方式:
1.每次操作都记录日志;
2.将每s生成的操作记录都记录;
3.让操作系统去决定啥时候记录日志;
AOF的限制和解决方式
我们知道AOF是不断的写文件的,那么就会有问题,文件不可能无限膨胀。因此,需要出一套机制,去将我们的日志进行缩身。这就是AOF的重写机制。
控制AOF重写的参数:

auto-aof-rewrite-percentage 100 #AOF文件大小较上次重写超过100%时进行重写
auto-aof-rewrite-min-size 64mb #aof文件大小超过64m时重写

AOF的重写机制记住一句话“一份拷贝,两处日志”
1.首先会从主线程fork一个子线程,复制一份当前内存中的值;
2.两处日志指的是:会继续往AOF日志文件写日志,同时也会往AOF重写日志中写日志;
3.最后生成对应的日志文件会去代替旧的日志文件。

RDB

RDB其实内存快照,Redis也提供给我们参数去调整,什么时候生成一份当前的内存快照。这种方式适合作为冷备份。他的工作原理是:
1.使用bgsave指令fork一个子进程,然后获取当前的全量数据;
2.生成一份二进制文件;

RDB VS AOF

1.AOF的数据全,但是由于保存的是指令,恢复起来比较慢;
2.RDB因为是快照,因此如果宕机了,数据的完整度没有AOF高;
3.一般是AOF+RDB的方式。比如说T1时刻,RDB生成了快照,那么再T2的时刻这段时间对key值得修改,则用AOF记录。到了T2时刻RDB生成快照的时刻,则清除AOF日志(因为这个时候RDB已经是最新的数据了)

说说你们公司用的Redis是什么架构

Redis的架构主要有以下几种:
1.单机:单点故障,风险极大,挂了就没了;
2.主从架构:主从架构可以读写分离,不断的增加从库,从而提供吞吐量。但是master如果挂了,那就没办法对外提供写服务了。
3.哨兵模式:哨兵模式,其实就是另外一个进程复制监控主从架构,如果主库的master挂了,那就从slave中选出新的master,然后继续对外提供服务。但是哨兵也有一个缺点,就是写的话只有一个master写,会出现写瓶颈。
4.Redis Cluster模式:集群模式,支持横向扩展,去中心化,每一个实例都是master。每个master都可以进行读写,因此扩展性非常高,可用性非常好。

主从架构

主从架构的工作模式是,先确定主库,从库,从库通过
replicaof xxxxx设置。master 向slave开始的时候传输一份全量的RDB快照文件,后面的话是通过指令的方式同步。

image.png

ps
Redis提供了网络连接断开,断点续传的功能。会有一个佳作repl_backlog的日志文件,复制记录传输的进度。如果是网络断开了,那么后续的传输,就会基于master-node和slave-node之间的offerset进行后续的传输。

哨兵机制

哨兵其实就是一个监控Redis主从架构的一个进程。哨兵的互相之间的通信只要是通过pub/sub订阅的机制,大家都订阅再master上的频道__sentinel__:hello。然后互通信息,通过info指令,从master上知道从库的信息。哨兵的主要功能是:监控、选举,通知。
监控
监控的话,是监控主库是是否下线,这个是由多个哨兵投票去决定的。哨兵首先会觉得主库主观下线,如果通过N/2+1投票决定都认为这个主库主观下线,那么该主库就会客观下线,从而进行下一步的选举工作;
选举
选举工作主要是重新选举一个新的主库。这个时候主要是涉及两方面,一个是哪个哨兵来执行切换,一个是确定新的主库。
如何确定新的主库?
1.剔除网络不好的;
2.优先级高的,先作为主库【可能不同从库间的内存配置是不一样的,可以为不同从库设置优先级】
3.数据同步最大的。通过比较每种从库中的slave_repl_offset。
4.如果前两项都相同,那么就取从库中runId最小的。
如何确定哪个哨兵去执行主从切换?
首先哨兵集群会通过quorum的参数大小,比如说有5台机器,然后quorum的大小为3。如果为3的话,那么该主库就会被客观下线。
然后选举哨兵复制主从切换,这个时候如果有
1.>=quorum值,
2.并且获得半数以上的赞成票
才可以确定哪个哨兵进行主从切换。
通知
选出新主库后,通知客户端和从库。

Redis Cluster

RedisCluster的出现是为了解决master无法支撑高并发的写。因为上述的两种架构始终存在一个问题就是只有一个主库,后续如果体量上去了,那么还是无法存储大量的数据,因此Redis 的集群模式是靠谱的。
redis cluster有固定的16384个hash slot,对每个key计算CRC16值,然后对16384取模,可以获取key对应的hash slot。
并且,对于每一个实例,都可以建立对应的slave,已达到高可用的目的(和哨兵差不多)。

你可能感兴趣的:(从面试的角度学习Redis)