首先面试redis的基础知识:
我:redis有5种数据结构:String,Hash,List,Set,SortedSet
其他数据结构有:HyperLog,Geo,Pub/Sub(订阅与发布)
还有用于防止缓存击透的数据结构:Redis Module
然后还有一个设置key值的过期时间 :setRedis(Key,value,time+Math.random()*10000); expire
我:(妈耶这么快就直接到锁了嘛?我假装淡定)这个可以使用setnx这个命令来实现,首先用setnx来争抢锁,抢到之后,在用expire给锁加一个过期时间,用来防止自己在之后的操作忘记释放锁导致锁死,当然这里一般处理完成都可以手动释放锁,然后如果在setnx之后执行expire之前进程意外crash或者要重启维护,就需要把setnx和expire合成一条指令来用。
我:Redis是单线程的,keys指令会导致线程阻塞一段时间,线上的服务会停顿,知道指令执行完毕,服务才能恢复。相比于scan指令可以无阻塞的提取出指定模式的key列表,但是会有一定的重复概率,在客户端做一次去重就可以了,但是总体的时间花费是要比keys命令长的。
smembers命令可以返回集合键当前包含的所有元素。
对于scan这类增量式迭代命令来说,因为在对键进行增量式迭代的过程中,键可能会被修改,所以增量式迭代命令只能对被返回值的元素提供有限的保证。
我:首先redis有异步队列和一个延时队列,
异步队列:
1.list结构作为队列,rpush生产消息。lpop消费消息,当lpop没有消息的时候,要适当的sleep一会再重试。
2.list还有一个指令叫blpop,在没有消息的时候,他会阻塞直到消息到来。
3.pub/sub主题订阅模式,可以实现1:N的消息队列,实现生产一次,消费多次
4.pub/sub主题订阅模式,消费者下线的情况下,生产的消息会丢失,得使用专业的消息队列,如kafka ,rabbitMQ
延时队列:
sortedset,那时间戳作为score,消息内容作为ke调用zadd来生产消息,消费者用zrangebyscore指令获取N秒之前的数据轮询进行处理。
我:首先Redis是支持持久化操作的,这个是毋庸置疑,然后redis的持久化机制有两种,一种是AOF的方式,一种是RDB的方式做的持久化。
先说说RDB做持久化:RDB做镜像全量的持久化,AOF做增量持久化,首先因为RDB会耗费较多的时间和资源,不够实时,在停机的时候回导致大量的丢失数据,所以需要AOF日志信息来配合使用,首先恢复RDB中的数据,然后用AOF来恢复剩余的数据,因为RDB数据恢复来说是比较容易的,所以先RDB恢复一部分完整数据。
在redis实例重启时,会使用RDB持久化文件重新构建内存信息,在使用AOF从放近期的操作指令来实现完整恢复重启之前的状态。
然后Redis本身的机制是AOF持久化开启且存在Aof文件时,有限加载AOF文件;AOF关闭或者AOF文件不存在时,加载RDB文件;加载AOF/RDB文件后,redis启动成功,AOF/RDB文件存在错误时,redis启动失败并且打印错误信息。
我:AOF日志的sync属性的配置,如果不要求性能,在每条指令都sync一下磁盘,就不会丢失数据,但是这在高性能的情况下是不行的,高性能要求sync磁盘一般如果是一秒一次,那么断电就会造成一秒的数据丢失。
顺便说一下RDB的原理:Fork是指redis用过创建子线程来进行RDB操作,cow指的是copy on write ,子进程创建后,父进程共享数据段,父进程继续提供读写服务,写脏的页面数据,会逐渐与子进程分离开来。
pipeline的好处:可以将多次io往返的时间缩短为一次,前提是pipeline执行的指令之间没有因果关系;
我:Redis有三种集群模式,分别是:
主从模式:主从模式是三种模式中最简单的,在主从复制中,数据库分为两类:主数据库(master)和从数据库
主从复制的特点:
工作机制:
当slave启动后,主动向master发送SYNC命令。master接收到SYNC命令后在后台保存快照(RDB持久化)和缓存保存快照这段时间的命令,然后将保存的快照文件和缓存的命令发送给slave。slave接收到快照文件和命令后加载快照文件和缓存的执行命令。
复制初始化后,master每次接收到的写命令都会同步发送给slave,保证主从数据一致性。
缺点:
从上面可以看出,master节点在主从模式中唯一,若master挂掉,则redis无法对外提供写服务。
Sentinel模式(哨兵模式):
主从模式的弊端就是不具备高可用性,当master挂掉以后,Redis将不能再对外提供写入操作,因此sentinel应运而生。
sentinel中文含义为哨兵,顾名思义,它的作用就是监控redis集群的运行状况,特点如下:
工作机制:
Cluster模式:
Cluster模式介绍:
sentinel模式基本可以满足一般生产的需求,具备高可用性。但是当数据量过大到一台服务器存放不下的情况时,主从模式或sentinel模式就不能满足需求了,这个时候需要对存储的数据进行分片,将数据存储到多个Redis实例中。cluster模式的出现就是为了解决单机Redis容量有限的问题,将Redis的数据根据一定的规则分配到多台机器。
cluster可以说是sentinel和主从模式的结合体,通过cluster可以实现主从和master重选功能,所以如果配置两个副本三个分片的话,就需要六个Redis实例。因为Redis的数据是根据一定规则分配到cluster的不同机器的,当数据量过大时,可以新增机器进行扩容。
使用集群,只需要将redis配置文件中的cluster-enable配置打开即可。每个集群中至少需要三个主数据库才能正常运行,新增节点非常方便。
cluster集群特点:
我:RDB:RDB是作为冷备的,RDB持久化机制,是对Redis中的数据执行周期的持久化。
优点:RDB对Redis的性能影响非常的小,是因为在同步数据的时候他只是fork了一个子进程去做持久化的,而他在数据恢复时候的速度比AOF来的块。
缺点:RDB都是快照文件,都是默认5分钟甚至更久才会生成一次备份,这就意味着你这次同步到下次同步这中间的数据都很有可能全部丢失,AOF则最多丢失一秒的数据,RDB在生成树快照的时候,如果文件过大,客户端肯会暂停几毫秒到几秒。
AOF:作为redis的热备,AOF机制对每条写入命令作为日志以append-only 的模式写入一个日志文件中
优点:AOF是一秒一次去通过一个后台的线程fsync操作,那最多丢失这一秒的数据,AOF在对日志文件进行操作的时候回是以append-only的方式去写的,他只是追加的方式写数据,自然少了很多磁盘寻址的开销。
缺点:对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大,恢复速度慢。
我:首先内存淘汰机制即过期策略有:
定期删除:默认100ms就随机抽一些过时间的key,去检查是否过期,过期就删除
惰性删除:我不主动删除,等人来查询,看看有没有过期,过期了就删除,没有过期就给你返回值。
定期没有删除,我也没有去查询,怎么办? 这就需要淘汰机制的设定。
然后redis和memcache的区别如下:
首先 redis相比memcached来说,拥有跟多的数据结构,能支持更丰富的数据操作。
在redis3.x版本中可以支持cluster模式,而memcached没有原生的集群模式,需要依赖客户端来实现往集群中分片写入数据。
redis只使用单核,而memcached可以使用多核,所以平均每一个核上redis在存储小数据时比memcached性能更高。
好的,这次redis的面试就到这里,小伙子很不错,基本的问题都答出来了,回去等下一次面试消息吧,顺便说一下下一次的面试内容会是大数据相关的哟,多复习复习。