Redis从入门到精通文档笔记

Redis


Nosql概述

NoSQL,泛指非关系型的数据库。随着互联网web2.0网站的兴起,传统的关系数据库在处理web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,出现了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。

分类
  • 键值(Key-Value)存储数据库
  • 列存储数据库
  • 文档型数据库
  • 图形(Graph)数据库
特点
  • 易扩展
  • 大数据量,高性能
  • 灵活的数据模型
  • 高可用

Redis概述

Redis(Remote Dictionary Server ),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。

Redis是单线程的

  • Redis是基于内操作的,CPU不是Redis的瓶颈,Redis的瓶颈是根据机器的内存和网络带宽,所以就使用了单线程来实现。

Redis单线程快的原因

  • Redis是将所有的数据全部放到内存中,所以说使用单线程去操作效率就是最高的,多线程CPU上下文会切换,耗时,对于内存系统来说,如果没有上下文切换的效率是最高的,多次读写都是在一个CPU上的。

五大数据类型

String (字符串)
  • key *:查看所有的key
  • exists key:判断当前的key是否存在
  • move key 1:将key移到1号数据库
  • expire key 10:设置key的过期时间,单位是秒
  • ttl key:查看当前key的剩余时间
  • type key:查看当前key的类型
  • set key value:设置值
  • get key:获得值
  • keys * :获得所有的key
  • append key value:追加字符串,如果当前key不存在,就相当于setkey
  • strlen key:获取字符串的长度
  • incr key:自增1
  • decr key:自减1
  • incr key 10:设置步长,指定增量
  • decr key 10:设置步长,指定减量
  • getrange key 0 3:截取字符串[0,3]
  • getrange key 0 -1:获取全部的字符串
  • setrange key 1 value:替换指定位置开始的字符串
  • setex key 30 value:设置key的值为value,过期时间为30秒
  • setnx key value:如果key不存在则创建key,如果存在则创建失败
  • mset k1 v1 k2 v2 k3 v3:同时设置多个值
  • mget k1 k2 k3:同时获取多个值
  • msetnx k1 v1 k4 v4:msetnv是一个原子性的操作,要么一起成功,要么一起失败
  • getset key value:如果不存在值,则返回nil,并设置值;如果存在值,获取原来的值,并设置新的值
LIst(列表)
  • lpush key value:将一个值或者多个值,插入到列表的头部(左)
  • lrange key 0 -1:获取key中所有的值
  • rpush key value:将一个值或者多个值,插入到列表的尾部(右)
  • lpop key:移除key的第一个元素
  • rpop key:移除key的最后一个元素
  • lindex key index:通过下标获得key中的某一个值
  • llen list:返回列表的长度
  • lrem key count value:移除key集合中指定count的value值
  • ltrim key start stop:通过下标截取指定的长度,并改变key中的值
  • rpoplpush source destination:移除列表的最后一个元素,将他添加到新的列表中
  • lset key index value:如果存在index下标的值则更新为value,不存在则报错
  • exists key:判断这个列表是否存在
  • linsert key before|after pivot value:将某个具体的value值插入到列表中某个元素的前面或者后面
Set(集合)
  • sadd key member:添加值
  • smembers key:查看key中所有值
  • smember key value:判断value值是否在key集合中
  • scard key:获取key集合中的内容元素个数
  • srem key member:移除key集合中的指定元素
  • randmember key [count]:随机抽取key中count数量的元素
  • spop key [count]:随机删除key中count数量的元素
  • smove source destination member:将source中指定的值移动到另外一个set集合中
  • sdiff key [key…]:差集
  • sinter key [key…]:交集
  • sunion key [key…]:并集
Hash(哈希)
  • hset key field value:set一个具体的值,值是一个map集合,field-value
  • hget key field:获取一个字段值
  • hmset key field [key field …]:同时set多个值
  • hmget key field [field…]:同时获取多个值
  • hgetall key:获取所有的值
  • hdel key field [field…]:删除hash指定的field字段,对应的value也会删除
  • hlen key:获取hash表的字段数量
  • hexists key field:判断key中field字段是否存在
  • hkeys key:只获得所有的field
  • hvals key:只获得所有的value
  • hincrby key field increment:指定增量
  • hsetnx key field value:如果存在则设置值,如果存在则不能设置
Zset(有序集合)
  • zdd key score value:增加值
  • zrangebyscore key min max [withscores]:显示全部的用户,从小到大 [附带成绩]
  • zrevrangebyscore key key max min [withscores]:显示全部的用户,从大到小 [附带成绩]
  • zrem key member [member…]:移除有序集合中的指定元素
  • zcard key:获取有序集合中的个数
  • zcount key min max:获取指定区间的成员数量

三种特殊数据类型

geospatial(地理位置)
  • geoadd key 经度 纬度 member:添加数据
  • geopos key member:获得指定城市的经度和纬度
  • geodist key member1 member2 [unit]:查看member1到member2的距离[单位]
  • georadius key 经度 纬度 半径 单位:以这个经度纬度为中性寻找半径以内的位置
  • georadiusbymember key member radius 单位:找出member周围的元素
  • geohash key member:将二维的经纬度转换成一维的字符串
Hyperloglog(基数)
  • pfadd key element:创建一组元素
  • pfcount key:统计key元素的基数数量
  • pfmerge destkey sourcekey [sourcekey…]:合并两组->destkey
Bitmap(位存储)
  • setbit key offset value:设置值
  • getbit key offset:获取值
  • bitcount key [start end]:统计数量

事务

  • Redis事务本质:一组命令的集合,一个事务中所有的命令都会被序列化,在事务执行的过程中,会按照顺序执行。
  • Redis事务没有隔离级别的概念
  • Redis单条命令是保存原子性的,但是事务不保证原子性
redis的事务
  • 开启事务(multi)
  • 命令入队
  • 执行事务(exec) | 放弃事务(discard)

编译型异常(代码有问题,命令有错),事务中所有的命令都不会被执行

运行时异常,如果事务队列中存在语法性,那么执行命令的时候,其他命令式可以正常执行的,错误命令抛出异常

SpringBoot整合

    @Configuration
    public class RedisConfig {
        @Bean
        @SuppressWarnings("all")
        public RedisTemplate<String, Object> redisTemplate(RedisConnectionFactory factory) {
            // 我们为了自己开发方便,一般直接使用       
            RedisTemplate<String, Object> template = new RedisTemplate<String, Object>();
            template.setConnectionFactory(factory);
            // Json序列化配置      
            Jackson2JsonRedisSerializer jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer(Object.class);
            ObjectMapper om = new ObjectMapper();
            om.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY);
            om.enableDefaultTyping(ObjectMapper.DefaultTyping.NON_FINAL);
            jackson2JsonRedisSerializer.setObjectMapper(om);
            // String 的序列化      
            StringRedisSerializer stringRedisSerializer = new StringRedisSerializer();
            // key采用String的序列化方式    
            template.setKeySerializer(stringRedisSerializer);
            // hash的key也采用String的序列化方式    
            template.setHashKeySerializer(stringRedisSerializer);
            // value序列化方式采用jackson  
            template.setValueSerializer(jackson2JsonRedisSerializer);
            // hash的value序列化方式采用jackson      
            template.setHashValueSerializer(jackson2JsonRedisSerializer);
            template.afterPropertiesSet();
            return template;
        }
    }

 
 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28

Redis.conf详解

网络
    bind 127.0.0.1 # 绑定的ip
    protected-mode yes # 保护模式
    port 6379 # 端口设置

 
 
   
   
   
   
  • 1
  • 2
  • 3
通用 GENERAL
    daemonize yes  # 以守护进程的方式运行,默认是no,我们需要自己开启为yes
    pidfile /var/run/redis_6379.pid # 如果以后台的方式运行,我们就需要指定一个pid文件
    # 日志
    # Specify the server verbosity level.
    # This can be one of:
    # debug (a lot of information, useful for development/testing)
    # verbose (many rarely useful info, but not a mess like the debug level)
    # notice (moderately verbose, what you want in production probably)
    # warning (only very important / critical messages are logged)
    loglevel notice
    logfile ""  # 日志的文件位置名
    databases 16 # 数据库的数量,默认是16个
    always-show-logo yes # 是否总是显示logo

 
 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
快照
  • 持久化,在规定的时间内,执行了多少次操作,则会持久化到文件.rdb.aof
  • Redis是内存数据库。,如果没有持久化,那么数据会断点缺失
    save 900 1 # 如果900s内,至少有1个key进行了修改,我们就进行持久化操作
    save 300 10 # 如果300s内,至少有10个key进行了修改,我们就进行持久化操作
    save 60 10000 # 如果60s内,至少有10000个key进行了修改,我们就进行持久化操作
    stop-writes-on-bgsave-error yes # 持久化如果出错,是否还要继续工作
    rdbcompression yes # 是否压缩rdb文件,需要消耗一些cpu资源
    rdbchecksum yes # 保存rdb文件的时候,进行错误的检查校验
    dir ./ # rdb文件保存的目录

 
 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
SECURITY 安全
  • 可以设置redis的密码,默认是没有密码的
    config get requirepass # 获取redis的密码
    config set requirepass password # 设置redis的密码
    auth password # 使用密码进行登录

 
 
   
   
   
   
  • 1
  • 2
  • 3
限制 CLIENTS
    maxclients 10000 # 设置能连接上redis的最大客户端数量
    maxmemory <bytes> # redis配置最大的内存容量
    maxmemory-policy noeviction # 内存达到上限之后的处理策略

 
 
   
   
   
   
  • 1
  • 2
  • 3
APPEND ONLY MODE AOF配置
    appendonly no # 默认是不开启aof模式的,默认是使用rdb方式持久化的,在大部分的情况下,rdb完全够用
    appendfilename "appendonly.aof" # 持久化的文件名名字
    # appendfsync always # 每次修改都会sync,消耗性能
    appendfsync everysec # 每秒执行一次sync,可能会丢失中这1s的数据
    # appendfsync no # 不执行sync,这个时候操作系统自动同步数据,速度最快

 
 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5

Redis持久化

Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。

RDB(Redis DataBase)

在这里插入图片描述

  • Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写到一个临时文件中,等待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是很敏感,那么RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化的数据,可能丢失。
  • RDB保存的文件是dump.rdb,在配置文件中配置的。
触发机制
  • save的规则满足的情况下,会自动触发rdb规则
  • 执行flushallin命令,也会触发rdb规则
  • 退出redis,也会产生rdb文件
恢复rdb文件
  • 只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb,恢复其中的数据
  • 查看需要存在的位置:config get dir

优点:

  • 适合大规模的数据恢复
  • 对数据的完整性要求不高

缺点:

  • 需要一定的时间间隔进程操作,如果redis意外崩溃了,最后一次修改的数据就不会生效
  • fork进程的时候,会占用一定的内存空间
AOF(Append Only File)

在这里插入图片描述
将我们所有的命令都记录下来。

  • 以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。
  • AOF保存的文件是appendonly.aof文件
  • redis-check-aof --fix aof文件:用来修复这个aof文件

优点:

  • 每一次修改都同步,文件的完整性会更好
  • 每秒同步一次,可能会丢失一秒的数据
  • 从不同步,效率是最高的

缺点:

  • 相对于数据文件来说,aof远远大于rdb,修复的数据也比rdb慢
  • aof运行效率也要比rdb慢

扩展:

  • RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储
  • AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始 的数据,AOF命令以Redis 协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重 写,使得AOF文件的体积不至于过大。
  • 只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化
  • 同时开启两种持久化方式 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF 文件保存的数据集要比RDB文件保存的数据集要完整。 RDB 的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?作者 建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有 AOF可能潜在的Bug,留着作为一个万一的手段。

性能建议:

  • 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够 了,只保留 save 900 1 这条规则。
  • 如果Enable AOF ,好处是在恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自 己的AOF文件就可以了,代价一是带来了持续的IO,二是AOF rewrite 的后将 rewrite 过程中产 生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite 的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重 写可以改到适当的数值。
  • 如果不Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔IO,也 减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时倒掉,会丢失十几分钟的数据, 启动脚本也要比较两个 Master/Slave 中的 RDB文件,载入较新的那个,微博就是这种架构。

Redis主从复制

  • 主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点 (master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。 Master以写为主,Slave 以读为主。
  • 默认情况下,每台Redis服务器都是主节点;
  • 且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点

主从复制的作用:

  • 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
  • 故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
  • 负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点,分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
  • 高可用(集群)基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。

一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机),原因如下:

  • 从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较 大;
  • 从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有 内存用作Redis存储内存,一般来说,单台Redis大使用内存不应该超过20G。

原理:

  • Slave 启动成功连接到 master 后会发送一个sync同步命令,Master 接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,master将传送整个数据文件到slave,并完成一次完全同步。
  • 全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中
  • 增量复制:Master 继续将新的所有收集到的修改命令依次传给slave,完成同步

哨兵模式

  • 主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工 干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑 哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵) 架构来解决这个问题。
  • 谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。
  • 哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独 立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。

哨兵的作用:

  • 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器
  • 当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服 务器,修改配置文件,让它们切换主机。
  • 然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。 各个哨兵之间还会进行监控,这样就形成了多哨兵模式。

优点:

  • 哨兵集群,基于主从复制模式,所有的主从配置优点,它全有
  • 主从可以切换,故障可以转移,系统的可用性就会更好
  • 哨兵模式就是主从模式的升级,手动到自动,更加健壮!

缺点:

  • Redis 不好在线扩容,集群容量一旦到达上限,在线扩容就十分麻烦!
  • 实现哨兵模式的配置其实是很麻烦的,里面有很多选择!

Redis缓存穿透和雪崩

缓存穿透(查不到)

缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中(秒 杀!),于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了 缓存穿透。

解决方案:

布隆过滤器

  • 布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力;
  • 当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源;

存在的问题:

  • 如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的空值的键;
  • 即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。
缓存击穿(量太大,缓存过期)
  • 这里需要注意和缓存击穿的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中 对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一 个屏障上凿开了一个洞。
  • 当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询新数据,并且回写缓存,会导使数据库瞬间压力过大。

解决方案:

  • 设置热点数据永不过期
    • 从缓存层面来看,没有设置过期时间,所以不会出现热点 key 过期后产生的问题
  • 加互斥锁
    • 分布式锁:使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩
  • 缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis 宕机!
  • 产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。
  • 其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。

解决方案:

  • redis高可用
    • 这个思想的含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。(异地多活!)
  • 限流降级
    • 这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对 某个key只允许一个线程查询数据和写缓存,其他线程等待。
  • 数据预热
    • 数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。
                                

你可能感兴趣的:(Redis从入门到精通,java,redis,分布式)