Redis 知识点总结(持续更新中)

文章目录

  • 1.概述
    • 1.1、什么是Redis
    • 1.2.Redis的优点和缺点
    • 1.3 Redis 的特点
    • 1.4 Redis和memcached相比,有哪些优势
    • 1.5 为什么Redis 是单线程的
    • 1.6 Redis和Redisson有什么关系
  • 2.数据类型
    • 2.1 Redis 支持哪几种数据类型
    • 2.1 Redis有哪些适合的场景?
  • 3.持久化
    • 3.1 什么是Redis持久化?
    • 3.2 如何选择合适的持久化方式
  • 4.缓存异常
    • 4.1 缓存穿透
    • 4.2 缓存击穿
    • 4.3 缓存雪崩
  • 5. redis的过期策略以及内存淘汰机制
    • 5.1 Redis 内存淘汰机制
    • 5.2 Key的过期策略

1.概述

1.1、什么是Redis

Redis是一个完全开源免费的,遵循BSD协议的高性能Key-Value类型的额内存数据库。因为是纯内存操作,Redis 的性能非常出色,每秒可以处理超过10万次的读写操作,是已是最快的Key-Value类型的Key-Value数据库。而且Redis是一个NOSQL类型数据库,是为了解决高并发、高扩展,大数据存储等一系列问题而产生的数据库解决方案,是一个非关系型的数据库。但是它无法替代关系型数据库,只能作为特定环境下的扩充。

1.2.Redis的优点和缺点

优点

  • redis数据读写速度非常快,因为它把数据都读取到内存中操作,而且Redis使用C语言编写的,是最接近操作系统的语言,所以执行速度快。

  • redis虽然数据都存在内存中,但最终还支持数据持久化到硬盘当中。

  • redis提供了丰富的数据结构

  • redis所有操作都具有原子性,支持事务,所谓原子性就是对数据的更改要么全执行,要么全部不执行。

  • redis支持主从复制,主机会自动同步数据到从机,可以进行读写分离。
    缺点

  • 由于是内存数据库,所以,单台机器,存储的数据量,跟机器本身的内存大小。虽然redis本身有key过期策略,但是还是需要提前预估和节约内存。如果内存增长过快,需要定期删除数据。

  • 如果进行完整重同步,由于需要生成rdb文件,并进行传输,会占用主机的CPU,并会消耗现网的带宽。不过redis2.8版本,已经有部分重同步的功能,但是还是有可能有完整重同步的。比如,新上线的备机。

  • 修改配置文件,进行重启,将硬盘中的数据加载进内存,时间比较久。在这个过程中,redis不能提供服务。

1.3 Redis 的特点

  1. 因为是内存数据库,所以性能非常出色
  2. 可持久化(定时异步从内存中flush到硬盘)
  3. 支持多种数据类型(Strings、Lists、Sets、Sorted Set、hashs)
  4. redis是单进程单线程(利用队列技术将并发访问变成串行访问)
  5. 支持主从模式(slave启动时会连接master来同步数据,读写分离)

1.4 Redis和memcached相比,有哪些优势

首先介绍一下memcached,Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信。
二者区别在于

  1. Redis 做缓存可以持久化,memcached做缓存,数据容易丢失。
  2. Resis 可以存放多种数据类型(string、list、set、hash、Sorted),而memcached只能存储字符串。
  3. Redis 服务器仅支持单进程单线层的访问,也就是后来先来后到的串行模式,避免线程上下文切换,自然保证了数据操作的原子性,Memcached服务端是支持多线程访问的。
  4. Redis虽然是单进单线程的模式,但是redis使用的IO多路复用技术保证了同一个线程能够处理多个请求。
  5. Redis 的速度比memcached快很多。
  6. Redis的单个Value最大限制为1GB,而memcached最大限制为1MB。

1.5 为什么Redis 是单线程的

因为Redis是基于内存的操作,CPU不是Redis的瓶颈,Redis的瓶颈最有可能就是机器内存的大小或者网络带宽。既然单线程容易实现,而且CPU还不会成为瓶颈,所以当然要用单线程方案了,毕竟多线程方案会带来许多的麻烦。
而且Redis使用的是多路I/O复用模型,非阻塞IO。
多路IO复用模型是利用select,poll,epoll来监察多个流的I/O事件的能力,在空闲时,会把当前进程阻塞掉,当有一个或多个流有I/O事件时,就从阻塞态中唤醒,于是程序就会轮询一遍所有的流(epoll是值轮询那些真正发出事件的流),并且只依次顺序处理就绪的流,从而避免了大量无用工作。
多路指的是多个网络连接,而复用指的是复用同一个线程。Redis采用多路I/O复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络连接消耗)。

1.6 Redis和Redisson有什么关系

Redis是一个高级的分布式协调Redis客服端,能帮助用户在分布式环境下轻松实现一些Java的对象。(Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。

2.数据类型

2.1 Redis 支持哪几种数据类型

StringListSetHashSorted Set

2.1 Redis有哪些适合的场景?

(1)会话缓存(Session Cache)
最常用的一种使用Redis的情景是会话缓存(session cache)。用Redis缓存会话比其他存储(如Memcached)的优势在于:Redis提供持久化。当维护一个不是严格要求一致性的缓存时,如果用户的购物车信息全部丢失,大部分人都会不高兴的,现在,他们还会这样吗?
幸运的是,随着 Redis 这些年的改进,很容易找到怎么恰当的使用Redis来缓存会话的文档。甚至广为人知的商业平台Magento也提供Redis的插件。
(2)全页缓存(FPC)
除基本的会话token之外,Redis还提供很简便的FPC平台。回到一致性问题,即使重启了Redis实例,因为有磁盘的持久化,用户也不会看到页面加载速度的下降,这是一个极大改进,类似PHP本地FPC。
再次以Magento为例,Magento提供一个插件来使用Redis作为全页缓存后端。
此外,对WordPress的用户来说,Pantheon有一个非常好的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。
(3)队列
Reids在内存存储引擎领域的一大优点是提供 list 和 set 操作,这使得Redis能作为一个很好的消息队列平台来使用。Redis作为队列使用的操作,就类似于本地程序语言(如Python)对 list 的 push/pop 操作。
如果你快速的在Google中搜索“Redis queues”,你马上就能找到大量的开源项目,这些项目的目的就是利用Redis创建非常好的后端工具,以满足各种队列需求。例如,Celery有一个后台就是使用Redis作为broker,你可以从这里去查看。
(4)排行榜/计数器
Redis在内存中对数字进行递增或递减的操作实现的非常好。集合(Set)和有序集合(Sorted Set)也使得我们在执行这些操作的时候变的非常简单,Redis只是正好提供了这两种数据结构。所以,我们要从排序集合中获取到排名最靠前的10个用户–我们称之为“user_scores”,我们只需要像下面一样执行即可:
当然,这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数,你需要这样执行:
ZRANGE user_scores 0 10 WITHSCORES
Agora Games就是一个很好的例子,用Ruby实现的,它的排行榜就是使用Redis来存储数据的,你可以在这里看到。
(5)发布/订阅
最后(但肯定不是最不重要的)是Redis的发布/订阅功能。发布/订阅的使用场景确实非常多。我已看见人们在社交网络连接中使用,还可作为基于发布/订阅的脚本触发器,甚至用Redis的发布/订阅功能来建立聊天系统!

3.持久化

3.1 什么是Redis持久化?

用一句话概括持久化,就是把数据(内存中的对象)保存到可以永久保存的存储设备中。
Redis提供了两种持久化方式:
RDB持久化方式:能够在指定的时间间隔对你的数据库进行快照存储到硬盘上。

AOF持久化方式:以日志的形式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据状态。但当Redis进程或停电等问题可能会造成几分钟的写入丢失。

3.2 如何选择合适的持久化方式

一般来说,如果想达到足以媲美PostgreSQL的数据安全性,你应该同时使用两种持久化功能。如果你非常关心你的数据,但仍然可以承受数分钟之内的数据丢失,那么你可以只使用RDB持久化。
许多用户都只使用AOF持久化,但并不推荐这种方式:因为定时生成RDB快照(shapshot)非常便于进行数据库备份,并且RDB恢复数据集的速度页要比AOF恢复的速度要快,除此之外,使用RDB还可以避免之前提到的AOF程序的bug。

4.缓存异常

4.1 缓存穿透

**定义:**缓存穿透是指查询一个一定不存在的数据,由于缓存是不命中,将去查询数据库,但是数据库也无此记录,并且处于容错考虑,我们没有将这次查询的null写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,造成安全问题。

解决办法:

  • 方法1:使用布隆过滤器,把所有的数据存到一个足够大的bitmap中,一个一定不存在的数据会被 这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。
  • 方法2:如果一个查询返回的数据为空(不管是数据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。

4.2 缓存击穿

**定义:**对于一些设置了过期时间的key,如果这些key可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:如果这个key在大量请求同时进来前正好失效,那么所有对这个key的数据查询都落到db,我们称为缓存击穿。
和缓存雪崩的区别:

缓存击穿是这样的:
Redis 知识点总结(持续更新中)_第1张图片
缓存雪崩是这样的:
Redis 知识点总结(持续更新中)_第2张图片
解决办法:

  • 方法1:使用互斥锁排队,一种非常普遍的做法,当key获取的value值为空时,加锁;从数据库中读出数据后,再把锁释放。若其它线程获取锁失败,则等待一段时间后重试。
  • 方法2:接口限流与熔断、降级。对重要接口及性能限流,防止被恶意刷接口,同时要降级准备,当接口中的某些服务不可用时候,进行熔断,失败快速返回机制。
  • 方法3:使用布隆过滤器,首先判断key是否存在,不存在直接返回。

4.3 缓存雪崩

**定义:**当缓存服务器重启或者大量缓存集中在某一个时间段失效时,这样在失效的情况下,会给DB造成很大的压力。具体来说,就是大量的key集体发生了缓存击穿,就是造成了缓存雪崩。
解决方法:

  • 方法1:和穿透一样,使用分布式锁,对key进行加锁。
  • 方案2:搭设redis集群,一台罢工后,其它的还可以继续工作。
    **方案3:**给缓存的失效时间,加上一个随机值,避免集体失效。

5. redis的过期策略以及内存淘汰机制

5.1 Redis 内存淘汰机制

首先我们知道要设置Redis 的最大内存大小只需要在配置文件redis.conf 中配置一行 maxmemory xxx 即可,或者我们通过 config set 命令在运行时动态配置 Redis 的内存大小。

那么当Redis的内存不够时,我们需要通过某种策略来淘汰数据。在配置文件中使用maxmemory-policy来配置策略。
策略的值如下:

  • volatile-lru: 在所有带有过期时间的 key 中使用 LRU 算法淘汰数据;
  • alkeys-lru: 在所有的 key 中使用最近最少被使用 LRU 算法淘汰数据,保证新加入的数据正常;
  • volatile-random: 在所有带有过期时间的 key 中随机淘汰数据;
  • allkeys-random: 在所有的 key 中随机淘汰数据;
  • volatile-ttl: 在所有带有过期时间的 key 中,淘汰最早会过期的数据;
  • noeviction: 不回收,当达到最大内存的时候,在增加新数据的时候会返回 error,不会清除旧数据,这是 Redis 的默认策略;

olatile-lru, volatile-random, volatile-ttl 这几种情况在 Redis 中没有带有过期 Key 的时候跟 noeviction 策略是一样的。

策略执行的过程

  1. 客户端运行命令,添加数据申请内存
  2. Redis会检测内存的使用情况,如果超出最大限制,就用内存淘汰算法淘汰对应的key。
  3. 继续执行命令

近似的LRU算法
Redis 中的LRU算法不是精确的LRU算法,而是采样LRU。在Redis 3.x中做过优化,效率得到了很大提升。原文说不使用精准LRU是因为会耗费很多内存。

5.2 Key的过期策略

通过 redis> set name aaa ex 100 命令我们在redis中设置一个key为name,值为aaa的数据。

Redis对于过期键有三种清除策略:

  1. **被动删除:**当读/写一个已经过期的key时,会触发惰性删除策略,直接删除掉这个过期key
  2. **主动删除:**由于惰性删除策略无法保证冷数据被及时删掉,所以Redis会定期主动淘汰一批已过期的key
  3. **内存淘汰:**当前已用内存超过maxmemory限定时,触发主动清理策略

被动删除: 只有key被操作时(如GET),REDIS才会被动检查该key是否过期,如果过期则删除之并且返回NIL。
这种策略对CPU友好,因为它只有在不得不的情况下猜会进行,不会浪费CPU资源。但对内存不友好,因为如果存在大量过期键又很少被访问,会造成大量内存空间浪费。

主动删除: 在Redis 中,常规操作由redis.c/serverCron实现。会在服务i其开启期间一直保持周期运行。在redis2.6 版本中,程序规定serverCron每秒运行10次。这种主动删除策略弥补了被动删除策略在内存上的不友好。因此,Redis会周期性的随机测试一批设置了过期时间的key并进行处理。测试到的已过期的key将被删除。典型的方式为,Redis每秒做10次如下的步骤:

  1. 随机测试100个设置了过期时间的key
  2. 删除所有发现的已过期的key
  3. 若删除的key超过25个则重复步骤1

并且当Redis运行在主从模式时,只有主节点猜会执行上述两种过期策略,然后把删除操作del key同步到从节点。

你可能感兴趣的:(#,Redis)