2.内部原理分析

过期时间设置

在Redis中提供了Expire命令设置一个键的过期时间,到期以后Redis会自动删除它。这个在我们实际使用过程中用得非常多。

redis 过期删除的原理

消极方法:在主键访问时如果发现它已经失效,那么就删除它

积极方法:周期性地从设置了失效时间的主键中选择一部分失效的主键删除。

redis 发布订阅

发布/订阅模式包含两种角色,分别是发布者和订阅者。
订阅者可以订阅一个或多个频道,而发布者可以向指定的频道发送消息,所有订阅此频道的订阅者都会受到该消息。

redis 的数据是如何持久化的?

RDB根据指定的规则定时将内存中的数据存储在硬盘上。
AOF在每次执行命令后将命令本身记录下来。
可以单独/结合使用。

RDB

当符合一定条件,redis 会单独创建 fork 一个子进程来进行持久化,会先将数据写入一个临时文件 dump.rdb,等到持久化过程都结束了,
再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的。这就确保了极高的性能。
如果需要进行大规模的数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。
RDB唯一的缺点是最后一次持久化后的数据可能丢失。

fork的作用是复制一个与当前线程一样的进程。新进程的所有数据(变量、环境变量、程序计数器)数值都和原进程一致,
但是是一个全新的进程,并作为原进程的子进程。

符合条件

  1. 配置规则
    save seconds changes
    • save :当执行save命令时,Redis同步做快照操作,在快照执行过程中会阻塞所有来自客户端的请求。
      当redis内存中的数据较多时,通过该命令将导致Redis较长时间的不响应。所以不建议在生产环境上使用这个命令,而是推荐使用bgsave命令
    • bgsave :bgsave 命令可以在后台异步地进行快照操作。快照的同时服务器还可以继续响应来自客户端的请求。
      执行BGSAVE后,Redis会立即返回ok表示开始执行快照操作。
      当redis 内存中的数据较多时,通过该命令导致喏、较长时间的
  2. flushall 清空
  3. 执行复制操作

AOF 方式 append-only-file

当使用redis 存储非临时数据时,一般需要打开AOF持久化来降低进程终止导致的数据丢失。
AOF可以将redis执行的每一条命令追加到硬盘文件中。这一过程会降低redis 的性能。
但大部分情况下这个影响是能够接受的。另外使用较快的硬盘可以调AOF性能。

  • auto-aof-rewrite-perecntage 100 当前写入日志文件的大小超过上一次rewrite之后的文件大小的百分之100时就是2倍时触发rewrite。
  • auto-aof-rewrite-min-size 64mb 最小重写大小

redis 内存回收策略 maxmemory-policy

redis提供了多种内存回收策略,当内存容量不足时,为了保证程序的运行,不得不淘汰内存中的一些对象,释放这些对象占用空间。
淘汰对象选择? 已设置过期时间的数据集(server.db[i].expires)

  • 默认的策略是 noeviction。当内存使用达到阈值时,所以引起申请内存的命令都会报错。
  • allkeys-lur:从数据集中挑选最近最少使用的数据淘汰。 应用对缓存的访问都是相对热点数据。
  • volatile-random:从已设置时间的数据集中任意选择数据淘汰。
  • volatile-lur:从已设置时间的数据集中选择最近最少数据淘汰。
  • volatile-ttl:从已设置时间的数据集中挑选将要过期的数据淘汰。

redis 是单进程单线程 来处理来自所有客户端的并发请求。

cpu 并不是redis的瓶颈所在,redis的瓶颈主要机器的内存和带宽。
redis能处理高并发请求,是多路复用的并发IO(一个计算单元来处理来自多个客户端的请求)

多路复用

redis是跑在单线程的,所有操作都是按照顺序线性执行的,但是由于读写操作等待用户输入或者输出都是阻塞的,所以IO操作在一般情况下往往不能直接返回,
这会导致某一文件的IO阻塞导致整个进程无法对其他客户提供服务,而IO多路复用就是为了这个问题出现的。

  • 同步阻塞
  • 同步非阻塞 socket被设置为NONBLOCK
  • IO多路复用:reactor设计模式,异步阻塞IO。java中的selector和linux中的epol都是这种模型
  • 异步IO:经典的proactor设计迷失,也称为异步非阻塞IO

在reids中使用 LUA 脚本

原子性问题:

redis虽然是单一线程的,但是仍然会存在线程安全问题。不是来自于redis的服务器内部。
而是redis作为数据服务器,是提供给多个客户端使用的。多个客户端的操作就相当于同一个进程下的多个线程。
如果多个客户端之间没有做好数据的同步策略,就会产生数据不一致的情况。

效率

基于内存的数据库

LUA 脚本

  1. 减少网络开销,在lua脚本中可以把多个命令放在同一个脚本中运行
  2. 原子操作:redis回想整个脚本作为一个命令执行,中间不会被其他命令插入。脚本执行过程中无需担心会出现竞态条件。
  3. 复用性:客户端发送的脚本会永远存储在redis中。复用。
local key = "ratelimit:"..KEYS[1]

local limit = tonumber(ARGV[1])

local expireTime = ARGV[2]

local times = redis.call('incr',key)

if times == 1 then
        redis.call('expire',key,expireTime)
end

if times > limit then
        return 0
end

return 1

evalsha命令

  1. script load "return redis.call('set','lua','00')" 将脚本加入缓存。并未执行命令
  2. 执行evalsha命令 evalsha "id"

你可能感兴趣的:(2.内部原理分析)