redis实现原理或机制
redis是⼀个key-value存储系统。和Memcached类似,但是解决了断电后数据完全丢失的情
况,⽽且她⽀持更多⽆化的value类型,除了和string外,还⽀持lists(链表)、sets(集合)和
zsets(有序集合)⼏种数据类型。这些数据类型都⽀持push/pop、add/remove及取交集并集
和差集及更丰富的操作,⽽且这些操作都是原⼦性的。
Redis是⼀种基于客户端-服务端模型以及请求/响应协议的TCP服务。这意味着通常情况下⼀个
请求会遵循以下步骤:
客户端向服务端发送⼀个查询请求,并监听Socket返回,通常是以阻塞模式,等待服务端响应。服务端处理命令,并将结果返回给客户端。
在服务端未响应时,客户端可以继续向服务端发送请求,并最终⼀次性读取所有服务端的响应。
Redis管道技术最显著的优势是提⾼了 redis 服务的性能。
分区是分割数据到多个Redis实例的处理过程,因此每个实例只保存key的⼀个⼦集。
通过利⽤多台计算机内存的和值,允许我们构造更⼤的数据库。
通过多核和多台计算机,允许我们扩展计算能⼒;通过多台计算机和⽹络适配器,允许我们扩展⽹络带宽。
redis的⼀些特性在分区⽅⾯表现的不是很好:
涉及多个key的操作通常是不被⽀持的。举例来说,当两个set映射到不同的redis实例上时,你就不能对这两个set执⾏交集操作。
涉及多个key的redis事务不能使⽤。当使⽤分区时,数据处理较为复杂,⽐如你需要处理多个rdb/aof⽂件,并且从多个实例和主机备份持久化⽂件。
增加或删除容量也⽐较复杂。redis集群⼤多数⽀持在运⾏时增加、删除节点的透明数据平衡的能⼒,但是类似于客户端分区、代理等其他系统则不⽀持这项特性。然⽽,⼀种叫做presharding的技术对此是有帮助的。
Redis 有两种类型分区
最简单的分区⽅式是按范围分区,就是映射⼀定范围的对象到特定的Redis实例。
⽐如,ID从0到10000的⽤户会保存到实例R0,ID从10001到 20000的⽤户会保存到R1,以此类
推。
这种⽅式是可⾏的,并且在实际中使⽤,不⾜就是要有⼀个区间范围到实例的映射表。这个表
要被管理,同时还需要各 种对象的映射表,通常对Redis来说并⾮是好的⽅法。
哈希分区:另外⼀种分区⽅法是hash分区。这对任何key都适⽤,也⽆需是object_name:这种
形式,像下⾯描述的⼀样简单:
⽤⼀个hash函数将key转换为⼀个数字,⽐如使⽤crc32 hash函数。对key foobar执⾏
crc32(foobar)会输出类似93024922的整数。
对这个整数取模,将其转化为0-3之间的数字,就可以将这个整数映射到4个Redis实例中的⼀个
了。93024922 % 4 = 2,就是说key foobar应该被存到R2实例中。注意:取模操作是取除的余
数,通常在多种编程语⾔中⽤%操作符实现。
实际上,上⾯的集群模式还存在两个问题:
1. 扩容问题:
因为使⽤了⼀致性哈稀进⾏分⽚,那么不同的key分布到不同的Redis-Server上,当我们需
要扩容时,需要增加机器到分⽚列表中,这时候会使得同样的key算出来落到跟原来不同的
机器上,这样如果要取某⼀个值,会出现取不到的情况,对于这种情况,Redis的作者提出
了⼀种名为Pre-Sharding的⽅式:
Pre-Sharding⽅法是将每⼀个台物理机上,运⾏多个不同断⼝的Redis实例,假如有三个物
理机,每个物理机运⾏三个Redis实际,那么我们的分⽚列表中实际有9个Redis实例,当
我们需要扩容时,增加⼀台物理机,步骤如下:
1. 在新的物理机上运⾏Redis-Server;
2. 该Redis-Server从属于(slaveof)分⽚列表中的某⼀Redis-Server(假设叫RedisA);
3. 等主从复制(Replication)完成后,将客户端分⽚列表中RedisA的IP和端⼝改为新物理
机上Redis-Server的IP和端⼝;
4. 停⽌RedisA。
这样相当于将某⼀Redis-Server转移到了⼀台新机器上。Prd-Sharding实际上是⼀种在线
扩容的办法,但还是很依赖Redis本身的复制功能的,如果主库快照数据⽂件过⼤,这个复
制的过程也会很久,同时会给主库带来压⼒。所以做这个拆分的过程最好选择为业务访问
低峰时段进⾏。
2. 单点故障问题:
还是⽤到Redis主从复制的功能,两台物理主机上分别都运⾏有Redis-Server,其中⼀个
Redis-Server是另⼀个的从库,采⽤双机热备技术,客户端通过虚拟IP访问主库的物理
IP,当主库宕机时,切换到从库的物理IP。只是事后修复主库时,应该将之前的从库改为
主库(使⽤命令slaveof no one),主库变为其从库(使命令slaveof IP PORT),这样才
能保证修复期间新增数据的⼀致性。