Redis集群(主从复制、哨兵模式)

文章目录

  • 前言
  • 一、Redis群集介绍
  • 二、redis主从复制
    • 1、主从复制的基本介绍
    • 2、主从复制的流程
  • 三、哨兵模式
    • 1、哨兵的主要功能
    • 2、哨兵监控系统节点的过程
    • 3、哨兵下的故障迁移
    • 4、优缺点
  • 四、Cluster群集
  • 五、实验部署
    • (一)搭建主从复制
    • (二)搭建哨兵模式
    • (三)搭建Redis集群模式
      • 1、所有节点
      • 2、Master1节点
      • 3、其余节点
      • 4、所有节点

前言

  • redis群集有三种模式,分别是主从同步/复制、哨兵模式、cluster,下面会讲解一下三种模式的工作方式,以及如何搭建Cluste r群集
  • 在Redis中,实现高可用的技术主要包括持久化、主从复制、哨兵和集群,下而分别说明它们的作用,以及解决了什么样的问题。

1. 主从复制

  • 主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对 于读操作的负载均衡和简单的故障恢复。
  • 缺陷:故障恢复无法自动化;写操作无法负载均衡;存储能力受到单机的限制。

2. 哨兵

  • 在主从复制的基础上,哨兵实现了自动化的故障恢复。
  • 缺陷:写操作无法负载均衡;存储能力受到单机的限制。

3. 集群

  • 通过集群,Redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。

一、Redis群集介绍

  • ①oredis是一个开源的key
    value存储系统,受到了广大互联网公司的青睐。redis3.0版本之前只支持单例模式,在3.0版本及以后才支持集群
    redis集群采用P2P模式,是完全去中心化的,不存在中心节点或者代理节点;
  • ②为了实现集群的高可用,即判断节点是否健康(能否正常使用),redis-cluster有一个投票容错机制:
    如果集群中超过半数的节点投票认为某个节点挂了,那么这个节点就挂了(fail)。这是判断节点是否挂了的方法;

判断集群是是否正常:

  • 如果集群中任意一个节点挂了,而且该节点没有从节点(备份节点),那么这个集群就挂了。这是判断集群是否挂了的方法
    那么为什么任意一个节点挂了(没有从节点)这个集群就挂了: 因为集群内置了16384个slot(哈希槽),并且把所有的物理节点映射到了这16384[0-16383]个slot上,或者说把这些slot均等的 分配给了各个节点。当需要在Redis集群存放一个数据(key-value)时,redis会先对这个key进行crc16算法,然后得到一个结果。再把这个结果对16384进行求余,这个余数会对应[0-16383]其中一个槽,进而决定key-value存储到哪个节点中。所以一旦某个 节点挂了,该节点对应的slot就无法使用,那么就会导致集群无法正常工作。

二、redis主从复制

1、主从复制的基本介绍

  • 通过持久化功能,redis保证了即使在服务器重启的情况下也不会丢失(或少量丢失)数据,因为持久化会把内存中的数据保存到 硬盘上,重启会从硬盘上加载数据,但是由于数据是存储在一台服务器上的,如果这台服务器出现硬盘故障等问题,也会导致数 据丢失。为了避免单点故障,通常的做法是将数据库复制多个副本以部署在不同的服务器上,这样即使有一台服务器出现故障 其他服务器依然可以继续提供服务,为此,redis提供了复制(replication)功能,可以实现当一台数据库中的数据更新后,自 动将更新的数据同步到其他数据库上。
    在复制的概念中,数据库分为两类,一类是主数据库(master),另一类是从数据(slave)。主数据可以进行读写操作,当写操 作导致数据变化时会自动将数据同步给从数据库,而从数据库一般是只读的,并接受主数据同步过来的数据。一个主数据库可以 拥有多个从数据库,而一个从数据库只能拥有一个主数据库

2、主从复制的流程

  • ①若启动一个slave机器进程,则它会向Master机器发送一个"sync command"命令,请求同步连接。
  • ②无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照(RDB)保存到数据文件中(执行rdb操作),同 时Master还会记录修改数据的所有命令并缓存在数据文件中。
  • ③后台进程完成缓存操作少后,Master机器就会向slave发送数据文件,slave端机器将数据文件保存到硬盘上,然后将其加载 到内存中,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机,则恢复正常后会自 动重新连接。
  • ④Master机器收到slave端机器的连接后,将其完整的数据文件发送给Slave端机器,如果Mater同时收到多个slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的slave端机器都正常。

三、哨兵模式

  • 哨兵是Redils集群架构中非常重要的一个组件,哨兵的出现主要是解决了主从复制出现故障时需要人为干预的问题。

1、哨兵的主要功能

①集群监控

  • 负责监控Redis master和slave进程是否正常工作

②消息通知

  • 如果某个Redis实例有故障,那么哨兵负责发送消息作为报警通知给管理员

③故障转移

  • 如果master node挂掉了,会自动转移到slave node上

④配置中心

  • 如果故障转移发生了,通知client客户端新的master地址

使用一个或者多个哨兵(Sentinel)实例组成的系统,对redis节点进行监控,在主节点出现故障的情况下,能将从节点中的一个升 级为主节点,进行故障转义,保证系统的可用性。

2、哨兵监控系统节点的过程

  1. 首先主节点的信息是配置在哨兵(Sentinel)的配置文件中

  2. 哨兵节点会和配置的主节点建立起两条连接命令连接和订阅连接
    PS:Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。

  3. 哨兵会通过命令连接每10s发送一次INF0命令,通过INFO命令,主节点会返回自己的run_id和自己的从节点信息

  4. 哨兵会对这些从节点也建立两条连接命令连接和订阅连接

  5. 哨兵通过命令连接向从节点发送INFO命令,获取到他的一些信息:
    - run_id(redis服务器id)
    - role(职能)
    - 从服务器的复制偏移量offset
    - 其他

  6. 通过命令连接向服务器的_sentinel:hello频道发送一条消息,内容包括自己的ip端口、run_id、配置(后续投票的时候会用到)等

  7. 通过订阅连接对服务器的sentinel:hello频道做了监听,所以所有的向该频道发送的哨兵的消息都能被接受到

  8. 解析监听听到的消息,进行分析提取,就可以知道还有那些别的哨兵服务节点也在监听这些主从节点了,更新结构体将这些哨兵节点记录下来

  9. 向观察到的其他的哨兵节点建立命令连接-------没有订阅连接

3、哨兵下的故障迁移

主观下线

  • 哨兵(Sentinel)节点会每秒一次的频率向建立了命令连接的实例发送ping命令,如果在down-after-milliseconds毫秒内没有做出有效响应包括(pong/loading/masterdown)以外的响应,哨兵就会将该实例在本结构体中的状态标记为SRI_S_DOWN主观下线

客观下线

  • 当一个哨兵节点发现主节点处于主观下线状态时,会向其他的哨兵节点发出询问,该节点是不是已经主观下线了。如果超过配置参数quorum个节点认为是主观下线时,该哨兵节点就会将自己维护的结构体中该主节点标记为SRI_O_DOWN客观下线

master选举

  • 在认为主节点客观下线的情况下,哨兵节点节点间会发起一次选举,命令为:SENTINEL is-master-down-by-addr,只是run id这次会将自己的run _id带进去,希望接受者将自己设置为主节点。如果超过半数以上的节点返回将该节点标记为leaer的情况下,会有该leader对故障进行迁移

故障迁移

  1. 从节点中挑选出新的主节点
  2. 将该节点设置成新的主节点SLAVEOF no one,并确保在后续的INGO命令时,该节点返回状态为master
  3. 将其他的从节点设置成从新的主节点复制,SLAVEOF命令
  4. 将旧的主节点变成新的主节点的从节点

4、优缺点

优点

  • 高可用,哨兵模式是基于主从模式的,所有主从模式的优点,哨兵模式都具有;主从可以自动切换,系统更健壮,可用性更高

缺点

  • redis比较难支持在线扩容,在群集容量达到上限时在线扩容会变得很复杂

四、Cluster群集

  • redis的哨兵模式基本已经可以实现高可用、读写分离,但是在这种模式每台redis服务器都存储相同的数据,很浪费内存资源, 所以在redis3.0上加入了cluster群集模式,实现了redis的分布式存储,也就是说每台redis节点存储着不同的内容 根据官方推荐,集群部署至少要3台以上的master节点,最好使用3主3从六个节点的模式。
    Cluster群集由多个redis服务器组成的分布式网络服务群集,群集之中有多个master主节点,每一个主节点都可读可写,节点之 间会相互通信,两两相连,redis群集无中心节点

  • 在redis-cluster群集中,可以给每个一个主节点添加从节点,主节点和从节点直接遵循主从模型的特性,当用户需要处理更多读 请求的时候,添加从节点可以扩展系统的读性能
    redis-cluster的故障转移:redis群集的主机节点内置了类似redis
    sentinel的节点故障检测和自动故障转移功能,当群集中的某个主节点下线时,群集中的其他在线主节点会注意到这一点,并且 对已经下线的主节点进行故障转移
    集群进行故障转移的方法和redis
    sentinel进行故障转移的方法基本一样,不同的是,在集群里面,故障转移是由集群中其他在线的主节点负责进行的,所以群集 不必另外使用redis sentinel

五、实验部署

master节点:192.168.100.10
slave1节点:192.168.100.20
slave2节点:192.168.100.30

(一)搭建主从复制

①安装Redis(所有主机)

yum install -y gcc gcc-c++ make
cd /opt
tar zxvf redis-5.0.7.tar.gz

cd /opt/redis-5.0.7/
make && make PREFIX=/usr/local/redis install

cd /opt/redis-5.0.7/utils
./install_server.sh
......
#回车四次后,手动输入,需要一次性输入正确
Please select the redis executable path [] /usr/local/redis/bin/redis-server  	

ln -s /usr/local/redis/bin/* /usr/local/bin/

Redis集群(主从复制、哨兵模式)_第1张图片
②修改master节点Redis配置文件

vim /etc/redis/6379.conf
#70行,修改bind 项,0.0.0.0监听所有网段
bind 0.0.0.0
#137行,开启守护进程
daemonize yes
#172行,指定日志文件目录
logfile /var/log/redis_6379.log
#264行,指定工作目录
dir /var/lib/redis/6379
#700行,开启AOF持久化功能
appendonly yes

/etc/init.d/redis_6379 restart

Redis集群(主从复制、哨兵模式)_第2张图片
Redis集群(主从复制、哨兵模式)_第3张图片
③修改slave1、2节点配置文件

vim /etc/redis/6379.conf
#70行,修改bind 项,0.0.0.0监听所有网卡
bind 0.0.0.0
#137行,开启守护进程
daemonize yes
#172行,指定日志文件目录
logfile /var/log/redis_6379.log
#264行,指定工作目录
dir /var/lib/redis/6379
#288行,指定要同步的Master节点IP和端口
replicaof 192.168.163.10 6379
#700行,开启AOF持久化功能
appendonly yes

/etc/init.d/redis_6379 restart

在这里插入图片描述

在这里插入图片描述
Redis集群(主从复制、哨兵模式)_第4张图片
Redis集群(主从复制、哨兵模式)_第5张图片
④验证主从效果

  • master节点上看日志
tail -f /var/log/redis_6379.log

Redis集群(主从复制、哨兵模式)_第6张图片

  • 在master节点上验证从节点
redis-cli info replication

Redis集群(主从复制、哨兵模式)_第7张图片

(二)搭建哨兵模式

master节点:192.168.100.10
slave1节点:192.168.100.20
slave2节点:192.168.100.30

①修改redis配置文件(所有节点)

vim /opt/redis-5.0.7/sentinel.conf
#17行,关闭保护模式
protected-mode no
#21行,Redis哨兵默认的监听端口
port 26379
#26行,指定sentinel为后台启动
daemonize yes
#36行,指定日志存放路径
logfile "/var/log/sentinel.log"
#65行,指定数据库存放路径
dir "/var/lib/redis/6379"
#84行,修改 指定该哨兵节点监控192.168.163.10:6379这个主节点,该主节点的名称是mymaster,最后的2的含义与主节点的故障判定有关:至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移
sentinel monitor mymaster 192.168.163.10 6379 2
#113行,判定服务器down掉的时间周期,默认30000毫秒(30秒)
sentinel down-after-milliseconds mymaster 30000
#146行,故障节点的最大超时时间为180000(180秒)
sentinel failover-timeout mymaster 180000

Redis集群(主从复制、哨兵模式)_第8张图片
②启动哨兵模式

cd /opt/redis-5.0.7/
redis-sentinel sentinel.conf &
  • 先启动主节点
    Redis集群(主从复制、哨兵模式)_第9张图片
  • 再启动从节点
    Redis集群(主从复制、哨兵模式)_第10张图片
    在这里插入图片描述
    ③查看哨兵模式信息
    Master:192.168.100.10
redis-cli -p 26379 info Sentinel

Redis集群(主从复制、哨兵模式)_第11张图片
④故障模拟
Master:192.168.100.10

#查看redis-server进程号
ps aux | grep redis

#杀死 Master 节点上redis-server的进程号,模拟故障
kill -9 30605			#Master节点上redis-server的进程号

Redis集群(主从复制、哨兵模式)_第12张图片
⑤验证结果
Master:192.168.100.10

tail -f /var/log/sentinel.log

#-------日志信息------------
32928:X 08 May 2021 16:21:46.083 # +switch-master mymaster 192.168.100.10 6379 192.168.100.30 6379
32928:X 08 May 2021 16:21:46.083 * +slave slave 192.168.100.20:6379 192.168.100.20 6379 @ mymaster 192.168.100.30 6379
32928:X 08 May 2021 16:21:46.083 * +slave slave 192.168.100.10:6379 192.168.100.10 6379 @ mymaster 192.168.100.30 6379
32928:X 08 May 2021 16:21:56.098 # +sdown slave 192.168.100.10:6379 192.168.100.10 6379 @ mymaster 192.168.100.30 6379


redis-cli -p 26379 INFO Sentinel

Redis集群(主从复制、哨兵模式)_第13张图片

(三)搭建Redis集群模式

  • redis集群一般需要6个节点,3主3从。

Master1:192.168.10.10
Master2:192.168.10.11
Master3:192.168.10.12
Slave1:192.168.10.20
Slave2:192.168.10.21
Slave3:192.168.10.22

1、所有节点

cd /etc/redis/
mkdir -p redis-cluster/redis6379
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6379/
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6379/

2、Master1节点

#其他5个文件夹的配置文件以此类推修改,注意6个端口都要不一样。
cd /etc/redis/redis-cluster/redis6379
vim redis.conf

bind 192.168.10.10						#69行,修改bind项,监听自己的IP
protected-mode no						#88行,修改,关闭保护模式
port 7001								#92行,修改,redis监听端口,
daemonize yes							#136行,以独立进程启动
cluster-enabled yes						#832行,取消注释,开启群集功能
cluster-config-file nodes-6379.conf		#840行,取消注释,群集名称文件设置,无需修改
cluster-node-timeout 15000				#846行,取消注释群集超时时间设置
appendonly yes							#699行,修改,开启AOF持久化
scp /etc/redis/redis-cluster/redis6379/redis.conf [email protected]:/etc/redis/redis-cluster/redis6379/redis.conf
scp /etc/redis/redis-cluster/redis6379/redis.conf [email protected]:/etc/redis/redis-cluster/redis6379/redis.conf
scp /etc/redis/redis-cluster/redis6379/redis.conf [email protected]:/etc/redis/redis-cluster/redis6379/redis.conf
scp /etc/redis/redis-cluster/redis6379/redis.conf [email protected]:/etc/redis/redis-cluster/redis6379/redis.conf
scp /etc/redis/redis-cluster/redis6379/redis.conf [email protected]:/etc/redis/redis-cluster/redis6379/redis.conf

3、其余节点

vim /etc/redis/redis-cluster/redis6379/redis.conf

#修改69行bind监听自己的IP
#修改92行监听端口自定义修改,每个节点不一样即可

4、所有节点

cd /etc/redis/redis-cluster/redis6379/
redis-server redis.conf

启动集群:

redis-cli --cluster create 192.168.10.10:7001 192.168.10.11:7003 192.168.10.12:7005 192.168.10.20:7006 192.168.10.21:7004 192.168.10.22:7002 --cluster-replicas 1
redis-cli -h 192.168.10.10 -p 7001 -c        #加-c参数,节点之间就可以互相跳转	
cluster slots			#查看节点的哈希槽编号范围
set sky blue
cluster keyslot sky	#查看name键的槽编号

你可能感兴趣的:(web服务,Redis数据库)