Redis系列——第七章 Redis开启哨兵模式

Redis系列

Redis系列——第一章 Redis配置文件

Redis系列——第二章 Redis数据类型以及基本使用

Redis系列——第三章 Redis开启事务并实现乐观锁

Redis系列——第四章 Redis发布订阅模式

Redis系列——第五章 Redis持久化策略RDB与AOF

Redis系列——第六章 Redis主从同步

Redis系列——第七章 Redis开启哨兵模式


文章目录

  • Redis系列
        • [Redis系列——第一章 Redis配置文件](https://blog.csdn.net/weixin_42083036/article/details/112462218?spm=1001.2014.3001.5501)
        • [Redis系列——第二章 Redis数据类型以及基本使用](https://blog.csdn.net/weixin_42083036/article/details/112479336?spm=1001.2014.3001.5501)
        • [Redis系列——第三章 Redis开启事务并实现乐观锁](https://blog.csdn.net/weixin_42083036/article/details/112600432?spm=1001.2014.3001.5501)
        • [Redis系列——第四章 Redis发布订阅模式](https://blog.csdn.net/weixin_42083036/article/details/112601397?spm=1001.2014.3001.5501)
        • [Redis系列——第五章 Redis持久化策略RDB与AOF](https://blog.csdn.net/weixin_42083036/article/details/112976935?spm=1001.2014.3001.5501)
        • [Redis系列——第六章 Redis主从同步](https://blog.csdn.net/weixin_42083036/article/details/113363406?spm=1001.2014.3001.5501)
        • [Redis系列——第七章 Redis开启哨兵模式](https://blog.csdn.net/weixin_42083036/article/details/113564295)
    • 一、Redis哨兵模式
      • 1、为什么要哨兵模式?
      • 2、什么是哨兵模式?
      • 3、如何开启
        • 1、创建sentinel.conf文件
        • 2、内容增加
        • 3、使用命令启动
        • 4、连接sentinel的客户端查看信息
      • 4、哨兵的集群配置
      • 5、哨兵模式的整个过程
        • 1、流程图
        • 2、流程分析
        • 3、下线类别分析

一、Redis哨兵模式

1、为什么要哨兵模式?

     哨兵模式一般出现在主从同步开启,由于从机默认只读不可写的特性,导致了如果主机宕机,整个redis集群都不可用,这是无法容忍的,虽然我们可以手动设置从机升级为主机但是存在时效性,这样会导致数据的丢失,以及整个服务项目的性能。所以为了解决Redis主机宕机问题,Redis想出了哨兵机制。
总结:

  1. 为了Redis高可用
  2. 自动故障迁移(Automatic failover)

2、什么是哨兵模式?

      打仗的时候都会在前线设置哨兵盯着,一旦发现情况不对就立马汇报。Redis的哨兵也是这个作用,不过Redis的哨兵盯住的不是其他,而是主机,Redis的哨兵启动后会一直盯住master主机 一旦发现master挂了,会进行一个下线判断,如果判定master下线,那么就会重新在从机中推举一个出来成为新的主机,就算挂了的主机重新启动也只能成为新任老大的小弟。
Redis系列——第七章 Redis开启哨兵模式_第1张图片

3、如何开启

1、创建sentinel.conf文件

Redis系列——第七章 Redis开启哨兵模式_第2张图片

2、内容增加

# sentinel monitor 被监控的主机名(自定义) 被监控的主机IP 被监控的数据库端口号 投票数
# 投票数:表示主机挂掉后,从机投票选举主机,得票数达到多少后成为主机
sentinel monitor myredis 127.0.0.1 6379 1
#如果被监控的主机需要密码  加入sentinel auth-pass 被监控的主机名 密码
#sentinel auth-pass myredis  123

3、使用命令启动

Linux:

redis-sentinel  kconfig/sentinel.conf

Windows:

redis-server.exe sentinel.conf --sentinel

Redis系列——第七章 Redis开启哨兵模式_第3张图片
启动后sentinel.conf文件会增加一些配置

sentinel myid b2c17cf276ce21e73d542f56402cd4998b5c357b
# Generated by CONFIG REWRITE
port 26379
dir "F:\\Redis-x64-3.2.100"
sentinel monitor myredis 127.0.0.1 6379 1
sentinel config-epoch myredis 0
sentinel leader-epoch myredis 2
sentinel current-epoch 2

参数解读

# Example sentinel.conf
 
# 哨兵sentinel实例运行的端口 默认26379
port 26379
 
# 哨兵sentinel的工作目录
dir /tmp
 
# 哨兵sentinel监控的redis主节点的 ip port 
# master-name  可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。
# quorum 配置多少个sentinel哨兵统一认为master主节点失联 那么这时客观上认为主节点失联了
# sentinel monitor    
  sentinel monitor mymaster 127.0.0.1 6379 2
 
# 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码
# 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
# sentinel auth-pass  
sentinel auth-pass mymaster MySUPER--secret-0123passw0rd
 
 
# 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒
# sentinel down-after-milliseconds  
sentinel down-after-milliseconds mymaster 30000
 
# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,
这个数字越小,完成failover所需的时间就越长,
但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。
可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
# sentinel parallel-syncs  
sentinel parallel-syncs mymaster 1
 
 
 
# 故障转移的超时时间 failover-timeout 可以用在以下这些方面: 
#1. 同一个sentinel对同一个master两次failover之间的间隔时间。
#2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
#3.当想要取消一个正在进行的failover所需要的时间。  
#4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了
# 默认三分钟
# sentinel failover-timeout  
sentinel failover-timeout mymaster 180000
 
# SCRIPTS EXECUTION
 
#配置当某一事件发生时所需要执行的脚本,可以通过脚本来通知管理员,例如当系统运行不正常时发邮件通知相关人员。
#对于脚本的运行结果有以下规则:
#若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10
#若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。
#如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
#一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被一个SIGKILL信号终止,之后重新执行。
 
#通知型脚本:当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本,
这时这个脚本应该通过邮件,SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,
一个是事件的类型,
一个是事件的描述。
如果sentinel.conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentinel无法正常启动成功。
#通知脚本
# sentinel notification-script  
  sentinel notification-script mymaster /var/redis/notify.sh
 
# 客户端重新配置主节点参数脚本
# 当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生改变的信息。
# 以下参数将会在调用脚本时传给脚本:
#       
# 目前总是“failover”,
# 是“leader”或者“observer”中的一个。 
# 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的
# 这个脚本应该是通用的,能被多次调用,不是针对性的。
# sentinel client-reconfig-script  
 sentinel client-reconfig-script mymaster /var/redis/reconfig.sh


4、连接sentinel的客户端查看信息

Windows 打开redis的目录 进入命令行 执行下面命令

redis-cli.exe -p 26379 
sentinel masters

Redis系列——第七章 Redis开启哨兵模式_第4张图片

4、哨兵的集群配置

同开启步骤类似,需要多少个哨兵就创建多少份.conf文件,但是注意文件名不要重复推荐使用端口名命名

5、哨兵模式的整个过程

1、流程图

Redis系列——第七章 Redis开启哨兵模式_第5张图片

2、流程分析

  1. 每个Sentinel以每秒钟一次的频率向它所知的Master,Slave以及其他 Sentinel 实例发送一个PING命令。
  2. 如果一个实例(instance)距离最后一次有效回复PING命令的时间超过 own-after-milliseconds选项所指定的值,则这个实例会被Sentinel标记为主观下线
  3. 如果一个Master被标记为主观下线,则正在监视这个Master的所有 Sentinel要以每秒一次的频率确认Master的确进入了主观下线状态。
  4. 当有足够数量的Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认Master的确进入了主观下线状态,则Master会被标记为客观下线
  5. 在一般情况下,每个Sentinel 会以每10秒一次的频率向它已知的所有Master,Slave发送 INFO 命令。
  6. 当Master被Sentinel标记为客观下线时,Sentinel 向下线的 Master 的所有Slave发送INFO命令的频率会从10秒一次改为每秒一次。
  7. 若没有足够数量的Sentinel同意Master已经下线,Master的客观下线状态就会被移除。 若Master重新向Sentinel 的PING命令返回有效回复,Master的主观下线状态就会被移除。

3、下线类别分析

  • 主观下线
    所谓主观下线(Subjectively Down, 简称 SDOWN)指的是单个Sentinel实例对服务器做出的下线判断,即单个sentinel认为某个服务下线(有可能是接收不到订阅,之间的网络不通等等原因)。
    主观下线就是说如果服务器在down-after-milliseconds给定的毫秒数之内, 没有返回 Sentinel 发送的 PING 命令的回复, 或者返回一个错误, 那么 Sentinel 将这个服务器标记为主观下线(SDOWN )。
    sentinel会以每秒一次的频率向所有与其建立了命令连接的实例(master,从服务,其他sentinel)发ping命令,通过判断ping回复是有效回复,还是无效回复来判断实例时候在线(对该sentinel来说是“主观在线”)。
    sentinel配置文件中的down-after-milliseconds设置了判断主观下线的时间长度,如果实例在down-after-milliseconds毫秒内,返回的都是无效回复,那么sentinel回认为该实例已(主观)下线,修改其flags状态为SRI_S_DOWN。如果多个sentinel监视一个服务,有可能存在多个sentinel的down-after-milliseconds配置不同,这个在实际生产中要注意。
  • 客观下线
    客观下线(Objectively Down, 简称 ODOWN)指的是多个 Sentinel 实例在对同一个服务器做出 SDOWN 判断, 并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后, 得出的服务器下线判断,然后开启failover。
    客观下线就是说只有在足够数量的 Sentinel 都将一个服务器标记为主观下线之后, 服务器才会被标记为客观下线(ODOWN)。
    只有当master被认定为客观下线时,才会发生故障迁移。
    当sentinel监视的某个服务主观下线后,sentinel会询问其它监视该服务的sentinel,看它们是否也认为该服务主观下线,接收到足够数量(这个值可以配置)的sentinel判断为主观下线,既任务该服务客观下线,并对其做故障转移操作。
    sentinel通过发送 SENTINEL is-master-down-by-addr ip port current_epoch runid,(ip:主观下线的服务id,port:主观下线的服务端口,current_epoch:sentinel的纪元,runid:*表示检测服务下线状态,如果是sentinel 运行id,表示用来选举领头sentinel)来询问其它sentinel是否同意服务下线。
    一个sentinel接收另一个sentinel发来的is-master-down-by-addr后,提取参数,根据ip和端口,检测该服务时候在该sentinel主观下线,并且回复is-master-down-by-addr,回复包含三个参数:down_state(1表示已下线,0表示未下线),leader_runid(领头sentinal id),leader_epoch(领头sentinel纪元)。
    sentinel接收到回复后,根据配置设置的下线最小数量,达到这个值,既认为该服务客观下线。
    客观下线条件只适用于主服务器: 对于任何其他类型的 Redis 实例, Sentinel 在将它们判断为下线前不需要进行协商, 所以从服务器或者其他 Sentinel 永远不会达到客观下线条件。只要一个 Sentinel 发现某个主服务器进入了客观下线状态, 这个 Sentinel 就可能会被其他 Sentinel 推选出, 并对失效的主服务器执行自动故障迁移操作。

你可能感兴趣的:(缓存,Java,redis,java,分布式)