Sentinel是Redis的高可用性解决方案:由一个或多个Sentinel实例组成的Sentinel系统可以监视任意多个主服务器,以及这些主服务器属下的所有从服务器,并在被监视的主服务器进入下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器,然后由新的主服务器代替已经下线的主服务器继续处理命令请求。
启动一个Sentinel可以使用命令:
$ redis-sentinel /path/to/your/sentinel.conf 或者命令
$ redis-server /path/to/your/sentinel.conf --sentinel
当一个Sentinel启动时,它需要执行一下步骤:
在详细讲解Sentinel初始化之前,我们先看一个典型的sentinel.conf配置,因为后面的流程也会涉及到配置中的内容:
//哨兵端口号
port 16000
//关闭保护模式
protected-mode no
//守护进程
daemonize yes
//哨兵程序的工作路径
dir /usr/local/redis/sentinel/
//master的访问密码
sentinel auth-pass mymaster 111222
//Sentinel去监视一个名为mymaster的主redis master服务,这个主实例的IP地址端口号为192.168.1.161和17000,quorum为2
sentinel monitor mymaster 192.168.1.161 6379 2
//如果哨兵5s内未收到mymaster的有效ping回复,则认为mymaster处于down状态
sentinel down-after-milliseconds mymaster 5000
//执行切换的超时时间,如果在该时间(ms)内未能完成failover操作,则认为该failover失败,生产环境需要根据数据量设置该值
sentinel failover-timeout mymaster 300000
//在执行故障转移时,主从切换完成后最多可以有多少个从Redis实例可以同时向新的Redis Master发起同步数据请求,在从Redis实例较多的情况下这个数字越小,同步的时间越长,完成故障转移所需的时间就越长
sentinel parallel-syncs mymaster 2
sentinel auth-pass resque 333444
sentinel monitor resque 192.168.1.162 6380 4
sentinel down-after-milliseconds resque 5000
sentinel failover-timeout resque 300000
sentinel parallel-syncs resque 2
针对上面的配置文件我们重点分析下quorum的作用。quorum在哨兵中有两层含义。第一层含义为:如果某个哨兵认为其监听的Master处于下线的状态,这个状态在Redis中标记为S_DOWN,即主观下线。假设quorum配置为2,则当有两个哨兵同时认为一个Master处于下线的状态时,会标记该Master为O_DOWN,即客观下线。只有一个Master处于客观下线状态时才会开始执行切换。第二层含义为:假设有5个哨兵,quorum配置为4。首先,判断客观下线需要4个哨兵才能认定。其次,当开始执行切换时,会从5个哨兵中选择一个leader执行该次选举,此时一个哨兵也必须得到4票才能被选举为leader,而不是3票(即哨兵的大多数)。
事实上,Sentinel本质上只是一个运行在特殊模式下的Redis服务器,所以启动Sentinel的第一步,就是初始化一个普通的Redis服务器。
不过,因为Sentinel执行的工作和普通Redis服务器执行的工作不同,所以Sentinel的初始化过程和普通Redis服务器的初始化过程并不完全一样,例如:
在应用了Sentinel的专用代码之后,接下来,服务器会初始化一个sentinel.c/sentinelState结构(后面简称**“Sentinel状态”**),这个结构保存了服务器中所有和Sentinel功能有关的状态(服务器的一般状态仍然由redis.h/redisServer结构保存):
struct sentinelState {
//当前纪元,用于实现故障转移
uint64_t current_epoch;
//保存了所有被这个sentinel 监视的主服务器
//字典的键是主服务器的名字
//字典的值则是一个指向sentinelRedisInstance 结构的指针
dict *masters;
//是否进入了TILT 模式?
int tilt;
//目前正在执行的脚本的数量
int running_scripts;
//进入TILT 模式的时间
mstime_t tilt_start_time;
//最后一次执行时间处理器的时间
mstime_t previous_time;
// 一个FIFO 队列,包含了所有需要执行的用户脚本
list *scripts_queue;
} sentinel;
Sentinel状态中masters字典记录了所有被sentinel监视的主服务器的相关信息,其中:字典的键是被监视主服务器的名字;字典的值是被监视主服务器对应的sentinel.c/sentinelRedisInstance结构。
typedef struct sentinelRedisInstance {
//标识值,记录了实例的类型,以及该实例的当前状态
int flags;
//实例的名字
//主服务器的名字由用户在配置文件中设置
//从服务器以及Sentinel 的名字由Sentinel 自动设置
//格式为ip:port ,例如"127.0.0.1:26379"
char *name;
//实例的运行ID
char *runid;
//主服务器属下所有的从服务器
dict *slaves;
//配置纪元,用于实现故障转移
uint64_t config_epoch;
//实例的地址
sentinelAddr *addr;
// SENTINEL down-after-milliseconds 选项设定的值
//实例无响应多少毫秒之后才会被判断为主观下线(subjectively down )
mstime_t down_after_period;
// SENTINEL monitor 选项中的quorum 参数
//判断这个实例为客观下线(objectively down )所需的支持投票数量
int quorum;
// SENTINEL parallel-syncs 选项的值
//在执行故障转移操作时,可以同时对新的主服务器进行同步的从服务器数量
int parallel_syncs;
// SENTINEL failover-timeout 选项的值
//刷新故障迁移状态的最大时限
mstime_t failover_timeout;
// ...
} sentinelRedisInstance;
对Sentinel状态的初始化将引发对masters字典的初始化,而masters字典的初始化是根据载入的sentinel.conf配置文件进行的。
由配置文件可知,由于某个sentinel服务器的配置文件中只配置了多个主服务器的信息,所以在初始化Sentinel状态时,并不会初始化与这些主服务器相关的从服务器以及监视这些主服务器的其他sentinel节点的信息,那么从服务器和其他sentinel节点的信息是什么时候载入的呢?又是如何载入的呢?下面我们会详细讲解。
初始化Sentinel的最后一步是创建连向被监视主服务的网络连接,Sentinel将成为主服务器的客户端,它可以向主服务器发送命令,并从命令回复中获取相关信息。Sentinel会创建两个连向主服务器的异步网络连接:
事实上,sentinel不但会和主服务器之间建立命令连接和订阅连接,也会和所有的从服务器之间建立命令连接和订阅连接,并且会和监视主服务器的其他sentinel服务器建立命令连接,但sentinel之间不会创建订阅连接。
需要注意的是,sentinel与主服务器、从服务器、其他sentinel服务器建立网络连接的时机是不同的。
问题一:Sentinel为什么要创建两个连向主服务器的网络连接?
答:这是因为,一方面在Redis目前的发布与订阅功能中,被发送的信息都不会保存在Redis服务器里面,如果在信息发送时,想要接受信息的客户端不在线或者断线,那么这个客户端就会丢失这条信息。因此为了不丢失_sentinel_:hello频道的任何信息,Sentinel必须专门用一个订阅连接来接收该频道的信息。另一方面,除了订阅频道之外,Sentinel还必须向主服务器发送命令,以此来与主服务器进行通信,所以Sentinel还必须向主服务器创建命令连接。
因为Sentinel需要与多个实例创建多个网络连接,所以Sentinel使用的是异步连接。
问题二:sentinel之间为什么不会创建订阅连接?
答:Sentinel在连接主服务器或者从服务器时,会同时创建命令连接和订阅连接,但是在连接其他Sentinel时,却只会创建命令连接,而不创建订阅连接。这是因为Sentinel需要通过接受主服务器或者从服务器发来的频道信息来发现未知的新Sentinel,所以才需要建立订阅连接,而相互已知的Sentinel只要使用命令连接进行通信就足够了。
在我们启动Sentinel时,我们看main()具体代码会发现,主流程只是进行了一些初始化,那何时建立命令连接和消息连接的呢?答案是在Redis的时间任务serverCron中。
哨兵中每次执行serverCron时,都会调用sentinelTimer()函数。该函数会建立连接,并且定时发送心跳包并采集信息。该函数主要功能如下:
sentinel默认会以每十秒一次的频率,通过命令连接向被监视的主服务器发送INFO命令,并通过分析INFO命令的回复来获取主服务的当前信息。主要分为两部分:
默认情况下,Sentinel会以每两秒一次的频率,通过命令连接向所有被监视的主服务器和从服务器_sentinel__:hello开头的命令。
我们知道Sentinel对_sentinel__:hello频道的订阅会一直持续到Sentinel与服务器的连接断开为止。
这也就是说,对于每个与Sentinel连接的服务器,Sentinel即通过命令连接向服务器的_sentinel__:hello频道发送信息,又通过订阅连接从服务器的_sentinel__:hello频道接收信息。
对于监视同一个服务器的多个Sentinel来说,一个Sentinel发送的信息会被其他Sentinel接收到,这些信息会被用于更新其他Sentinel对发送信息Sentinel的认知,也会被用于更新其他的Sentinel对被监视服务器的认知。
换句话说,一个Sentinel从_sentinel__:hello频道接收到一条信息时,Sentinel会对这条信息进行分析,提取出信息中的Sentinel IP地址、Sentinel端口号、Sentinel运行ID等八个参数,并进行以下检查:
需要注意的是,Sentinel为主服务器创建的实例结构中的sentinels字典保存了除Sentinel本身之外,所有同样监视这个主服务器的其他Sentinel的资料。
当Sentinel通过频道信息发现一个新的Sentinel时,它不仅会为新Sentinel在sentinels字典中创建相应的实例结构,还会创建一个连向新Sentinel的命令连接,而新Sentinel也同样会创建连向这个Sentinel的命令连接,最终监视同一主服务器的多个Sentinel将形成相互连接的网络。
检测主观下线状态
默认情况下,Sentinel会以每秒一次的频率向所有与它创建了命令连接的实例(包括主服务器、从服务器、其他sentinel)发送PING命令,并通过实例返回的PING命令回复来判断实例是否在线。
Sentinel配置文件中的down-after-milliseconds选项指定了Sentinel判断实例进入主观下线所需的时间长度:如果一个实例在down-after-milliseconds毫秒内,连续向Sentinel返回无效回复,那么Sentinel会修改这个实例所对应的实例结构,在结构的flags属性中打开SRI_S_DOWN标识,以此来表示这个实例已经进入主观下线状态。
注意一:主观下线时长选项的作用范围
用户设置的down-after-milliseconds选项的值,不仅会被Sentinel用来判断主服务器的主观下线状态,还会被用于判断主服务器属下的所有从服务器,以及所有同样监视这个主服务器的其他Sentinel的主观下线状态。
注意二:多个Sentinel设置的主观下线时长可能不同
对于监视同一个主服务器的多个sentinel来说,它们设置的down-after-milliseconds的值可能不同,这样一来,当一个Sentinel将主服务器判断为主观下线是,其他的Sentinel可能仍然会认为此主服务器处于在线状态。
检测客观下线
当Sentinel将一个主服务器判断为主观下线后,为了确认这个主服务器是否真的下线了,它会向同样监视这个主服务器的其他Sentinel进行询问,看它们是否也认为此主服务器已进入了下线状态(可以是主观下线或者客观下线)。当Sentinel从其他Sentinel那里接收到足够数量的已下线判断之后,Sentinel就会将此主服务器判定为客观下线,并对主服务器执行故障转移操作。
注意一:判断客观下线的判断条件
当认为主服务器已经进入下线状态的Sentinel的数量,超过Sentinel配置中设置的quorum参数的值,那么该Sentinel就会认为此主服务器已经进入客观下线状态。
注意二:不同Sentinel判断客观下线的条件可能不同
对于监视同一个主服务器的多个Sentinel来说,它们将主服务器判断为客观下线的条件可能也不同:当一个Sentinel将主服务器判断为客观下线时,其他Sentinel可能并不这么认为。
当一个主服务器被判断为客观下线时,监视这个下线主服务器的各个Sentinel会进行协商,选举出一个领头Sentinel,并由领头Sentinel对下线主服务器执行故障转移操作。
选举领头Sentinel的规则和方法:
在选举产生出领头Sentinel之后,领头Sentinel将对已下线的主服务器执行故障转移操作。
故障转移包含以下三个步骤:
领头Sentinel会将已下线主服务器的所有从服务器保存到一个列表里面,然后按照以下规则,一项一项地对列表进行过滤:
当新的主服务器出现之后,领头Sentinel下一步就会让已下线主服务器属下的所有从服务器去复制新的主服务器,这一动作可以通过向从服务器发送SLAVEOF [server_ip] [server_port]命令来实现。
故障转移操作最后要做的是,将已下线的主服务器设置为新的主服务器的从服务器。
因为旧的主服务器已经下线,所有这种设置是保存在旧的主服务器对应的实例结构里面的,当旧的主服务器重新上线时,Sentinel就会向它发送SLAVEOF命令,让它成为新的主服务器的从服务器。
Redis之详解