redis主从复制数据延迟解决方案

redis 主从模式之复制数据延迟解决方案

在 redis 主从复制模式下可能会出现 slave 延迟导致读写不一致的问题。 解决办法有2种

1. 修改从几点参数配置

从节点的 slave-serve-stale-data 参数也与此有关,它控制这种情况下从节点的表现 当从库同主机失去连接或者复制正在进行,从机库有两种运行方式:

  1. 如果slave-serve-stale-data设置为yes(默认设置),从库会继续响应客户端的请求。

  2. 如果slave-serve-stale-data设置为no,除去INFO和SLAVOF命令之外的任何请求都会返回一个错误”SYNC with master in progress”。

2. 编写外部监控程序

将主从模式更换为哨兵模式则无需自己去做监控

对于无法容忍大量延迟场景,可以编写外部监控程序监听主从节点的复制偏移量,当延迟较大时触发报警或者通知客户端避免读取延迟过高的从节点。

编写监控程序,然后定时执行

connect("127.0.0.1", 63790);
$redis->auth("leeprince");

$info         = $redis->info('replication');
$slaveNum     = $info['connected_slaves'];
$masterOffest = $info['master_repl_offset'];

echo "+++++++++++++++++++++++定时开始+++++++++++++++++++++++\r\n";

$invalidSlave = []; // 要移除的从节点
for ($i = 0; $i < $slaveNum; $i++) {
    $slaveKey    = "slave{$i}";
    $slaveInfo   = $info[$slaveKey];
    $slaveInfo   = explode(',', $slaveInfo);

    $slaveHost   = explode('=', $slaveInfo[0])[1];
    $slavePort   = explode('=', $slaveInfo[1])[1];
    $slaveState  = explode('=', $slaveInfo[2])[1];
    $slaveOffset = explode('=', $slaveInfo[3])[1];

    $offset = $masterOffest - $slaveOffset;
    if ($offset > MAX_OFFSET || $slaveState != 'online') {
        $readHostMap = include_once "./hostMap.php";
        $slaveString = "tcp://{$slaveHost}:{$slavePort}";
        $invalidSlave[] = $readHostMap[$slaveString];
        var_dump("当前从节点为高延迟--{$slaveString}");
    }
}

if (empty($invalidSlave)) {
    if (IS_DEBUG) {
        echo "========================================\r\n";
        var_dump($info);
        echo "========================================\r\n";
    }
    var_dump('不存在需要移除的从节点');
    exit(0);
}

// redis 动态配置文件
$confPath = './config.php';
include $confPath;


if (IS_DEBUG) {
    echo "========================================\r\n";
    var_dump($info);
    var_dump($replication);
    echo "========================================\r\n";
}

$isHaveChange = false; // 是否需要修改配置。考虑上一次可能已经移除了该从节点
foreach ($replication as $key => &$value) {
    if (in_array($value, $invalidSlave)) {
        $isHaveChange = true;
        var_dump("需要移除的从节点存在当前配置中--{$value}");
        unset($replication[$key]);
    }
}

if ($isHaveChange) {
    $content = "

完整的代码:包含 linux 定时器与 swoole 毫秒级定时器版本
https://github.com/leeprince/docker/tree/master/redis/monitor

在从节点种模拟网络延迟步骤


$ apt update

$ apt install -y iproute2

$ ip addr
1: lo:  mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
2: tunl0@NONE:  mtu 1480 qdisc noop state DOWN group default qlen 1000
    link/ipip 0.0.0.0 brd 0.0.0.0
3: ip6tnl0@NONE:  mtu 1452 qdisc noop state DOWN group default qlen 1000
    link/tunnel6 :: brd ::
15: eth0@if16:  mtu 1500 qdisc netem state UP group default qlen 1000
    link/ether 02:42:ac:12:00:04 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.18.0.4/16 brd 172.18.255.255 scope global eth0
       valid_lft forever preferred_lft forever

# 设置模拟网络延迟 5 秒。 删除设置:tc qdisc del dev eth0 root netem delay 5000ms
$ tc qdisc add dev eth0 root netem delay 5000ms

运行结果:


截屏2020-05-05 17.56.13.png

你可能感兴趣的:(redis主从复制数据延迟解决方案)