Redis运维和开发学习笔记(5) 主从复制和sentinel哨兵模式

Redis运维和开发学习笔记(5) 主从复制和sentinel哨兵模式

主从复制

将主节点的数据改变同步给从节点

  • 作用
    1. 备份数据
    2. 读写分离
  • 存在的问题:
    1. 手动干预切主等操作
    2. 主节点的写能力受到单机限制
    3. 主节点的存储能力受到单机限制

主从模式的故障恢复

  1. 当主节点发生故障时,客户端连接主节点失败,两个从节点和主连接失败
  2. (人工)选取一个从节点slaveof no one使其成为新的主节点
  3. 更新应用方信息,重启
  4. 让另一个从节点连接新主
  5. 原来的主恢复作为从,去连接新主

哨兵

blog

拓扑结构图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qDHbOoMx-1572053628652)(media/15653345582593/%206.2%20%E6%8B%93%E6%89%91%EF%BC%88171%EF%BC%89.png)]

复制配置

复制过程

命令:slaveof slaveof 127.0.0.1:6379

  1. 保存主节点信息
    • 执行slaveof后会打印日志
id=38 addr=127.0.0.1:47458 fd=6 name= age=2700 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=0 qbuf-free=32768 obl=0 oll=0 omem=0 events=r cmd=client
参数	含义
id	客户端连接的唯一标识,这个id是随着Redis的连接自增的,重启Redis后会重置为0。
addr	客户端的地址和端口
fd	套接字所使用的文件描述符
age	以秒计算的已连接时长
idle	以秒计算的空闲时长看, age=idle时则此链接为空连接
flags	客户端 flag
db	该客户端正在使用的数据库 ID
sub	已订阅频道的数量
psub	已订阅模式的数量
multi	在事务中被执行的命令数量
qbuf	输入缓冲区总量(字节为单位, 0 表示没有分配查询缓冲区)
qbuf-free	输入缓冲区剩余容量(字节为单位, 0 表示没有剩余空间)
obl	输出缓冲区的长度(字节为单位, 0 表示没有分配输出缓冲区)
oll	输出列表包含的对象数量(当输出缓冲区没有剩余空间时,命令回复会以字符串对象的形式被入队到这个队列里)
omem	输出缓冲区和输出列表占用的内存总量
events	文件描述符事件
cmd	最近一次执行的命令
  1. 主从建立socket连接
    • 每秒运行定时任务维护复制逻辑,直到成功;或者slaveof no one取消复制
    • 连接失败:Error condition on socket for SYNC:{socket_error_reason}
  2. 发送pingmingling
    1. 检查主从质检网络套接字是否可用
    2. 检测主从节点当前是否可接收处理命令
    3. 日志:Master replied to PING, replication can continue...
  3. 权限验证
    5. 主节点:如果配置了requirepass,就需要认证
    6. 从节点:配置相应的masterauth。
  4. 同步数据集
  5. 命令持续复制
    7. 上面的操作已经把数据同步完了,后面就持续把写命令发送给从库

数据同步

复制偏移量

  • 主节点在处理完毕写入命令之后,会把命令的字节长度做累加记录,统计信息在master_repl_offset
  • 对比主从节点的复制偏移量,判断是否数据一致

复制积压缓冲区(repl_backlog)

  • 保存在主节点上的一个固定长度的队列,默认为1M

  • 保存最近已复制的数据,用于部分复制和复制命令丢失的数据补救

  • 参数含义

    repl_backlog_active:1 开启复制缓冲区
    repl_backlog_size:1048576 缓冲区最大长度
    repl_backlog_first_byte_offset:2 起始偏移量,计算当前缓冲区 可用范围
    repl_backlog_histlen:969335 已保存数据的有效长度

参数信息

主库(info replication)

 127.0.0.1:7001> info replication
# Replication
role:master
connected_slaves:1
slave0:ip=127.0.0.1,port=7004,state=online,offset=969336,lag=1
master_repl_offset:969336
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:2
repl_backlog_histlen:969335

从库(info replication)

127.0.0.1:7004> info replication
# Replication
role:slave
master_host:127.0.0.1
master_port:7001
master_link_status:up
master_last_io_seconds_ago:3
master_sync_in_progress:0
slave_repl_offset:969350
slave_priority:100
slave_read_only:1
connected_slaves:0
master_repl_offset:0
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0

主节点运行id

节点启动后动态分配的ID,用于唯一识别节点,ID变更后会发生全量复制

重启后会改变,需要使用debug reload命令重启并保持ID不变(命令会阻塞当前节点主线程),阻塞期间先生成rdb快照,并清空数据后再加载rdb文件。对于大数据量的主节点和无法容忍阻塞的应用场景慎用

  • 参数
127.0.0.1:7002> info server
# Server
redis_version:3.2.4
redis_git_sha1:00000000
redis_git_dirty:0
redis_build_id:53849fee5fb41517
redis_mode:cluster
os:Linux 3.10.0-957.1.3.el7.x86_64 x86_64
arch_bits:64
multiplexing_api:epoll
gcc_version:4.8.5
process_id:24334
run_id:698e129042d03211b71e7c3117e37731a3bc5eca
tcp_port:7002
uptime_in_seconds:700399
uptime_in_days:8
hz:10
lru_clock:4879595
executable:/usr/local/redis/3.2/redis-server
config_file:/etc/redis.d/redistest_7002.conf

psync(178)

  • 从节点使用psync命令完成部分复制和全量复制功能。

总览图

你可能感兴趣的:(数据库)