MySql 复制

MySQL 日志格式分为2种

  • 服务层日志
    • 二进制日志
    • 慢查询
    • 通用日志
  • 存储引擎日志
    • innodb 重做日志
    • innodb 回滚日志

二进制log的三种格式

  1. binlog_format=STATEMENT

    • 直接保存执行的sql语句
    • 记录量相对小
    • 记录语句的上下文信息,但是UUID()或者User 可能造成主从复制的不一致;
  2. binlog_format=ROW

    • 使MySQL主从复制更加安全
    • 对每一行数据的修改比基于段的复制高效
    • 误操作可以查看日志,回复误操作数据
    • 每一行的修改日志比较大,binlog_row_image= FULL|MINIMAL|NOBLOB
    • mysqlbinlog -vv 查看row格式日志
  3. binlog_format=MIXED

    • 根据sql语句由系统决定段还是行的日志格式
    • 数据量大小由sql语句决定

复制

  1. 基于sql语句的复制 SBR

    • 日志量比较少
    • 不强制要求表完全相同
    • 无法保证主从复制数据的一致性
    • 存储过程,触发器,自定义函数可能导致数据不一致
  2. 基于row的复制 RBR

    • 可以应用于任何sql的复制,包括自定义函数,存储过程
    • 减少锁的使用
    • 表结构必须相同
    • 无法再从服务器上单独执行触发器
  3. GTID复制模式
    在传统的复制里面,当发生故障,需要主从切换,需要找到binlog和pos点,然后将主节点指向新的主节点,相对来说比较麻烦,也容易出错。在MySQL 5.6里面,不用再找binlog和pos点,我们只需要知道主节点的ip,端口,以及账号密码就行,因为复制是自动的,MySQL会通过内部机制GTID自动找点同步。
    多线程复制(基于库),在MySQL 5.6以前的版本,slave的复制是单线程的。一个事件一个事件的读取应用。而master是并发写入的,所以延时是避免不了的。唯一有效的方法是把多个库放在多台slave,这样又有点浪费服务器。在MySQL 5.6里面,我们可以把多个表放在多个库,这样就可以使用多线程复制。

  4. 基于GTID复制实现的工作原理
    主节点更新数据时,会在事务前产生GTID,一起记录到binlog日志中。
    从节点的I/O线程将变更的bin log,写入到本地的relay log中。
    SQL线程从relay log中获取GTID,然后对比本地binlog是否有记录(所以MySQL从节点必须要开启binary log)。如果有记录,说明该GTID的事务已经执行,从节点会忽略。
    如果没有记录,从节点就会从relay log中执行该GTID的事务,并记录到bin log。
    在解析过程中会判断是否有主键,如果没有就用二级索引,如果有就用全部扫描。

主从复制原理

MySQL主从复制涉及到三个线程,一个运行在主节点(log dump thread),其余两个(I/O thread, SQL thread)运行在从节点,如下图所示:

image

l 主节点 binary log dump 线程
当从节点连接主节点时,主节点会创建一个log dump 线程,用于发送bin-log的内容。在读取bin-log中的操作时,此线程会对主节点上的bin-log加锁,当读取完成,甚至在发动给从节点之前,锁会被释放。

l 从节点I/O线程
当从节点上执行start slave命令之后,从节点会创建一个I/O线程用来连接主节点,请求主库中更新的bin-log。I/O线程接收到主节点binlog dump 进程发来的更新之后,保存在本地relay-log中。

l 从节点SQL线程
SQL线程负责读取relay log中的内容,解析成具体的操作并执行,最终保证主从数据的一致性。

对于每一个主从连接,都需要三个进程来完成。当主节点有多个从节点时,主节点会为每一个当前连接的从节点建一个binary log dump 进程,而每个从节点都有自己的I/O进程,SQL进程。从节点用两个线程将从主库拉取更新和执行分成独立的任务,这样在执行同步数据任务的时候,不会降低读操作的性能。比如,如果从节点没有运行,此时I/O进程可以很快从主节点获取更新,尽管SQL进程还没有执行。如果在SQL进程执行之前从节点服务停止,至少I/O进程已经从主节点拉取到了最新的变更并且保存在本地relay日志中,当服务再次起来之后,就可以完成数据的同步。

要实施复制,首先必须打开Master 端的binary log(bin-log)功能,否则无法实现。
因为整个复制过程实际上就是Slave 从Master 端获取该日志然后再在自己身上完全顺序的执行日志中所记录的各种操作。如下图所示:

image

复制的基本过程如下:

  • 从节点上的I/O 进程连接主节点,并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容;

  • 主节点接收到来自从节点的I/O请求后,通过负责复制的I/O进程根据请求信息读取指定日志指定位置之后的日志信息,返回给从节点。返回信息中除了日志所包含的信息之外,还包括本次返回的信息的bin-log file 的以及bin-log position;从节点的I/O进程接收到内容后,将接收到的日志内容更新到本机的relay log中,并将读取到的binary log文件名和位置保存到master-info 文件中,以便在下一次读取的时候能够清楚的告诉Master“我需要从某个bin-log 的哪个位置开始往后的日志内容,请发给我”;

  • Slave 的 SQL线程检测到relay-log 中新增加了内容后,会将relay-log的内容解析成在祝节点上实际执行过的操作,并在本数据库中执行。

  • MySQL 主从复制模式

MySQL 主从复制默认是异步的模式。MySQL增删改操作会全部记录在binary log中,当slave节点连接master时,会主动从master处获取最新的bin log文件。并把bin log中的sql relay。
l 异步模式(mysql async-mode)
异步模式如下图所示,这种模式下,主节点不会主动push bin log到从节点,这样有可能导致failover的情况下,也许从节点没有即时地将最新的bin log同步到本地。

image

l 半同步模式(mysql semi-sync)
这种模式下主节点只需要接收到其中一台从节点的返回信息,就会commit;否则需要等待直到超时时间然后切换成异步模式再提交;这样做的目的可以使主从数据库的数据延迟缩小,可以提高数据安全性,确保了事务提交后,binlog至少传输到了一个从节点上,不能保证从节点将此事务更新到db中。性能上会有一定的降低,响应时间会变长。如下图所示:

image

半同步模式不是mysql内置的,从mysql 5.5开始集成,需要master 和slave 安装插件开启半同步模式。

l 全同步模式
全同步模式是指主节点和从节点全部执行了commit并确认才会向客户端返回成功。

你可能感兴趣的:(MySql 复制)